<?xml version="1.0" encoding="UTF-8"?>
<mods xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/mods/v3" version="3.8" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-8.xsd">
  <titleInfo>
    <title>Visuelle Aufmerksamkeitsmodelle basierend auf neuronalen Netzwerken</title>
    <subTitle> = Neural nezwork based visual attention models</subTitle>
  </titleInfo>
  <titleInfo type="translated">
    <title>Neural nezwork based visual attention models</title>
  </titleInfo>
  <name type="personal" usage="primary">
    <namePart>Michael, Johannes</namePart>
    <role>
      <roleTerm type="text">VerfasserIn</roleTerm>
    </role>
    <role>
      <roleTerm authority="marcrelator" type="code">aut</roleTerm>
    </role>
  </name>
  <name type="personal">
    <namePart>Grüning, Tobias</namePart>
    <role>
      <roleTerm type="text">AkademischeR BetreuerIn</roleTerm>
    </role>
    <role>
      <roleTerm authority="marcrelator" type="code">dgs</roleTerm>
    </role>
  </name>
  <name type="personal">
    <namePart>Labahn, Roger</namePart>
    <namePart type="date">1959-</namePart>
    <role>
      <roleTerm type="text">AkademischeR BetreuerIn</roleTerm>
    </role>
    <role>
      <roleTerm authority="marcrelator" type="code">dgs</roleTerm>
    </role>
  </name>
  <name type="corporate">
    <namePart>Universität Rostock</namePart>
    <role>
      <roleTerm type="text">Grad-verleihende Institution</roleTerm>
    </role>
    <role>
      <roleTerm authority="marcrelator" type="code">dgg</roleTerm>
    </role>
  </name>
  <name type="corporate">
    <namePart>Universität Rostock</namePart>
    <namePart>Mathematisch-Naturwissenschaftliche Fakultät</namePart>
    <role>
      <roleTerm type="text">Grad-verleihende Institution</roleTerm>
    </role>
    <role>
      <roleTerm authority="marcrelator" type="code">dgg</roleTerm>
    </role>
  </name>
  <typeOfResource>text</typeOfResource>
  <genre authority="marcgt">theses</genre>
  <genre authority="rdacontent">Text</genre>
  <genre authority="gnd-content">Hochschulschrift</genre>
  <originInfo>
    <place>
      <placeTerm type="code" authority="marccountry">gw</placeTerm>
    </place>
    <dateIssued encoding="marc">2016</dateIssued>
    <issuance>monographic</issuance>
    <place>
      <placeTerm type="code" authority="iso3166">XA-DE</placeTerm>
    </place>
  </originInfo>
  <originInfo eventType="publication">
    <place>
      <placeTerm type="text">Rostock</placeTerm>
    </place>
    <agent>
      <namePart>Universität</namePart>
      <role>
        <roleTerm>publisher</roleTerm>
      </role>
    </agent>
    <dateIssued>2016</dateIssued>
  </originInfo>
  <originInfo eventType="distribution">
    <place>
      <placeTerm type="text">Rostock</placeTerm>
    </place>
    <agent>
      <namePart>Universitätsbibliothek</namePart>
      <role>
        <roleTerm>distributor</roleTerm>
      </role>
    </agent>
  </originInfo>
  <language>
    <languageTerm authority="iso639-2b" type="code">ger</languageTerm>
  </language>
  <physicalDescription>
    <form authority="marccategory">electronic resource</form>
    <form authority="marcsmd">remote</form>
    <form type="media" authority="rdamedia">Computermedien</form>
    <form type="carrier" authority="rdacarrier">Online-Ressource</form>
    <extent>Online-Ressource</extent>
  </physicalDescription>
  <abstract type="Summary">Ziel dieser Arbeit war es, eine Architektur aufzubauen, welche sowohl die Lokalisierung als auch die Erkennung von Objekten in Bildern ermöglicht und dabei effizient skaliert. Inspiriert durch die Art und Weise der menschlichen Wahrnehmung, wird ein Modell konzipiert, welches mittels Aufmerksamkeit selektiv Bildregionen fokussiert und diese sequentiell verarbeitet. Konzepte aus dem überwachten und bestärkenden Lernen werden kombiniert, um ein globales Training des Modells zu ermöglichen. Die Arbeit endet mit Experimenten zum Klassifizieren von Ziffern und Lokalisieren von KFZ-Kennzeichen.&lt;ger&gt;</abstract>
  <abstract type="Summary">The goal of this thesis was to create an architecture, which is able to both localize and recognize objects in a scene, while simultaneously scaling efficiently. Inspired by the way of the human perception, a model is designed to selectively focus its attention on different regions in an image and process them sequentially. By combining concepts from supervised and reinforcement learning, a method is created, which enables the architecture to be trained globally. The thesis ends with experiments on digit classification and license plate localisation.&lt;eng&gt;</abstract>
  <note type="statement of responsibility">Johannes Michael</note>
  <note type="thesis">Masterarbeit Universität Rostock 2018</note>
  <classification authority="ddc">510</classification>
  <location>
    <url displayLabel="Volltext" usage="primary display" note="kostenfrei">http://purl.uni-rostock.de/rosdok/id00002317</url>
  </location>
  <identifier type="urn">urn:nbn:de:gbv:28-thesis2018-0004-9</identifier>
  <identifier type="doi">10.18453/rosdok_id00002317</identifier>
  <identifier type="oclc">1076493378</identifier>
  <recordInfo>
    <descriptionStandard>rda</descriptionStandard>
    <recordContentSource authority="marcorg">DE-627</recordContentSource>
    <recordCreationDate encoding="marc">181018</recordCreationDate>
    <recordIdentifier source="DE-627">1033561762</recordIdentifier>
    <recordChangeDate encoding="iso8601">20251224T213022.0</recordChangeDate>
    <recordOrigin>Converted from MARCXML to MODS version 3.8 using MARC21slim2MODS3-8_XSLT1-0.xsl
				(Revision 1.174 20250328)</recordOrigin>
    <languageOfCataloging>
      <languageTerm authority="iso639-2b" type="code">ger</languageTerm>
    </languageOfCataloging>
  </recordInfo>
</mods>
