Visual category detection: an experimental perspective

Julkaisun otsikon käännös: Visuaalisten kategorioiden tunnistaminen: kokeellinen näkökulma

Ville Viitaniemi

  Tutkimustuotos: Doctoral ThesisCollection of Articles

  Abstrakti

  Nykyaika tuottaa jatkuvasti valtavia määriä visuaalista digitaalista aineistoa. Jotta näistä suurista tietoaineistoista voitaisiin automaattisesti löytää käyttökelpoista informaatiota, olisi löydettävä jonkinlainen vastaus tietokonenäön pitkäaikaiseen peruskysymykseen: kuinka saada tietokoneet ymmärtämään kuvien sisältöä? Tässä väitöskirjassa visuaalisen sisällön luonnehtimista tarkastellaan kategorioiden tunnistamisen näkökulmasta. Yleinen kuvan sisällön luonnehtimistehtävä pilkotaan lukuisiksi pieniksi kyllä-ei -päätöstehtäviksi. Kussakin yksittäisessä päätöstehtävässä vastataan kysymykseen, kuuluuko tarkasteltava kuva johonkin ennalta määrättyyn kategoriaan. Voitaisiin esimerkiksi määritellä, että sisätiloissa otetut kuvat muodostavat yhden kategorian. Kuvien sisältöä voidaan kuvailla halutulla yksityiskohtaisuustasolla määrittelemällä sopiva joukko kategorioita ja tunnistamalla kunkin kategorian kohdalla, mitkä kuvat siihen kuuluvat. Väitöskirjassa käsitellään mallia, jossa kategoriantunnistusjärjestelmä koostuu kolmesta pääosasta: piirreirrotuksesta, piirrekohtaisesta tunnistuksesta sekä näiden tunnistustulosten fuusiosta. Tekstin näkökulma on kokeellinen: tämän järjestelmäarkkitehtuurin toimivuus perustellaan hyvillä suorituskykyarvoilla, joita siihen perustuvat järjestelmät ovat saavuttaneet erilaisissa visuaalisen analyysin suorituskykyä mittaavissa tehtävissä. Väitöskirjassa kuvataan lukuisia kokeita, joissa arvioidaan eri tekniikoita järjestelmän kolmen pääkomponentin toteuttamiseksi. Toteutustekniikoiden vertailemisen lisäksi kokeet myös osoittavat, että esitetty yleiskäyttöinen kategoriantunnistusmalli on hyvin joustava: joukko erilaisia visuaalisia analyysitehtäviä on voitu ratkaista järjestelmällä, jonka ydinosan kaikissa tapauksissa muodostaa sama kategoriantunnistinkomponentti. Eri tehtäviä varten ydin on ympäröity tehtäväkohtaisilla sovitinosilla. Väitöskirjassa esitettyjen kokeiden ja analyysien perusteella voidaan päätellä, että kategorioiden tunnistaminen on käyttökelpoinen tapa lähestyä yleistä kuvien sisällön tulkitsemistehtävää. Voidaan myös todeta, että esitetyllä piirrefuusiota hyödyntävällä järjestelmäarkkitehtuurilla ja esitetyillä järjestelmän osien toteutustekniikoilla saavutetaan tämänhetkinen huipputaso kategoriantunnistuksessa.
  Julkaisun otsikon käännösVisuaalisten kategorioiden tunnistaminen: kokeellinen näkökulma
  AlkuperäiskieliEnglanti
  PätevyysTohtorintutkinto
  Myöntävä instituutio
  • Aalto-yliopisto
  Valvoja/neuvonantaja
  • Oja, Erkki, Vastuuprofessori
  • Laaksonen, Jorma, Ohjaaja
  Kustantaja
  Painoksen ISBN978-952-60-4585-6
  Sähköinen ISBN978-952-60-4586-3
  TilaJulkaistu - 2012
  OKM-julkaisutyyppiG5 Tohtorinväitöskirja (artikkeli)

  Tutkimusalat

  • konenäkö
  • kuva-analyysi
  • visuaalinen kategoria
  • piirrefuusio
  • paikallinen kuvapiirre

  Sormenjälki

  Sukella tutkimusaiheisiin 'Visuaalisten kategorioiden tunnistaminen: kokeellinen näkökulma'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

  Siteeraa tätä