Abstrakti
Tässä väitöskirjassa mallinnetaan aineistolähteisesti luonnollisia kuvia ja tekstiä sekä tarkastellaan niistä löydettyjä esitystapoja. Ympäristöstä tulevat ärsykkeet ohjaavat kognitiivista kehitystä ja aivojen toimintaa. Aineistolähtöiset laskennalliset menetelmät tarjoavat vastaavasti joustavan tavan löytää erilaisia eksploratiivisia näkökulmia.
Riippumattomien komponenttien analyysi (ICA) on ansioitunut ohjaamaton tilastollinen menetelmä erityisesti hermostollisten vasteiden käsittelyssä. Se pystyy erottamaan kognitiivisesti olennaiset lähteet näennäisesti sekoittuneista signaaleista tilastollisen riippumattomuusoletuksen avulla. Tämä konsepti liittyy läheisesti harvakoodaukseen, joka on neurobiologisesti tehokas ja edustaa näkemystä aistitiedon käsittelystä aivoissa.
Työssä sovelletaan myös toista tilastollista käsitettä, temporaalista koherenssia, videoanalyysissä ja verrataan sitä ICA-menetelmään. Löydetyt esitykset mallintavat samoja ominaisuuksia kuin primäärin näköaivokuoren yksittäissolut. Työssä esitetään yhteismalli, joka yhdistää harvuuden, temporaalisen koherenssin ja topologisen järjestymisen.
Samanlaisia menetelmällisiä työkaluja sovelletaan myös luonnollisen kielen mallintamiseen. Työssä käytetään pelkistettyä esikäsittelyä kieliriippumattomien menetelmien aikaansaamiseksi. Sanojen merkityksiä mallinnetaan kontekstuaalisten yhteisesiintymien avulla isosta korpuksesta vektoriavaruusmalleilla. ICA-menetelmällä paljastetaan alla oleva harva rakenne ja tehdään esityksistä helpommin tulkittavia verrattuna klassisiin menetelmiin, jotka perustuvat toisen asteen tilastollisiin ominaisuuksiin. Kokeelliset tulokset vahvistavat käytettyjen ohjaamattomien menetelmien toimivuuden ja osoittavat, että aineiston parametrisoinnilla on merkittävä vaikutus löydettyihin esityksiin. Työssä kehitetyillä analyysimenetelmillä havaitaan löydettyjen piirteiden vastaavan eri tasoilla olevia perinteisiä syntaktisia ja semanttisia kategorioita sekä sanojen välisiä suhteita. Tulokset laajenevat myös monikieliseen aineistoon ja löydettyjen sanaesitysten lisääntynyt harvuus vahvistetaan epälineaarisella kynnystyksellä. Työn tuloksia voidaan käyttää rakentamaan distributionaalisia malleja luonnollisen kielen käsittelyn tehtävissä, joissa tulkittavuus on toivottu ominaisuus.
| Julkaisun otsikon käännös | Esitysten kehkeytyminen luonnollisesta datasta |
|---|---|
| Alkuperäiskieli | Englanti |
| Pätevyys | Tohtorintutkinto |
| Myöntävä instituutio |
|
| Ohjaaja |
|
| Kustantaja | |
| Painoksen ISBN | 978-952-60-7583-9 |
| Sähköinen ISBN | 978-952-60-7582-2 |
| Tila | Julkaistu - 2017 |
| OKM-julkaisutyyppi | G5 Artikkeliväitöskirja |
Tutkimusalat
- leksikaalinen semantiikka
- näkö
- kieli
- merkitys
- laskennallinen mallintaminen
- vektoriavaruusmalli
- ohjaamaton oppiminen
- kieliriippumattomuus
- koneoppiminen
Sormenjälki
Sukella tutkimusaiheisiin 'Esitysten kehkeytyminen luonnollisesta datasta'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.Siteeraa tätä
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver