Abstrakti
Luonnossa esiintyy ei-monotonisia riippuvuuksia sisältäviä monimuuttujasysteemeitä. Neuro- ja taloustieteissä ilmenee esimerkkejä tällaisista systeemeistä, joissa useampi prosessi eli muuttujien yhdistelmä tapahtuu samanaikaisesti, mutta ei välttämättä lineaarisesti tai monotonisesti. Tämänkaltaissa systeemeissä esiintyviä ei-monotonisia riippuvuuksia voidaan mitata ydinfunktioilla laajennetulla kanonisella korrelaatiolla ja Hilbert-Schmidt riippumattomuuskriteerillä. Nämä mitat kertovat kuitenkin vain, jos riippuvuus esiintyy systeemissä, mutta niiden arvot eivät sellaisenaan riitä kuvaamaan, mitkä prosessit eli muuttujat ovat riippuvaisia toisistaan.
Tässä väitöskirjassa tarkastellaan ydinfunktiolla laajennetun kanonisen korrelaation ja Hilbert-Schmidt riippumattomuuskriteerin tulkintaa. Aluksi tutkimme, miten ydinfunktiolla laajennettua kanonista korrelaatiota on aiemmin kirjallisuudessa tulkittu. Tämän jälkeen kehitämme kirjallisuuden menetelmää hierarkisella klusteroinnilla. Sitten esitämme uuden vuorottaisiin projisoituihin gradientteihin perustuvan menetelmän eli gradKCCA:n, joka laskee sekä ydinfunktiolla laajennetun kanonisen korrelaation arvon ja muutujien väliset riippuvuudet. Lopuksi esitämme uuden vuorottaisiin stokastisiin projisoituihin gradientteihin perustuvan algoritmin nimeltä SCCA-HSIC, johon voidaan myös yhdistää Nyström approksimaatio. SCCA-HSIC optimoi Hilbert-Schmidt riippumattomuuskriteeriä suhteessa muuttujien välisiin riippuvuuksiin.
Ensimmäisessä julkaisussa poimimme kirjallisuudesta korrelaatioihin perustuvan menetelmän ydinfunktiolla laajennetun kanonisen korrelaation tulkitsemiseksi. Toisessa julkaisussa esitämme klustergram-visualisoinnin, joka on yhtenäinen kuva kirjallisuuden korrelaatio-menetelmän arvoista. Klustergrammia sovellettiin syvän peruskallion pohjavesistöstä kerätyn datan analyysissä. Kolmannessa julkaisussa näytetään, että gradKCCA on nopeampi, skaalautuvampi ja tarkempi menetelmä riippuvuuksien määrittelyssä verrattuna viimeisimpiin menetelmiin. Kokeissa käytetään simuloituja ja aitoja datajoukkoja. Neljännessä julkaisussa näytetään, että SCCA-HSIC on tarkempi ja skaalautuvampi menetelmä kuin viimeisimmät menetelmät, kun arvioimme sitä simuloiduilla ja aidoilla datajoukoilla.
Esitetyt menetelmät ja algoritmit parantavat mahdollisten ei-monotonisten riippuvuuksien tulkintaa. Ne ovat helppokäyttöisiä ja sopivat niille, jotka haluaisivat ymmärtää jonkin monimuuttujasysteemin toiminnan. Menetelmiä voi myös soveltaa laajemmin muihinkin ydinfunktioihin perustuviin riippuvuusmittoihin.
Julkaisun otsikon käännös | Menetelmiä ydinfunktioilla laajennettujen riippuvuusmittojen tulkintaan |
---|---|
Alkuperäiskieli | Englanti |
Pätevyys | Tohtorintutkinto |
Myöntävä instituutio |
|
Valvoja/neuvonantaja |
|
Kustantaja | |
Painoksen ISBN | 978-952-60-8963-8 |
Sähköinen ISBN | 978-952-60-8964-5 |
Tila | Julkaistu - 2020 |
OKM-julkaisutyyppi | G5 Artikkeliväitöskirja |
Tutkimusalat
- kanoninen korrelaatio
- ydinfunktiomenetelmät
- skaalautuvuus
- harvuus