Exploring correlated data: confidence bands and projections of shared variation

Tutkimustuotos

Tutkijat

  • Jussi Korpela

Organisaatiot

Kuvaus

Automaattisen tietojenkeruun ja -käsittelyn yleistyessä mahdollisuudet dataan perustuvaan päätöksentekoon paranevat jatkuvasti. Tämä suuntaus myös ruokkii tarvetta uusien tutkivien data-analyysimenetelmien kehittämiseen. Tässä väitöskirjassa käsitellään kahta tällaista menetelmää: moniulotteisia luottamusvälejä sekä datamatriisien välisen yhteisen vaihtelun etsintää. Työn ensimmäisessä osassa esitämme visuaalisen menetelmän vektoriarvoisen datan vaihtelun kuvaamiseen. Vaihtelu visualisoidaan kaksiulotteisena luottamusnauhana, joka tulkinnaltaan vastaa yksiulotteisen datan luottamusväliä. Tavoitteena on, että nauha peittää ennalta määrätyn osuuden vektoreiden jakaumasta, jolloin nauhaa voi käyttää havainnollistamaan vektorijakauman tyypillisiä arvoja. Työssä esitetään uusia menetelmiä luottamusnauhojen laskemiseksi sekä käydään läpi aiempaa tarkemmin kirjallisuudessa jo esitettyjen menetelmien teknisiä toteutuksia. Lisäksi ehdotetaan menettelyä, jolla nauhan peitto saadaan halutun suuruiseksi myös äärellisillä havaintomäärillä. Työn toisessa osassa etsitään jaettua vaihtelua samaan kokoelmaan kuuluvista datamatriiseista. Sovelluskohteena ovat samaa prosessia eri näkökulmista kuvaavat datamatriisikokoelmat, joiden jaettu vaihtelu antaa epäsuorasti tietoa taustalla vaikuttavasta prosessista. Menetelmä löytää ne ajanjaksot, joilla datamatriiseissa tapahtuu yhtäaikaista vaihtelua. Ongelman ratkaisuksi ehdotetaan tavanomaisiin regressiofunktioihin perustuvaa suodatusmenettelyä, joka suodattaa pois kaiken sellaisen vaihtelun, joka ei ole kaikille datamatriiseille yhteistä. Menetelmän etuja ovat helppo toteutettavuus sekä muokattavuus – regressiofunktiota vaihtamalla voidaan kätevästi muuttaa jaetun vaihtelun määritelmää kulloiseenkin tilanteeseen sopivaksi. Luottamusnauhoille on käyttöä erityisesti aikasarjojen sekä muun vektoriarvoisen datan vaihtelun kuvaamisessa. Tyypillinen esimerkki ovat aikasarjamallien tuottamat ennusteet, joiden epävarmuus havainnollistetaan usein käyttäen luottamusnauhoja. Datamatriisien välistä jaettua vaihtelua puolestaan tutkitaan usein biosignaalien analyysin yhteydessä, esimerkiksi selvitettäessä sitä, mitkä aktivaatiot ovat tai eivät ole jollekin koehenkilöryhmälle yhteisiä.

Yksityiskohdat

AlkuperäiskieliEnglanti
PätevyysTohtorintutkinto
Myöntävä instituutio
Valvoja/neuvonantaja
Kustantaja
  • Aalto University
Painoksen ISBN978-952-60-7854-0
Sähköinen ISBN978-952-60-7855-7
TilaJulkaistu - 2018
OKM-julkaisutyyppiG5 Tohtorinväitöskirja (artikkeli)

    Tutkimusalat

  • aikasarja, luottamusnauha, luottamusväli, visualisointi, jaettu vaihtelu, regressio

ID: 18540984