Aihemallinnus sekä muut ohjaamattomat koneoppimismenetelmät yhteiskuntatieteellisessä tutkimuksessa: kriittisiä havaintoja

Tutkimustuotos: Lehtiartikkelivertaisarvioitu

Tutkijat

Organisaatiot

  • University of Helsinki

Kuvaus

Aihemallinnus mahdollistaa laajojen tekstiaineistojen automaattisen ryhmittelyn
käyttämällä ohjaamatonta koneoppimista. Kiinnostus aihemallinnusta kohtaan on kasvanut ja sen soveltaminen on lisääntynyt yhteiskuntatieteellisessä tutkimuksessa. Aihemallinnus sekä muut ohjaamattoman koneoppimisen menetelmät kuitenkin vaativat tutkijoita tekemään valintoja: tutkijat joutuvat esimerkiksi päättämään mitä koneoppimismenetelmää käytetään, miten sitä käytetään ja miten aineistoa esikäsitellään, Lisäksi on kyettävä tulkitsemaan
ohjaamattoman koneoppimisen kautta syntyneet tulokset. Aihemallinnuksessa
eräs valinta koskee aiheiden määrää, josta on käyty aktiivisesti keskustelua niin koneoppimisen kuin laskennallisen yhteiskuntatieteen yhteisöissä. Artikkelin esittelemä käyttäjäkoe osoittaa, että yhteiskuntatieteissä suosittu, tulkinnallisuutta korostava lähestymistapa aihemäärän valintaan on epävarma. Artikkelin empiirinen esimerkki osoittaa, että aihemäärän valinta vaikuttaa aihemallinnuksesta syntyviin tulkintoihin. Tämän pohjalta artikkeli suosittaa, että (i) parametrien valinnassa käytettäisiin tilastollisia menetelmiä. Lisäksi suositellaan, että (ii) aihemallinnuksen tulokset sidotaan yhteiskuntatieteelliseen
kirjallisuuteen käyttämällä teoreettista viitekehystä tulkinnan apuna tai aihemallinnusta käytetään joko menetelmällisesti trianguloiden tai grounded theory -lähtöisesti. Lisäksi artikkelissa suositellaan, että (iii) tutkimusprosessin
avoimuuteen kiinnitetään huomiota sekä (iv) laskennallisten menetelmien soveltajat seuraavat kriittisen algoritmitutkimuksen kehitystä.

Yksityiskohdat

AlkuperäiskieliEnglanti
Sivut6-33
JulkaisuPolitiikka
Vuosikerta61
Numero1
TilaJulkaistu - 2019
OKM-julkaisutyyppiA1 Julkaistu artikkeli, soviteltu

Lataa tilasto

Ei tietoja saatavilla

ID: 32944265