Näillä vinkeillä otat tekoälyn onnistuneesti käyttöön

24.10.2024

Into ja Länsi- ja Sisä-Suomen aluehallintoviraston tietotiimi kehittivät tiedontuotantoa Sitra Lab 6 -ohjelmassa Datalla parempia palveluita. Kokeiluhankkeemme nimi oli Tunne tilastot – syrjäytä syrjäytyminen. Kokeilun myötä tuotamme tekoälyn avulla entistä kattavammin tietoa etsivästä nuorisotyöstä ja työpajatoiminnasta. Into julkaisee kokeiluhankkeesta neliosaisen blogisarjan. Tässä neljännessä osassa kuvaamme, miten tekoälyä käytännössä käytetään.

Haimme mukaan kokeiluun, koska halusimme edistää tiedolla johtamista ja tuottaa niin poliittiseen kuin viranomaisten päätöksentekoon oikea-aikaista ja validia tietoa. Näin ymmärrys etsivästä nuorisotyöstä ja työpajatoiminnasta vahvistuisi ja nuorten palvelut olisivat riittäviä sekä määrällisesti että laadullisesti.

Toteuttamassamme laadullisessa analyysissa hyödynsimme tekoälysovellusta Chat GPT 4.o. Halusimme testata, miten voimme käyttää helposti saavutettavaa ja edullista kielimallia avointen vastausten analysointiin.

Blogisarjan edellisissä osissa kuvattiin, mitä kokeilussa teimme ja millaisia tuloksia nousi esiin käytössä olleesta valtakunnallisesta aineistosta. Tässä viimeisessä osassa jaamme oivalluksiamme tekoälyperusteisesta analyysistä ja kannustamme tekoälyn hyödyntämiseen omassa työssä.

Kielimalli apuna tiedon analysoinnissa

Kokemuksemme mukaan tekoälysovelluksista kannattaa hankkia maksullinen versio Chat GPT 4.o tai uudempi sovellus. Sen kuukausikustannus on 20 dollaria eli summa on varsin maltillinen.

Toki maksuttomallakin versiolla pärjää, mutta sen käytössä on omat rajoituksensa. Maksuttomaan versioon ei voi syöttää liitteitä ja suuren tekstimassan viemisessä tekstikenttään on siinäkin rajoituksensa. Maksullisen version ns. syöttörajoitus on noin 6000 sanaa, kun maksuttomassa vastaava määrä on 3000 sanaa. Joissain maksullisissa versioissa on mahdollista nostaa syötettä jopa 24 000 sanaan.

Maksullinen versio pystyy siis käsittelemään enemmän tietoa ja toteuttamaan monimutkaisempia tehtäviä. Ja sen avulla on mahdollista saada pidempiä ja syvällisempiä vastauksia kuin maksuttomassa. Lisäksi maksuttoman version käyttö voi olla rajoitettua vilkkaiden käyttöaikojen aikana, jolloin palvelu saattaa hidastua.

Asetukset kohdilleen

Kun kielimallia otetaan käyttöön ja hyödynnetään omien tietojen analysoinnissa, on muistettava muutama seikka. Ensimmäinen on käydä sovelluksen asetuksissa kieltämässä, ettei dataa käytetä kielimallin opetustarkoituksiin. Samalla asetuksissa kannattaa käydä yksilöimässä kielimallin toimintaa ja kertoa omasta ”tone of voicesta”, jolloin kielimalli vastaa paremmin toivottua kirjoitustapaa.

Chat GPT itsessään ei opi eikä muista, paitsi keskusteluikkuna kerrallaan. Kannattaa siis käydä samaan teemaan liittyvät keskustelut samassa ikkunassa, sillä Chat GPT muistaa sille antamasi ohjeet ja liitteet.

Tämä toiminto on erinomainen esimerkiksi silloin, kun kääntää substanssitekstejä toiselle kielelle. Ensimmäinen versio käännöksestä ei välttämättä käytä oikeaa termistöä, mutta kielimallille voi kertoa, mitä termejä halutaan käytettävän missäkin yhteydessä. Toki jos keskustelu on hyvin pitkä, voi joutua toistamaan ohjeita tai liittämään liitteitä uusiksi.

Kun tekoälylle syötetään liitteitä tai tekstiä, on materiaalin anonymiteetti oleellista. Tämä kannattaa varmistaa, vaikka tiedon käyttö opetustarkoituksiin olisikin kielletty. Vältä kaikkia materiaaleja, joissa on tunnistettavissa henkilöitä tai niissä on arkaluonteista tietoa. Tarvittaessa keskusteluja voi myös poistaa.

Promptaus jiiriin

Kun kirjoitetaan käskyä kielimallille, kannattaa muistaa seuraavat asiat. Eli promptia kirjoittaessa:

Ole selkeä ja ytimekäs: Määrittele tarkasti, mitä haluat saada aikaan. Käytä selkeitä lauseita.
Anna yksityiskohtia: Haluamasi tyyli, sävy, pituus tai aihealue.
Käytä kysymyksiä: Muotoile kysymykset niin, että vastaukset pysyvät selkeinä ja olennaisiin asioihin keskittyvinä.
Rajoita tarpeetonta: Pyydä vain sitä, mitä oikeasti tarvitset. Älä sisällytä liikaa yksityiskohtia, jotka eivät ole tehtävän kannalta olennaisia.

Ensimmäisellä vastauskerralla ei välttämättä saa hyvää vastausta, sillä promptaaminen pitää opetella. Mutta koska kyse on kielimallista, voi keskustelua jatkaa ja tarkentaa. Näin päästään kohti parempaa ja halutumpaa vastausta.

GPTn kieltäminen on usein turhaa (”älä tee, ei saa”). Kielimalli ei juurikaan ymmärrä sitä eikä siksi toimi annettujen ohjeiden mukaisesti. Tällaisessa tapauksessa kannattaa miettiä, miten kirjoittaa sama asia ilman kieltämistä.

Pilko materiaali ja tarkista tulos

Chat GPT on laiska, maksuton versio vielä hieman laiskempi kuin maksullinen. Kielimalli jää mielellään toistamaan samoja vastauksia ja poimii samoja esimerkkejä, jos aineisto on suuri. Tämä johtuu siitä, että se käy vain tietyn verran materiaalia läpi ja lopettaa sitten analysoinnin.

Laajojen aineistojen kohdalla kannattaakin miettiä, miten pilkkoa materiaali, jotta aineisto saadaan käsiteltyä. Omaan kokemukseemme pohjaten suosittelemme aineiston pilkkomista loogisiin yksikköihin (esimerkiksi vuosiin, kuukausiin, yksiköihin, palveluihin, alueisiin jne.), joista taas rakentuu kokonaisuus, kun yhdistellään kielimallin antamia vastauksia. Esimerkiksi Excel-tiedostoissa kannattaa tehdä erillisiä alasivuja, joille siirtää analysoitavia kokonaisuuksia. Tai kertoa suoraan kielimallille, mistä sarakkeesta haluaa tietoja analysoitavan.

Sen lisäksi, että kielimallilla saa kirjallisia vastauksia, voi sitä pyytää myös tekemään numerotiedosta erilaisia graafeja, diagrammeja tai piirakoita. Kuten aina, käskyn yksityiskohtaisuus on tärkeää: minkä tyyppinen graafi ja mitä dataa halutaan visualisoida?

Vastauksiin ei kuitenkaan kannata luottaa sokeasti. Vaikka tekoäly on hyvä käsittelemään dataa, voi se tuottaa outoja vastauksia ja virheitä. Tarkista ja varmista, että tiedot vastaavat haluttuja tavoitteita ja että dataa on tulkittu oikein. Lisäksi tarkistaminen auttaa havaitsemaan, jos jokin yksityiskohta on jäänyt huomaamatta.

Mihin sinä voisit hyödyntää tekoälyä?

Chat GPT -kielimallilla voi siis tuottaa tekstiä, graafeja ja kuvia omasta tietovarannosta suhteellisen vaivattomasti. Syötä sisään vaikkapa kolmen vuoden numeraaliset tiedot valmentautujista ja katso, millaisen kuvan tekoäly niistä tuottaa. Tai pyydä kielimallia analysoimaan teidän omat Sovari-avovastauksenne.

Kielimallilla pystyy myös tuottamaan erilaisia tekstejä kuten blogeja, raportteja, mielipidekirjoituksia, markkinointitekstejä, verkkosivun sisältöä ja somepostauksia. Aivan vielä tekstin taso ei yllä ihmiskirjoittajan tasolle ja koneellisuus paistaa läpi. Mutta ideoita tekoälyltä saa liukuhihnalta!

Tarja-Liisa Riipinen

Blogisarjan edellisissä osissa käsiteltiin kokeilun puitteissa tehdyn analyysin tuloksia: etsivän nuorisotyön ja työpajatoiminnan koettuja onnistumisia ja haasteita sekä kuvattiin yhteisen hankkeen tavoitteita ja käytännön työtä.

Lisätietoa Sitra Labista löydät täältä
Nuorisotilastot.fi-sivuston löydät täältä
Edellinen blogimme aiheesta taas on täällä

Blogi