Tekoälyyn liittyvät käsitteet

Tekoälyn ymmärtäminen vaatii keskeisten termien ja periaatteiden tuntemusta. Tämä käsitelista kokoaa yhteen tärkeimmät tekoälyyn ja sen sovelluksiin liittyvät käsitteet aakkosjärjestyksessä.

Tekoälyyn liittyvät käsitteet

Tekoälyn maailmaan sukeltaminen alkaa peruskäsitteiden ymmärtämisestä. Tämä lista esittelee tärkeimmät termit ja periaatteet, jotka avaavat tekoälytekniikoiden toimintaa ja mahdollisuuksia.

Käsitelista

Käsitelista on suunniteltu tukemaan oppimista kokoamalla tärkeimmät tekoälyyn ja sen sovelluksiin liittyvät käsitteet aakkosjärjestyksessä.

Algoritmi on selkeä ja vaiheittainen ohje tai sääntöjoukko, jonka avulla tietokone suorittaa tietyn tehtävän tai ratkaisee ongelman. Tekoälyssä algoritmeja käytetään opettamaan tietokoneille, miten käsitellä dataa, tehdä ennusteita tai päätöksiä sekä oppia kokemuksista. Ne toimivat ikään kuin reseptinä, joka ohjaa tekoälyjärjestelmää esimerkiksi tunnistamaan kuvia ja analysoimaan dataa. (Niittymaa 2023.)

Big data viittaa suuriin määriin tietoa, joka on liian monimutkaista ja laajaa käsiteltäväksi tai analysoitavaksi perinteisillä data-analyysityökaluilla ja -menetelmillä. Big dataa syntyy jatkuvasti päivittaisessä elämässä, ja sen määrä on valtava. Tieto voi olla peräisin monista erilaisista lähteistä, kuten sensoreista, sosiaalisen median alustoilta sekä internetiin yhdistetyistä laitteista, jotka keräävät ja tuottavat dataa digitaalisessa muodossa. (Kolari & Kallio 2023.)

Tekoälytyyppi, joka luo uutta sisältöä, kuten tekstiä, kuvia tai musiikkia annettujen ohjeiden (promptien) perusteella. Esimerkkejä ovat tekstinluontityökalut (esim. ChatGPT) ja kuvageneraattorit (esim. DALL-E). (McKinsey & Company 2024.)

Neuroverkkorakenne, jossa on kaksi verkkoa (generaattori ja diskriminaattori) kilpailevat keskenään parantaakseen tulosten laatua. Generaattori yrittää luoda realistista sisältöä (esim. kuvia), ja diskriminaattori arvioi, onko sisältö aitoa vai keinotekoista. Tämän kilpailun kautta GANit pystyvät tuottamaan hyvin realistisia kuvia, videoita ja muita mediasisältöjä. GANeja käytetään erityisesti luovissa ja visuaalisissa sovelluksissa. (Schulze 2024.)

Tilanne, jossa tekoälymalli tuottaa sisältöä, joka ei perustu todellisiin tietoihin tai on virheellistä. Hallusinaatio voi johtua siitä, että malli “arvaa” puuttuvia tietoja tai yhdistää tietoa epäloogisella tavalla. Tämä on erityinen haaste esimerkiksi faktapohjaisissa sovelluksissa, joissa tietojen paikkansapitävyys on tärkeää. (Keary 2024.)

Tekoälyprosessi, jossa ihminen osallistuu päätöksentekoon tai tulosten tarkistamiseen. Tämä on erityisen tärkeää eettisissä ja kriittisissä sovelluksissa. (Dahlberg & Laaksonen 2023)

Hienosäätö on prosessi, jossa esikoulutettua perusmallia muokataan tai optimoidaan toimimaan tehokkaammin tietyissä tehtävissä. Tämä saavutetaan usein hyödyntämällä pienempiä, merkittyjä tietojoukkoja, jotka auttavat mallia oppimaan ja sopeutumaan tiettyyn terminologiaan, vivahteisiin ja malleihin. (Niittymaa 2023.)

Tekoälyn alahaara, jossa kone oppii käsittelemänsä datan perusteella ja kehittää itsenäisesti suoritustaan ilman suoraa ohjelmointia. Koneoppiminen hyödyntää tilastollisia malleja ja algoritmeja, joilla tunnistetaan datasta malleja ja tehdään ennusteita. (McKinsey & Company 2024.)

Tekoäly- ja koneoppimismallien kehittämisessä käytettävä tietoaineisto, jonka avulla malli oppii tunnistamaan kaavoja ja tekemään ennusteita. Koulutusdata sisältää esimerkkejä, joista malli oppii liittämään syötteitä haluttuihin tuloksiin. Laadukas ja monipuolinen koulutusdata on ratkaisevan tärkeää mallin tarkkuuden ja luotettavuuden varmistamiseksi. (Suomalainen Tiedeakatemia 2024.)

NLP on tekoälyn ja tietojenkäsittelytieteen osa-alue, joka keskittyy ihmiskielen käsittelyyn ja ymmärtämiseen. NLP yhdistää laskennallisen kielitieteen, tilastolliset mallit, koneoppimisen ja syväoppimisen mahdollistamaan tietokoneiden kyvyn tunnistaa, ymmärtää ja tuottaa tekstiä ja puhetta. (IBM 2024.)

Malli on ohjelmallinen rakenne tai “ohjelma”, joka on opetettu tietyn algoritmin avulla tunnistmaan kuvioita ja tekemään ennusteita tai päätöksiä uuden datan pohjalta. Malli muodostuu, kun algoritmi käy läpi suuria määriä esimerkkidataa ja oppii löytämään merkityksellisiä yhteyksiä ja sääntöjä datasta. Esimerkiksi kuvantunnistuksessa malli voi oppia erottamaan kissat ja koirista näkemällä tuhansia esimerkkikuvia molemmista. (IBM s.a.)

Tekoälyn malli, joka on inspiroitu ihmisaivojen tavasta käsitellä tietoa. Neuroverkko koostuu kerroksista, joissa on yksittäisiä “solmuja” eli keinotekoisia neuroneita, jotka välittävät tietoa toisilleen. Neuroverkko oppii tunnistamaan kaavoja datasta, kuten kuvioita kuvissa tai merkityksia tekstissä. Niitä käytetään monenlaisiin tehtäviin, kuten kuvantunnistukseen ja puheenymmärtämiseen. (Numminen 2023.)

Parametrit ovat mallin sisäisiä muuttujia, jotka säätelevät mallin toimintoja ja vaikuttavat sen tekemiin ennusteisiin tai päätöksiin. Ne ovat ikään kuin säätöjä, joiden arvoja hienosäädetään algoritmin oppimisprosessin aikana. Esimerkiksi neuroverkossa parametrit voivat tarkoittaa yhteyksien painoja ja siirtymäkertoimia, jotka vaikuttavat siihen, kuinka vahvasti jokainen neuronien välinen yhteys vaikuttaa lopputulokseen. (Our World in Data 2024) Suuret kielimallit (esim. GPT-4) käyttävät miljardeja parametreja tehdäkseen ennusteita seuraavista sanoista lauseessa (Howarth 2024).

Prosessi, jossa optimoidaan annettu prompti, jotta saadaan parempia ja tarkempia tulokisa tekoälymallilta. Tämä voi sisältää ohjeiden selventämistä, rakenteen muuttamista tai esimerkin antamista. (Coursera 2024.)

Ohje tai kysymys, jonka käyttäjä antaa tekoälylle saadakseen haluamansa vastauksen tai tuloksen. Promptin muotoilu vaikuttaa suoraan siihen, kuinka relevantin ja tarkan vastauksen tekoäly tuottaa.

Tekoälytyökalu, joka muuntaa tekstin puheeksi luonnollisella äänenkorkeudella, intonaatiolla ja rytmillä. Modernit puhegeneraattorit hyödyntävät syviä neuroverkkoja ja voivat jäljitellä ihmisen puhetapaa tarkasti, mikä tekee niistä hyödyllisiä asiakaspalvelussa, oppimisympäristöissä ja saavutettavuuden parantamisessa.

Tapa, jolla sovellukset voivat kommunikoida keskenään. Tekoälymallien API-rajapinnan avulla esimerkiksi yritys voi integroida tekoälypalveluja omiin järjestelmiinsä. (IBM 2024.)

Tekoälymalli, joka on koulutettu valtavalla määrällä tekstidataa ja jonka tavoitteena on ennustaa seuraavia sanoja tekstissä aiempien sanojen perusteella. LLM, kuten GPT-4, voivat tuottaa monipuolista tekstiä, ymmärtää kysymyksiä, luoda vastauksia ja suorittaa muita kielellisiä tehtäviä. Suuret kielimallit toimivat tokenien pohjalta ja voivat hyödyntää miljardeja parametreja tulkitakseen ja tuottaakseen tekstiä useilla eri kielillä ja konteksteissa. (Laaksonen 2023.)

Syväoppiminen on koneoppimisen osa-alue, joka hyödyntää monikerroksisia keinotekoisia neuroverkkoja suurten tietomäärien analysointiin ja monimutkaisten kaavojen tunnistamiseen. Syväoppiminen toimii niin, että jokainen kerros oppii vähän lisää ja jalostaa edellisten kerrosten oppimaa tietoa, mikä auttaa tekoälyä tunnistamaan esimerkiksi kuvista kasvoja, tulkitsemaan puhetta tai ymmärtämään tekstien merkityksiä. Toisin sanoen, syväoppiminen on erityisen hyvä löytämään datasta asioita, joita on vaikea havaita tavallisin laskentamenetelmin. (McKinsey & Company 2024.)

Tekoäly tarkoittaa ohjelmistoja, jotka jäljittelevät ihmisen oppimistapaa ja päätöksentekoa. Tekoälyohjelmat perustuvat ihmisen luomiin algoritmeihin, mutta se pystyvät myös itsenäisesti oppimaan uutta ja parantamaan suorituskykyään. Tekoälyn tarkoitus on auttaa ja tukea ihmisiä esimerkiksi käsittelemällä valtavia tietomääriä, joiden läpikäyminen veisi ihmisiltä kohtuuttomasti aikaa.

Tekoäly voidaan jakaa kahteen pääryhmään: heikkoon ja vahvaan tekoälyyn. Heikko tekoäly suorittaa tarkasti rajattuja tehtäviä, jotka ihminen on määritellyt, usein jopa ihmistä tehokkaammin. Vahva tekoäly puolestaan omaa laajemman ymmärryksen ja kykenee ajattelemaan sekä toimimaan ihmisen tavoin itsenäisesti. Vaikka vahvaa tekoälyä ei ole vielä onnistuttu kehittämään, se on yksi tekoälytutkimuksen tavoitteista. (Kolari & Kallio 2023.)

Tekoälymallit, erityisesti kielimallit, käsittelevät tekstiä “tokeneina”, jotka ovat tekstin pienempiä osia, kuten sanoja, tavuyhdistelmiä tai merkkejä. Tokenien avulla malli prosessoi tekstiä tehokkaasti. Tokenien määrä vaikuttaa siihen, kuinka pitkiä vastauksia tai tekstejä malli pystyy tuottamaan yhdellä kertaa. (Kärkkäinen 2024).

Tekoälytyökalu, joka voi luoda videoita annetun ohjeen (promptin) tai lähdeaineiston perusteella. Videogeneraattorit hyödyntävät usein syväoppimista ja generatiivisia verkkoja, kuten GANeja (Generative Adversarial Networks), joiden avulla ne voivat tuottaa realistisia visuaaleja tai animaatioita moniin käyttötarkoituksiin, kuten markkinointiin ja koulutukseen.

LÄHTEET

Aitomation. 2024. Tekoälyn kehitys käytännössä. WWW-dokumentti. Saatavissa: https://www.aitomation.fi/blog/tekoalyn-kehitys-kaytannossa?utm_source=chatgpt.com [viitattu 12.10.2024]. 

Coursera. 2024. What is GAN? WWW-dokumentti. Päivitetty 29.10.2024. Saatavissa: What is GAN? Generative Adversarial Networks (GAN) Explained | Coursera [viitattu 7.10.2024]. 

Directors’ Institute Finland. 2023. Miten saada kilpailuetua tekoälystä – tasapainota innovointi ja sääntely. WWW-dokumentti. Päivitetty 10.10.2023. Saatavissa: https://dif.fi/teema-artikkelit/2023/q4-2023-kehittyva-hallitus/miten-saada-kilpailuetua-tekoalysta-tasapainota-innovointi-ja-saantely/?utm_source=chatgpt.com [viitattu 6.10.2024]. 

Exploding Topics. 2024. GPT parameters. WWW-dokumentti. Päivitetty 6.8.2024. Saatavissa: https://explodingtopics.com/blog/gpt-parameters?utm_source=chatgpt.com [viitattu 7.10.2024]. 

FinnishUP.2024. Mikä on neuroverkko? WWW-dokumentti. Päivitetty 17.10.2024. Saatavissa: https://www.finnishup.com/mika-on-neuroverkko/?utm_source=chatgpt.com [viitattu 7.10.2024]. 

Helsingin yliopisto. 2024. Tekoäly ja tieteen avoimuus. WWW-dokumentti. Saatavissa: https://blogs.helsinki.fi/thinkopen/tekoaly-ja-tieteen-avoimuus/?utm_source=chatgpt.com [viitattu 7.10.2024]. 

IBM. 2024. Natural language processing. WWW-dokumentti. Päivitetty 11.8.2024. Saatavissa: https://www.ibm.com/topics/natural-language-processing [viitattu 7.10.2024]. 

IBM. 2024. What is an AI model? WWW-dokumentti. Saatavissa: https://www.ibm.com/topics/ai-model [viitattu 8.10.2024]. 

IBM. 2024. What is an API? WWW-dokumentti. Saatavissa: https://www.ibm.com/topics/api?utm_source=chatgpt.com [viitattu 8.10.2024]. 

Kolari, J & Kallio, A. 2023. Tekoäly 123: matkaopas tulevaisuuteen. Jyväskylä: Docendo. E-kirja. Saatavissa: https://kaakkuri.finna.fi/Record/kaakkuri.229783?sid=4856874652 [viitattu 7.10.2024]. 

McKinsey & Company. 2024. What is AI? WWW-dokumentti. Päivitetty 3.4.2024. Saatavissa: https://www.mckinsey.com/featured-insights/mckinsey-explainers/what-is-ai [viitattu 6.10.2024]. 

Niittymaa, J.2023. Päivitetty tekoälysanasto. WWW-dokumentti. Päivitetty 11.7.2023. Saatavissa: https://jukkaniittymaa.com/2023/07/11/paivitetty-tekoalysanasto/ [viitattu 6.10..2024]. 

Suomalainen Tiedeakatemia. 2024. Tekoälyä tutkijoille – mitä tutkijan tulee tietää tekoälyn läpinäkyvyydestä? WWW-dokumentti. Päivitetty 15.2.2024. Saatavissa: https://acadsci.fi/tiede-ja-paatoksenteko-kategoria/tekoalya-tutkijoille-mita-tutkijan-tulee-tietaa-tekoalyn-lapinakyvyydesta/?utm_source=chatgpt.com [viitattu 11.10.2024]. 

Techopedia. 2024. Tekoälyn hallusinaatio. WWW-dokumentti. Päivitetty 3.9.2024. Saatavissa: https://www.techopedia.com/fi/sanasto/tekoalyn-hallusinaatio?utm_source=chatgpt.com [viitattu 4.10.2024].