En bild av språket Tsafiki med sex färgord, det talas av Tsáchila folket i Ecuador. Bilden till höger visar ett artificiellt språk med samma antal färgord, skapat av forskarnas agenter. Tsáchila folket och de artificiella agenterna tycks ha delat in spektr

AI-agenter kan lära sig att kommunicera effektivt

Publicerad

15 juli 2020

vid

Institutionen för filosofi, lingvistik och vetenskapsteori

Forskare från Göteborgs universitet och Chalmers presenterar en metod för att studera hur språk utvecklas som ett effektivt verktyg för att beskriva mentala bilder. I en ny studie visar de att så kallade artificiella agenter på egen hand kan lära sig att kommunicera på ett artificiellt språk som liknar mänskligt språk. Resultaten har publicerats i den vetenskapliga tidskriften PLOS ONE.

The image shows an artificial language with colour words created by the researchers' agents. The Tsáchila people and the artificial agents seem to divide the spectrum in similar ways. Överst en bild av språket Tsafiki med sex färgord, det talas av Tsáchila folket i Ecuador. Bilden nedanför visar ett artificiellt språk med samma antal färgord, skapat av forskarnas agenter. Tsáchila folket och de artificiella agenterna tycks ha delat in spektrumet på liknande sätt. En kvantitativ undersökning av likheter hos mänskligt och artificiellt språk återfinns i studien.

Artificiella agenter är mjukvarumoduler som är aktiva i en datormiljö. Göteborgsforskarna jobbar med frågeställningar i gränslandet mellan kognitiv vetenskap och maskininlärning. Flera studier inom kognitiv vetenskap tyder på att mänskliga språk formas av behovet av effektiv kommunikation och förloppet är ur ett informationsteoretiskt perspektiv nära optimalt. Gruppens metod för att träna de artificiella agenterna bygger på förstärkningsinlärning, reinforcement learning, som är ett område inom maskininlärning där agenter successivt lär sig genom att interagera med en miljö och få belöningar. I det här fallet har agenterna startat utan någon som helst språklig kunskap och sedan lärt sig att kommunicera genom att få feedback på hur bra de förstår varandra. Även det förloppet har varit nära optimalt.

Beskriver färger

– Vi tittar på hur agenter lär sig att namnge olika färger i ett gissningsspel bestående av en berättare och en lyssnare. Berättaren ser en färg och beskriver den genom att skicka ett ord från en ordlista till lyssnaren som försöker återskapa färgen. Båda agenterna belönas efter hur bra lyssnaren kan pricka in färgen. Orden i ordlistan har till en början ingen betydelse, utan det är upp till agenterna att själva komma överens om ordens mening under flera rundor av gissningsspelet. Vi ser att agenterna partitionerar in färgspektra på liknande sätt som vi människor gör, säger Mikael Kågebäck, forskare på Sleep Cycle AB.

Mikael Kågebäck, tidigare doktorand vid institutionen för data- och informationsteknik, har tillsammans med Asad Sayeed, forskare i datalingvistik på Centrum för språkteori och sannolikhetsstudier (CLASP) vid Göteborgs universitet, och Devdatt Dubhashi, professor, och Emil Carlsson, doktorand, på avdelningen för Data Science och AI vid Data- och informationsteknik, författat artikeln som nu publicerats av PLOS ONE.

– En praktisk tillämpning av vår forskning är att den kan bidra till mer effektiv kommunikation mellan datorer och människor och förbättra datorers förståelse för mänskligt språk, till exempel i smarta system som Siri och Alexa, säger Asad Sayeed.

Den underliggande idén att lära sig att kommunicera genom förstärkningsinlärning är också intressant för forskning inom sociala och kulturella områden, till exempel för projektet GRIPES som studerar hundvisselpolitik (dogwhistle politics) vilket Asad Sayeed leder.

Kan användas i andra studier

Devdatt Dubhashi, professor, Data Science and AI division, Department of Computer Science and Engineering. – Kognitiva experiment är tidskrävande, eftersom du ofta behöver utföra noggranna experiment med ett antal volontärer. Vi presenterar en kraftfull, flexibel och kostnadseffekiv metod för att undersöka de här grundläggande frågorna. Vi har full kontroll på experimenten, som är repeterbara och helt pålitliga. Det ramverk vi tagit fram är mycket användbart för att undersöka grundläggande frågor inom kognitiv vetenskap, språk och interaktion. För datavetare är det ett givande område för att utforska effektiviteten hos olika inlärningsmekanismer, säger Devdatt Dubhashi.

Emil Carlsson, PhD student, Data Science and AI division, Department of Computer Science and Engineering. – I framtiden vill vi undersöka om agenter kan utveckla kommunikation som liknar mänskligt språk även inom andra områden. Ett exempel är om vi på ett artificiellt sätt kan återskapa de hierarkiska strukturer vi ser i mänskligt språk, säger Emil Carlsson.

Mer utförlig information om forskningsprojektet finns i den engelska versionen av denna text.

Länk till artikeln i PLOS ONE:
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0234894

Kontakt

Asad Sayeed, forskare i datalingvistik, institutionen för filosofi, lingvistik och vetenskapsteori, asad.sayeed@gu.se
Devdatt Dubhashi, professor, avdelningen för Data Science och AI, Data- och informationsteknik
Emil Carlsson, doktorand, avdelningen för Data Science och AI, Data- och informationsteknik
Mikael Kågebäck, Sleepcycle AB

Område

Kultur & språk Naturvetenskap & IT