Zdôveria sa ľudia viac robotom ako ľuďom? A ako veľmi by sa mal robot podobať človeku?

Štefan Beňuš skúma tajomné zákutia ľudskej reči, nedávno získal za svoju vedeckú prácu ocenenie Literárneho fondu. Ide k samotnej fyziologickej podstate toho, ako sa reč tvorí. A pomáha tiež pri hľadaní optimálneho spôsobu, ako by mali systémy umelej inteligencie komunikovať s ľuďmi. K výlučne rečovému ovládaniu vývoj totiž smeruje. Automatické komunikačné systémy môžu raz lekárom pomáhať odhaľovať choroby a monitorovať ich priebeh. No je tu delikátna hranica - ako veľmi by sa mal robot podobať človeku?

17.11.2022 06:00
Štefan Beňuš Foto:
Štefan Beňuš
debata

Čo vás osobne na výskume ľudskej reči najviac fascinuje?

Študentom zvyknem hovoriť, že reč je oknom do ľudskej mysle. Keď niečo hovoríme, je to fyziologický proces, ktorý sa dá celkom presne skúmať rôznymi artikulačnými dátami, čiže ako pohybujeme jazykom, rôznymi orgánmi a potom rôznymi akustickými dátami. Štúdiom reči však možno pozorovať aj kognitívnu stránku ľudskej mysle. Najviac ma však asi fascinuje, ako možno prepojiť tieto fyzické dáta s psychologickými dátami alebo sociálnymi. Reč je spôsobom interakcie človeka v spoločnosti v rôznych vrstvách. Prevažná väčšina kontaktov sa realizuje pomocou rečovej komunikácie. A toto ma najviac zaujíma.

Video
Štefan Beňuš o knihe, za ktorú získal cenu Literárneho fondu

Na Columbia University v New Yorku ste s kolegami hľadali systém, ktorý by vedel odhaliť klamstvo v reči. Ako to prebiehalo?

Pozvali sme ľudí do laboratória, aby nám porozprávali o svojich schopnostiach v šiestich oblastiach. V hre na hudobnom nástroji, ako dobre poznajú víno a podobne. Potom sme im ukázali, aké dosiahli skóre v porovnaní s inými. Povedali sme im, že hľadáme ľudí, ktorí dokážu iných presvedčiť o svojich schopnostiach, aj keď v nich nie sú dobrí. A tak potom viedli rozhovor s experimentátorom, ktorý sa ich znova pýtal na rôzne oblasti v hre na nástroji, poznaní vína. Rozdelili sme to na veľké a malé klamstvá.

Aj dospelí sú otvorenejší pri komunikácii s automatickým systémom. Keď sa napríklad lekár otvorene spýta, koľko alkoholu pacient pije, ľudia majú tendenciu priznať menšie množstvo.

Čo bolo veľké klamstvo?

Veľké klamstvo bolo, keď mal niekto nízke alebo vysoké skóre v určitej oblasti a musel presvedčiť experimentátora, že to skóre bolo iné, buď vyššie alebo nižšie ako to naozaj dosiahnuté. Malé klamstvo boli jednotlivé vety, keď človek stlačil pedál, že práve teraz klame, alebo práve teraz hovorí pravdu. Takto sme vedeli zadefinovať jednotlivé vety, či išlo o klamstvo alebo nie.

A ako teda ľudia ku klamstvu pristupovali?

Bolo zaujímavé, že tí efektívnejší klamári mali tendenciu povedať nakoniec veľa pravdivých výrokov, keď sa snažili presvedčiť o veľkom klamstve. To bolo to umenie (smeje sa). S pomocou strojového učenia sme spracovali množstvo dát. Ja som sa venoval akustickej oblasti, akustickej charakteristike reči, výške hlasu, tempu reči, hlasitosti, produkcii slabík, samohlások a podobne. A potom sa robili rôzne experimenty v rámci strojového učenia. Testovali sme, nakoľko je náš model dobrý.

Akú úspešnosť ste dosiahli?

Viac ako 60 percent. Čo je viac ako u bežných ľudí, u tých je to väčšinou 50 na 50.

A ako sa teda klamár prejavuje?

Moja hypotéza bola, že pri klamstvách bude viac hezitácií, to sú tie rôzne ehm, mmm, pauzy, pomalšie tempo reči. Ale ukázal sa pravý opak. Ale to súvisí s tým, že ľudia v našom experimente si mohli klamstvá pripraviť. Ak je reč pripravená, je tam menej týchto znakov. Ale zistili sme zaujímavú vec o výške hlasu. Práve to je jeden z dôležitých indikátorov. Ľudia, ktorí klamali, rozprávali vyšším hlasom, mali vyšší základný tón. V tomto smere sa potom robil podobný výskum. Vedci si všímali vplyv kultúry, jazykového prostredia. U respondentov z Číny zistili podobný jav ako v americkej angličtine. Ale u Hispáncov to bolo presne naopak. Keď klamali, hlas mali nižší. Je to zložité. Ak niekto nájde na internete detektor lži na základe reči so zaručeným úspechom, tak to celkom určite nefunguje. Ale ak sa podobné dáta dobre a premyslene prepoja s inými technikami vyšetrovateľov a ich skúsenosťami, tak si myslím, že to môže zohrať významnú úlohu.

Počas jednej prednášky ste povedali, čo vám kládla na srdce mama. Nie je dôležité, čo povieš, ale ako to povieš. Naozaj je to tak?

Samozrejme. Záleží od situácie. Ale môj základný prístup k jazyku a rečovej komunikácii tkvie v tom, že informačná stránka je dôležitá, ale určite nie jediná. Dokonca by som povedal, že veľakrát je až na treťom, štvrtom alebo piatom mieste. Jazyk používame na manažovanie svojich sociálnych kontaktov. Je to vec, ktorou dokážeme plniť úlohy v práci, rodine. Rečou odhaľujeme svoj emocionálny stav. Napríklad prozódiou reči vyjadrujeme iróniu, sarkazmus. Je nevyhnutné, aby sme v týchto prípadoch použili prozódiu. Je nesmierne dôležité, ako niečo hovoríme.

Čo dokážu sociálne roboty

Robili ste aj zaujímavý výskum, v ktorom ste sa pozreli na slovo „no“. Čo ste zistili?

To súvisí s predošlou otázkou. Ide o veľmi bežné slovo. V jednom z mojich korpusov bolo piatym alebo šiestym najpoužívanejším slovom v konverzačnej reči. Používa sa v množstve významov. A práve to, ako ho človek povie, signalizuje jeho funkciu. No… a teraz si asi budem dávať pozor počas nášho rozhovoru na svoje no (usmieva sa). Práve toto množstvo vzťahov, s ktorými je previazené jedno slovo, a zároveň aj opačný jav, že jeden a ten istý význam možno vyjadriť viacerými slovami, to je na jazyku fascinujúce. A to všetko sú dôvody, prečo súhlasím s mamou, keď hovorila, že je veľmi dôležité, ako to poviete.

Aký význam má tento fenomén pri hľadaní spôsobu, ako komunikovať s robotmi?

Na začiatok by som povedal, že to nemusí byť robot. Mne ide najmä o automatické systémy komunikácie, ktoré majú ľudia už dnes v telefónoch – napríklad Siri, alebo sú to rôzne „krabičky“ ako Alexa, navigácia v aute. No a význam sa skrýva v tom, že ak budeme schopní komunikáciu automatického systému alebo stroja prispôsobiť ľudskej komunikácii, tak ľudia budú mať väčšiu dôveru komunikovať s týmito systémami. Nedávno napríklad skúmali navigáciu v aute pre Írov. Zistili, že keď hovorila írskou angličtinou, tak jej Íri dôverovali oveľa viac, ako keď mala britský prízvuk. A to aj napriek kvalite navigácie, aj keď im nedávala dobré rady.

Skúmali ste aj vy niečo podobné?

V jednej štúdii sme sa rozhodli reč dvoch malých NAO robotov prispôsobovať alebo neprispôsobovať reči človeka, ktorý s nimi komunikoval. Roboty mu dávali určité rady. Potom sme zisťovali, ktorému robotovi človek dôveroval viac. Ale nakoniec sme nezistili nič prevratné, lebo výsledky neboli jednoznačné. Základná odpoveď však znie, že čím viac budeme schopní verne modelovať komplexnosť ľudskej reči vrátane rôznych nuáns aj v automatických systémoch, tým zmysluplnejšia bude naša komunikácia s týmito systémami.

Kedy príde doba, keď nebudeme používať tlačidlá, ovládače ale budeme sa so všetkými vecami, spotrebičmi rozprávať?

Myslím si, že to k tomu smeruje. Pre nás je to veľmi prirodzený spôsob komunikácie. Ale kedy? To je veľmi ťažké povedať.

Je ťažšie naučiť robota po anglicky alebo po slovensky?

To je ťažká otázka. Asi sa pýtate na prevod textu do reči. Množstvo ľudí má nejakú predstavu týkajúcu sa náročnosti jazykov na výučbu. Že je napríklad ťažšie naučiť sa po fínsky ako po taliansky. Z môjho pohľadu sú jazyky vždy rovnaké, akurát ich komplexita je vo viacerých úrovniach, formách, oblastiach. Angličtina naozaj nemá pádové koncovky a časovanie, ale v tomto jazyku je komplexita skrytá inde. Možno výslovnosť je zložitejšia. Niečo podobné platí aj pre strojové učenie alebo pre automatické systémy. V súčasnosti je syntéza reči založená na veľkých dátach. Ak má dnes syntetizátor k dispozícii veľké množstvo kvalitných dát, dokáže spraviť relatívne kvalitnú syntézu bez ohľadu na jazyk.

Podieľali ste sa na výskume, ako by sa mohli včas odhaliť určité choroby u seniorov, práve pomocou rozhovorov s automatickými systémami. Ešte na tom pracujete?

Je to výskum, ktorý práve prebieha. Jednou z úloh je skorá detekcia Alzheimerovej choroby. Dobré úspechy sa dosahujú pri Parkinsonovej chorobe, kde sa rôzne prejavy začínajú prejavovať dosť skoro, napríklad monotónnosť alebo tras v hlase. Tam je šanca, že sa to dokáže včas podchytiť. Tento výskum je nesmierne dôležitý. Pre lekárov je veľmi dôležité monitorovať pacientov. Ako choroba postupuje, ako pacienti reagujú na nejakú liečbu. Takže, ak by sa toto všetko dalo monitorovať jednoduchou konverzáciou napríklad cez aplikáciu v telefóne, pre lekárov by išlo o veľmi cenný nástroj. Nemuseli by tráviť toľko času diagnostikou, mohli by sa venovať analýze. Podobné výskumy sa robia napríklad pri pacientoch s depresiou, nemusia to byť len neurodegeneratívne choroby.

Mohli by roboty raz pomáhať detským psychológom? Je pravda, že deti sa radšej zdôveria robotovi ako človeku?

Nielen deti. Aj dospelí sú otvorenejší pri komunikácii s automatickým systémom. Keď sa napríklad lekár otvorene spýta, koľko alkoholu pacient pije, ľudia majú tendenciu priznať menšie množstvo. Pritom to môže byť dôležitá informácia pre rôzne choroby. A podobné je to aj pri psychických problémoch. Deti vedia byť voči strojom otvorenejšie. Teraz napríklad robíme výskum v spolupráci s centrom autizmu na lekárskej fakulte. Autistické deti majú určité svojské rečové prejavy. Je bežné, že skáču do reči, nepreberajú reč tak plynulo, sú tam dlhšie pauzy. Tieto prejavy, spolu s mnohými inými rečovými a komunikačnými charakteristikami, by sa v budúcnosti mohli podieľať na skríningových a monitorovacích systémoch napríklad pre autizmus.

A mohlo by to pomáhať na školách? Napríklad včas odhaliť šikanu?

To je náročné povedať. Učím na fakulte, kde pripravujeme budúcich učiteľov a chcel by som sa venovať výskumu toho, akoby sa dali roboty alebo automatické systémy používať vo vyučovacom procese. Napríklad v mojej doméne, v učení lepšej výslovnosti angličtiny. Ale tento výskum zatiaľ nerobím. Je to beh na dlhé trate.

Bude dobré, ak sa budú roboty čo najviac podobať človeku? Pretože v niektorých výskumoch sa ukazuje zaujímavý jav. Ako sa roboty stále viac podobajú človeku, dôvera rastie, ale v jednom momente, keď je podoba takmer na nerozoznanie, dôvera zrazu dramaticky spadne, až sa dokonca môže preklopiť v strach. Je to tak?

Ten fenomén sa nazýva bizarné údolie – uncanny valley. Zhodou okolností sa to pri jednom z výskumov stalo aj nám. Pracovali sme s robotom Furhatom (jeden z najvyspelejších sociálnych robotov, pozn. red.) a jedna pani normálne odmietla sa s ním zhovárať. Mala z toho zimomriavky. Súhlasím s prístupom Rogera Moorea, ktorý hovorí, že roboty alebo automatické systémy by mali mať taký vzhľad, ktorý zodpovedá ich schopnostiam a funkciám. Pretože veľakrát, keď sa roboty snažia čo najviac podobať ľuďom, máme tendenciu si myslieť, že budú mať aj funkcionalitu ako ľudia. A keď zistíme, že to tak nie je, sme oveľa viac sklamaní.

Robot Furhat počas experimentu Štefana Beňuša. Foto: Archív Štefana Beňuša
robot furhat Robot Furhat počas experimentu Štefana Beňuša.

Aj ste to overovali?

Niečo podobné sme zaznamenali, keď sme robili na výskume s robotickou hlavou Furhat. Na začiatku sme nastavili u robota čosi ako „small talk“, takú tú úvodnú odľahčujúcu a krátku sociálnu interakciu. Robot sa pýtal, odkiaľ ste. Povedali ste napríklad Prešov a on na to – mhm, to je super mesto. Pýtal sa – komu ste fandili na majstrovstvách sveta v hokeji a podobné otázky. Jednej skupine sme to tak nastavili, druhej nie.

A bolo to pre ľudí príjemnejšie?

Mysleli sme si, že tá skupina, ktorá mala aj úvodnú interakciu, bude komunikáciu s robotom hodnotiť pozitívnejšie. Ale opak bol pravdou. Myslím si, že úvodná interakcia, ktorá bola do určitej miery prirodzená, budila očakávania, že robot má v sebe viac ľudskej funkcionality ako v skutočnosti. Preto to ľudia hodnotili menej pozitívne. Pritom vývoj smeruje k antropomorfizmu, nielen po vizuálnej stránke. Napríklad kvalita hlasových syntetizátorov a dialógových systémov je už na takej úrovni, že sa často nedá povedať, čo je stroj a čo človek. Podľa mňa je dôležité prepojiť možnosti, funcionalitu umelej inteligencie s tým, ako navonok pôsobí.

Štefan Beňuš

  • fonetik, fonológ
  • Je vedúcim Katedry anglistiky a amerikanistiky na Filozofickej fakulte Univerzity Konštantína Filozofa v Nitre
  • Pôsobí v Ústave informatiky Slovenskej akadémie vied.
  • Za publikáciu Investigating Spoken English – A practical Guide to Phonetics and Phonology Using Praat získal tento rok cenu Literárneho fondu, ide o praktickú príručku, ktorá vedie čitateľa formou cvičení k vlastnému výskumu hovorenej angličtiny.

© Autorské práva vyhradené

debata chyba
Viac na túto tému: #komunikácia #umelá inteligencia #robotika #reč