Vedci učia umelú inteligenciu hľadať lož. Nie je to ľahké

Experti na umelú inteligenciu a jazyk spájajú sily v boji proti dezinformáciám v najnovšom európskom projekte pod názvom DisAI. Zhovárame sa s hlavným riešiteľom Mariánom Šimkom z Kempelenovho inštitútu inteligentných technológií, ktorému sa podarilo na projekt získať grant z programu Horizont Európa. Ide o kľúčový program Európskej únie na financovanie výskumu a inovácií s rozpočtom 95,5 miliardy eur.

24.03.2023 14:22
debata (8)
Marián Šimko. Foto: KinIT
KinIT, Marián Šimko Marián Šimko.

Ako je na tom Slovensko v boji proti dezinformáciám v porovnaní s ostatnými európskymi krajinami?

GLOBSEC zverejnil správu, že až 56 percent Slovákov verí konšpiračným teóriám a dezinformačným naratívom. A to je veľmi zlé, podľa mňa alarmujúce.

Prečo to tak je?

Možno je to sčasti dané historickou skúsenosťou, ktorú si nesieme v tomto regióne. Ale je tam veľký priestor na zlepšenie. Ak uznáme, že dezinformácie predstavujú problém. Lebo pre niektorých ani toto nie je zjavné.

Na čo slúži dezinformácia?

Ide o nástroj na dosahovanie rôznych cieľov, napríklad ovplyvňovanie verejnej mienky. Je preto dôležité, aby rozhodnutia, ktorým je vystavená spoločnosť, boli férové, korektné. A aby prinášali prospech celej spoločnosti, nielen nejakým skupinám. V mediálnom priestore 21. storočia už nedominujú len štandardné médiá, ale aj sociálne siete a ďalšie kanály, a je dôležité, aby informácie boli transparentné, overiteľné a dôveryhodné.

Kvôli zisku vedia sociálne siete ohnúť svoj hodnotový rebríček.

Samotní ľudia, bez ohľadu na vzdelanie či status, majú často problém rozlíšiť lož od pravdy. Zvládne to umelá inteligencia lepšie?

Je to problém, ktorý je riešiteľný pomocou strojov, algoritmov, ale nie je to jednoduché. Pretože skutočne aj pre niektorých ľudí je ťažké vyhodnotiť, čo je pravda, čo je korektná informácia. Preto by prvotné nástroje boja s dezinformáciami mali siahať k vzdelávaniu obyvateľov, zvyšovaniu mediálnej gramotnosti. Aby samotní ľudia mali v sebe aparát na rozpoznanie toho, či ich niekto chce zmanipulovať, alebo im podsúva nepravdivú informáciu. Aby mali už v sebe zakotvené kritické myslenie. Ďalšou úrovňou boja proti dezinformáciám sú fact-checkeri (overovači faktov). Manuálne prehľadávajú web, manuálne kontrolujú zdroje a to môže trvať veľmi dlho. Hľadajú sa spôsoby, ako im pomôcť a práve tam sa môže uplatniť umelá inteligencia. Vymýšľame rôzne „mašinky“, vďaka ktorým dokážu byť fact-checkeri v boji s dezinformáciami efektívnejší.

Koľko fact-checkerov pôsobí na Slovensku?

Profesionálne? Pokiaľ viem, iba jeden! Pracuje pre AFP. Čo je pre Slovensko ďalšia alarmujúca skutočnosť.

Spojili ste sa so špičkovými výskumnými inštitúciami v Európe. Mohli by ste ich trochu predstaviť?

Nemecké výskumné centrum pre umelú inteligenciu (DFKI) je najväčším nezávislým výskumným ústavom pre umelú inteligenciu na svete. Predstavuje zaujímavý prvok v nemeckom výskumnom ekosystéme a musím povedať, že pre náš inštitút predstavuje vzor. Budeme spolupracovať so skupinou zameranou na spracovanie jazyka. Ďalším partnerom je grécke Centrum pre výskum a technológie Hellas (CERTH), ide o silného hráča v boji proti dezinformáciám. A napokon je to Univerzita v Kodani, patrí do top 30 svetových univerzít, bude s nami robiť skupina zaoberajúca sa spracovaním prirodzeného jazyka.

Miloš Prokop, jaskyniar, informatik, kvantové počítače Čítajte aj Na prácu potrebujú väčší chlad ako vo vesmíre, na prelomenie šifry okamih. Kvantové počítače prídu o pár rokov

Hľadáte teda aj inšpiráciu, ako posunúť slovenskú vedu?

Slovensko má veľmi nízku úspešnosť v zapájaní sa do grantových výziev v Európe. Sme na chvoste. A jeden z dôvodov je ten, že nevieme, ako na to. Verím, že naši partneri nám aj v tomto smere pomôžu a že tento projekt pozdvihne úroveň nielen nášho inštitútu, ale celkovo zlepší vyhliadky Slovenska do budúcnosti.

V projekte sa spoja dánski, nemeckí, grécki a slovenskí výskumníci. S akým jazykom bude projekt pracovať?

S viacerými naraz. Multijazyčné spracovanie je kľúčové. Dezinformácie majú tú vlastnosť, že putujú po Európe, po svete. Preberajú sa z jedného jazyka do druhého. To sa dá využiť. Ak už niečo úspešne overil napríklad nejaký Španiel, mohlo by to uľahčiť prácu slovenským fact-checkerom. Chceme sa preto pozrieť do databáz dokumentov, hľadať podobnosti. A práve umelá inteligencia (AI – z anglického artificial intelligence) dokáže celkom efektívne pracovať so súbormi dát, ktoré sú viacjazyčné. Dokonca vieme niektoré modely AI natrénovať tak, aby si odovzdávali poznatky medzi jazykmi. To môže výrazne pomôcť pri slovenčine. Pretože pre slovenský jazyk existuje zatiaľ málo dát v porovnaní s inými jazykmi a ukazuje sa, že model umelej inteligencie sa pre slovenčinu môže niečo naučiť aj z iného jazyka, ale aj naopak. Niečo podobné už využíva aj aplikácia ChatGPT, ktorej popularita výrazne rastie.

Pestrosť jazykov však pri dezinformáciách nie jedinou rovinou. Čím sa to ešte komplikuje?

Rôznymi obsahmi. Nie je to len text, zvuk, ale aj obrázok či video. Dnes už máme výpočtovú kapacitu, aby sme sa vedeli pozrieť na tento multimodálny – obsahovo pestrý obsah a opäť pomôcť fact-checkerom. Predstavte si dezinformáciu, ktorá sa šíri ako text sprevádzaný obrázkom. Nestačí sa pozrieť len na text, kľúčové je práve spojenie s obrázkom, s emóciou, ktorú spôsobí. To je to kontroverzné. Ako výskumníci chceme zlepšovať metódy, ktoré by naraz spracúvali obraz aj text.

Projekt pracuje aj s fenoménom dôveryhodná umelá inteligencia. O čo ide?

V súčasnosti v AI dominuje smer, ktorý sa nazýva hlboké učenie. Imituje sa neurónová sieť, ktorú máme aj my ľudia v mozgu. Ide o matematický model, v rámci ktorého sa môžu nastavovať nejaké parametre, čísla, váhy a na konci to môže fungovať dobre. Ale nevieme, na základe čoho ten model funguje dobre. Nevidíme do vnútra rozhodovania AI. Úlohou dôveryhodnej AI je pomôcť v uisťovaní sa, že modely, s ktorými pracujeme, sa rozhodujú na základe správnych atribútov.

Kempelenov inštitút inteligentných technológií... Foto: KinIT
KinIT, Kempelenov inštitút inteligentných technológií Kempelenov inštitút inteligentných technológií na projekte DisAI spolupracuje dánskymi, nemeckými a gréckymi výskumníkmi.

Vieme to vysvetliť na jednoduchom príklade?

Pred niekoľkými rokmi sa pomocou neurónových sietí vytvorila metóda AI, ktorá sa naučila veľmi dobre rozoznávať obrázky zvierat. Fungovalo to perfektne, ale nefungovalo to tak ako u človeka. Že sa pozriete na zviera s parohami a viete povedať – to je jeleň. Umelá inteligencia na to išla úplne inak. Pozrela sa na špecifické vlastnosti súborov fotografickej spoločnosti, ktorá dodala fotografie, našla určité znaky, podľa ktorých určila, že ide o zviera. Takže model možno fungoval dobre, ale nie na základe správnych informácií. V medicíne je to ešte citlivejšie. A podobne aj pri dezinformáciách. My potrebujeme mať dôveryhodné vysvetlenie, prečo umelá inteligencia niečo vyhodnotila ako dezinformáciu a niečo nie.

Aké to má ďalšie dôsledky, že slovenčina má málo jazykových dát?

Súvisí to s prvou otázkou, prečo je Slovensko na tom tak zle. Slovenčina má v porovnaní s inými jazykmi málo zdrojov, málo dokumentov, hovorí ňou len do šesť miliónov ľudí. V jazykoch, ktoré sú na svete najpoužívanejšie, sa nástroje boja proti dezinformáciám založené na spracovaní prirodzeného jazyka stihli rozvíjať na úplne inej úrovni. Európska komisia si však uvedomuje vážnosť týchto javov a snaží sa podporiť nápravu na viacerých frontoch.

Je vôbec bezpečné zdôveriť umelej inteligencii hoci časť citlivých nástrojov, ktoré majú chrániť spoločnosť pred dezinformáciami, keď poriadne nevidíme dnu, čo sa tam deje?

Nejaké riziká tam určite sú. A preto sa v súčasnosti ani neuvažuje o tom, že by tieto nástroje boli plne automatické. Čo by znamenalo, že by sme to pustili z rúk a nechali by sme AI, nech robí všetko sama. Ale možno to raz bude efektívnejšie automatizované. To znamená, že nám AI bude pomáhať, ale vždy bude na konci procesu človek, ktorý urobí rozhodnutie. Tento prvok tam musí byť. Toto sa týka AI vo všeobecnosti, pretože stále nie je na tej úrovni, aby mohla robiť rozhodnutia sama. To je napokon vidieť aj na aplikácii ChatGPT. Aj napriek tomu, že ľudia sú sprvu ohúrení jej schopnosťami, po pár minútach konverzácie je každému jasné, že systém má mnoho nedostatkov. Technológia AI nie je ešte taká vyspelá, aby sme jej mohli úplne dôverovať. Je dôležitý ľudský faktor a nejaký čas to tak ešte bude.

Hackathon ActInSpace Čítajte aj Slovenský vesmír sa zdvojnásobil. Už 40 slovenských firiem je vo vesmírnej ekonomike

A ako si máme takú automatizáciu boja proti dezinformáciám predstaviť? Bude vôbec niekedy možná úplná automatizácia? Ako by vyzerala?

Podľa mňa úplne možná nebude nikdy, preto sa mi príklad vymýšľa ťažko (usmieva sa). Ešte je veľa problémov pred nami, ktoré musíme vyriešiť. Spomeniem napríklad aktuálnosť. Každým dňom sa objavujú nové informácie, nové modely. Darmo vyšperkujeme systém, ktorý už bude vedieť dobre vyhodnotiť, že Savo nelieči rakovinu. Nebude vedieť zasiahnuť proti fenoménom, ktoré sa objavia v posledných pár týždňoch, dňoch. To sme videli sami na sebe pri covide, pri vojne na Ukrajine. Koľkí ľudia boli zmätení, kde je pravda? Nechcem zachádzať do filozofickej roviny. Ale opäť, rovnako ako pre nás je problém uchopiť nové fenomény, bude to problémom aj pre umelú inteligenciu. Preto vidím úplnú automatizáciu ako veľmi vzdialený koncept. Žeby niekedy existoval nejaký „strojček“, cez ktorý bude musieť prejsť informácia ešte predtým, než sa zverejní, aby vyhodnotil, či ide o nezmysel, alebo korektnú vec, tak toto je niečo, čo je veľmi ďaleko. Čiastkové riešenia ale určite budú. No nie centralistické. To by nakoniec ani nebolo dobre. Narážalo by to na ďalší rozmer – slobodu prejavu. Skôr by sme mali chcieť ako občania, aby sociálne platformy dbali na to, že nebudú šíriť dezinformačný ob­sah.

andrea hrbanova, jakub simko, kinit Čítajte viac Internetové giganty kradnú ľuďom svojbytnosť. Ako sa šíria dezinformácie?

Majú teda zatiaľ najmä sociálne platformy v rukách nástroje na obmedzenie dezinformácií? Stojí to aj na ich zodpovednosti, čestnosti?

Je to niečo, čo majú v rukách aj sociálne siete. Áno. Ale odpoveď je zložitejšia. My ako vedci budeme síce vyvíjať metódy, aby to pomáhalo čo najviac v boji proti dezinformáciám. Ale zároveň aj tie živly, ktorým šírenie dezinformácií vyhovuje, majú k dispozícii najnovšie poznatky a tiež budú pracovať na tom, aby boli efektívnejší v tom, čo robia. Zjavne to pre nich má hodnotu, inak by sme tu dezinformácie nemali. Vždy tu budú preteky dvoch strán. Nebude bod, kedy by sme mohli povedať – vyhrali sme nad dezinformáciou. Vždy to bude skôr len o snahe eliminovať ju pod nejakú rozumnú hranicu. Ktorá je prijateľná a škodí v čo najmenšej miere. Toto je základná rovina. Tou druhou sú sociálne siete a ich záujem. Poznáme príklady z nedávnej minulosti a odhalené kauzy, kde sa ukázalo, že ich primárnym záujmom je zisk. A kvôli zisku vedia sociálne siete ohnúť svoj hodnotový rebríček.

Je škodlivý ich biznismodel?

Ak je postavený na tom, aby udržali používateľa na sociálnej sieti čo najdlhšie, aby mu mohla ponúkať čo najviac obsahu, za ktorý dostáva peniaze z reklamy, tak bude produkovať taký obsah, ktorý je pútavý. A sociálne siete veľmi rýchlo zistili, že je to obsah, ktorý je kontroverzný, spôsobí emóciu, rozčúli. Vtedy ostanete na sieti visieť dlhšie.

Ale čo s tým zmôžu občania?

Môžeme žiadať, aby sme mali ochranu zo strany služieb, ktoré v našej spoločnosti môžu tieto firmy poskytovať. Európska komisia v tomto koná. Legislatíva, ktorá sa pripravuje, má pomôcť, aby nedochádzalo k vývoju, ktorý bude škodlivý.

V nedávno zverejnenej Správe Policajného zboru o dezinformáciách na Slovensku v roku 2022 je takáto posledná veta – na základe dostupných vyjadrení niektorých politicky exponovaných osôb je možné sa domnievať, že v prípade nárastu ich vplyvu v rámci štátnych orgánov SR dôjde k zániku, respektíve maximálnemu utlmeniu činnosti bezpečnostných orgánov v oblasti boja proti dezinformáciám. Cítia nejakú hrozbu aj vedci?

Necítim sa niečím podobným limitovaný. Sme nezávislý inštitút. A témy si vyberáme aj s ohľadom na spoločenskú hodnotu, ktorú majú. A my vnímame, že boj proti dezinformáciám je vážny problém. Dezinformácie sú už z definície niečo škodlivé. A z vedeckého hľadiska ide o entity napísané v prirodzenom jazyku, vedcov zaujíma ich štruktúra, spracovanie. Takže je to niečo, čo nám z hľadáčika nevypadne tak ľahko.

Marián Šimko

  • Expert na spracovanie prirodzeného jazyka a umelú inteligenciu
  • V Kempelenovom inštitúte inteligentných technológií vedie výskum spracovania prirodzeného jazyka, je zástupcom riaditeľky
  • Predtým pôsobil na Fakulte informatiky a informačných technológií STU ako výskumník a prodekan.
  • Viedol viacero projektov, za jeden z nich bol ocenený Ministerstvom školstva SR pre výnimočný dosah na vzdelávanie na Slovensku.
  • Je autorom vyše 40 vedeckých publikácií.

© Autorské práva vyhradené

8 debata chyba
Viac na túto tému: #sociálne siete #umelá inteligencia #dezinformácia