Detekcia dezinformácií

8. 6. 2020

Vo svete stúpa množstvo fact-checkingových aktivít. Vývoj sa uberá smerom ku vzniku certifikačných autorít, ktoré budú dávať správam punc pravdivosti. Štandardne sa overenie realizuje manuálne. V poslednej dobe začali vznikať pokusy o vytvorenie polo-automatických systémov. V týchto prípadoch počítačový algoritmus predselektuje texty, ktoré sú spojené s vyšším rizikom obsahu dezinformácií.

Náš záujem o riešenie tejto témy vyrástol prirodzene z dvoch smerov. Prvým je aplikácia našich skúseností z biomedicínskeho a neurovedeckého výskumu v SAV. Klasifikovali sme rôzne fyziologické stavy mozgu či srdca podľa veľkého množstva mier získavaných z EEG a EKG signálu. V oblastí dezinformácií ide o určitú paralelu, nakoľko tu ide tiež o výskum a vývoj komplexných klasifikátorov, ktoré budú schopné rozpoznať a vyhodnotiť typy informácií z webu. V zásade ide o  využitie pokročilých matematických prístupov, štatistických metód, strojového učenia a umelej inteligencie.

Druhým smerom sú naše skúsenosti s identifikáciou dezinformácií vo vede, technike a medicíne. Pri vedeckej práci je nesmierne dôležité efektívne triediť a kriticky zhodnotiť veľké množstvo vedeckých informácií. K cibreniu rozpoznávania faktičnosti tvrdení resp. odhadu ich váhy prispieva tvorba odborných posudkov a editorská činnosti pre impaktované vedecké časopisy. Aj vo vede sa vyskytujú a publikujú neoverené a zavádzajúce informácie. Popritom sme sa špecializovali aj na audit v oblastiach na hranici medzi mainstreamovou vedou a pseudo-vedou, špeciálne na “zdravotnícke” technológie v alternatívnej medicíne.

Samotné algoritmy strojového učenia, nech sú akokoľvek dobre dizajnované, neprinesú sami o sebe požadované výsledky. Medzi rozhodujúce faktory patrí kvalitná príprava dát a ich charakteristík. Jednou z kľúčových častí je výskum väčšieho množstva rôznych mier, z ktorých vzídu vhodné vlastnosti, tzv. features (črty), pomocou ktorých budú algoritmy schopné hodnotiť riziko jednotlivých správ alebo článkov. Aplikácie v tejto oblasti sú veľmi mladé, preto je kľúčovým rozvoj metodológie. V skutočnosti ide o multidisciplinárny výskum, ktorý zahŕňa expertízu aj z oblastí ako kognitívna veda, psychológia, sociológia a ďalšie.

Keď sa na skúmanú správu pozrie trénovaný človek, často-krát stačí pár sekúnd na zistenie, že niektoré veci nesedia. Niekedy bijú do očí určité charakteristiky, inokedy ide len o celkový pocit či intuíciu, vypestovanú na základe tréningu a skúseností. Samozrejme, existujú aj zamotanejšie problémy, pri ktorých nemusí byť aktuálne možné jednoznačne rozhodnúť (napr. závažnosť globálneho oteplovania alebo možná škodlivosť 5G sietí). Smutné však je, že veľkú časť škôd spôsobujú dezinformácie, na overenie ktorých stačí pomerne málo úsilia – jednoducho nahliadnuť za “roh”. Práve v takýchto prípadoch dezinformácií je šanca na úspešnú aplikáciu strojového učenia a umelej inteligencie vyššia.

Pri zadefinovaní širokej množiny čŕt je možné hodnotiť určitý background (reputácia stránky, serveru, autora), charakteristiky textu (morfológia, sémantika, sentiment) a nakoniec zjednodušené pochopenie kontextu. Ukážkou pokročilého systému na analýzu sentimentu je Intencheck, pri ktorom vidno, koľko rôznych charakteristík sa dá zo sentimentu odvodiť. Úlohou by napr. mohlo byť pokúsiť sa formalizovať a na úrovni algoritmov implementovať rozpoznanie manipulácie prostredníctvom jej typických čŕt, ako je spôsob podávania udalostí, nesprávne použitie kauzality, paranoidné vnímanie sveta, motív sprisahania, nedostatok platných dôkazov, emocionálne výbuchy a hystéria, práca s ľudským strachom z neznámeho, ohrozenie našej kultúrnej identity, xenofobia, polarizácia spoločnosti, hľadanie nepriateľa, vytváranie strachu, hnevu, nenávisti. Príkladom automatickej detekcie propagandy je qcri.org.

V Európe pôsobia organizácie  bojujúce proti dezinformáciam, ako napr. euvsdisinfo.eu či fullfact.org. Inšpiráciou pre start-upy aj spoluprácu vrámci štátu by mohla byť litovská iniciatíva debunk.eu. Ďalšou z ukážok je projekt Global disinformation index, využívajúci polo-automatický prístup spočívajúci v kombinácii strojového učenia a hodnotenia expertmi. Výsledný index rizika je vytvorený súčtom jednotlivých indikátorov. Jednotlivé použité indikátory tvoria pomerne bohatú skupinu čŕt, ktorú by bolo možné podľa nášho názoru rozšíriť o ďalšie oblasti ponúkajúce charakterizáciu skúmaných správ.

V našom regióne tiež bežia projekty snažiace sa bojovať proti dezinformáciam, medzi inými Checkbot, Propaganda detection tool (Masarykova univerzita Brno), blbec.online, DISI, Infosecurity, AFP-Facebook, antipropaganda.sk, konšpirátori.sk a demagog.cz a sk, bezfaulu.net. Pritom prvé tri z nich už zapájajú strojové učenie a umelú inteligenciu.

Na Slovensku sa očakáva vytvorenie jednotnej infraštruktúry a systému pre detekciu, archiváciu a výskum dezinformácií. Systém by mal pokryť rôzne oblasti dezinformácií, predovšetkým v oblasti zahranično-politickej, obrannej, vnútroštátnej, prípadne aj zdravotníckej. Tým je definované zapojenie jednotlivých ministerstiev. Cieľ je formulovaný v Programovom vyhlásení vlády: „Vláda pripraví akčný plán na koordináciu boja proti hybridným hrozbám a šíreniu dezinformácií a vybuduje adekvátne centrálne kapacity pre jeho realizáciu.“ V Akčnom pláne proti dezinformáciam z dielne EU (2018) sa nabáda na vybudovanie tzv. Rapid Alert System, ktorý bude schopný promptne reagovať na dezinformačné hrozby.

Bez vývoja a zapojenia automatických procesov detekcie dezinformácií to nebude možné.