23. října 2020 publikovalo Echo Prime rozhovor Daniela Kaisera s Františkem Vrabelem (uzamčeno pro předplatitele), jedním z nejznámějších propagátorů honu na dezinformace, kde vysvětluje, jakým způsobem funguje software jeho firmy Semantic Visions při odhalování údajných dezinformací. Takto jsme v listopadu 2021 ověřili výsledky jejich factcheckingu pro Ministerstvo zdravotnictví.
Vzhledem k tomu, že František Vrabel je jedním ze zakladatelů spolku, který stál za kampaní generála Pavla ještě v době, kdy na prezidenta oficiálně nekandidoval, a že mluvčí hradu se právě stala bývalá pracovnice firmy Semantic Visions, přijde nám užitečné si rozhovor a jejich metody odhalování “dezinformací” připomenout. Činíme tak ve dnech, kdy 15. díl dokumentů odhalujících interní komunikaci v Twitteru ukázal, že „seznam ruských botů“ nazvaný Hamilton 68, který používala mainstreamová média k diskreditaci nežádoucích politických názorů, byl podvrhem.
Převzato se svolením autora a Echo24. Foto Michaela Danelova, ČRo
Brzy po nástupu do funkce ministra zdravotnictví Roman Prymula na svém twitteru oznámil, že ministerstvo zahajuje spolupráci s firmou Semantic Visions Františka Vrabela. Ta se podle vlastních slov specializuje na mapování ruských a čínských dezinformací, tvrdí o sobě, že v tom dosáhla světové úrovně. Nově má pomáhat ministerstvu v boji s dezinformacemi, které prý doprovázejí covid-19. Je Vrabel expert, muž na svém místě, nebo prodavač horkého vzduchu?
Proč je podle vás tak důležité bojovat s dezinformacemi kolem koronaviru?
Protože spousta lidí nevěří, jak nebezpečný tento koronavirus je. Oni si myslí, že je to pouhý výmysl, aby nad námi kdosi získal moc. A za druhé vidím, že dezinformační zdroje popírají relativizují opatření, která se každá rozumná vláda ve světě snaží přijmout, tak aby šíření viru zpomalila. Nejsem brouk Pytlík a nejsem epidemiolog, ale k informační stránce věcí kolem Covidu se myslím vyjadřovat mohu.
Jaké dezinformace o Covidu nás tedy ohrožují?
Rozlišujeme ve firmě tři základní skupiny. Ta první popírá existenci koronaviru obecně, tvrdí, že vlastně vůbec není. Ocituji vám titulek jednoho článku z ČeskoAktuálně.cz: Brazílie odhalila podvod s covidem. Prázdná nemocnice, prázdné rakve. Ten článek tvrdí, že nic takového, jako jsou mrtví na covid, v Brazílii není. Druhý typ dezinformací v naší metodologii uznává, že Covid-19 existuje, a soustředí se na jeho původ. Nabízí několik variant, například že Covid-19 byl uměle vytvořen a uměle rozšířen, ať už Američany nebo Číňany. A to proto, aby se svět dostal pod kontrolu WHO nebo řekněme americké vlády. Velmi silný je narativ protigatesovský, výklad, že tu jde o to, aby se světová populace dostala pod kontrolu elit. No a současně zdroje, které publikují tyto články, velmi často velebí ruský přístup. A ač se většinou staví proti tvůrcům vakcín ze Západu, tak ale současně glorifikují vakcínu ruskou. A konečně třetí typ dezinformace – ten ani nepopírá existenci viru, ani se nesoustředí na jeho původ, ale zpochybňuje závažnost tohoto viru a jeho potenciálních rizik. Je velmi kritický k proticovidovým opatřením.
A na tom je něco špatně? Otázka, jestli léčba už teď není pro společnost daleko škodlivější než to, co způsobí Covid, je úplně legitimní.
Jenže v oblasti dezinformací, manipulativního obsahu nejde jen o fakta. Jde i o to, jakým jazykem jsou příslušné články psány. Jestli jazykem, který podporuje nenávist nebo nesnášenlivost, a kterému říkáme polarizační jazyk, kdy už jen díky tomu, jak jsou napsány, podněcují nenávist vůči lidem s opačným názorem. To je přece podlá taktika. U té třetí skupiny bych ještě doplnil podnarativy, jak je detekuje náš algoritmus. Patří sem zpochybňování statistiky počtu a příčin úmrtí, zpochybňování přesnosti a výsledku testů. Patří sem popírání účinnosti nošení roušek. Objevil se dokonce text s odvoláním na údajnou americkou studii, podle níž prý nositel roušky podstupuje dvacetkrát větší riziko, že chytne covid, než když roušku nenosí. A poněvadž vím, že pochybnosti o nošení roušek se vyskytují i mezi lékaři, neodpustím si poznámku: Předpokládám, že ,kdyby šli ošetřovat pacienta s ebolou, tak by si všichni ti kritici z lékařské obce roušku vzali… Patří sem i démonizace očkování a vakcín, jako kdyby prostřednictvím vakcín ze světa nezmizely nemoci, na které dlouho umíraly miliony lidí. A nakonec, a vnímám to třeba i u vás, sem patří popírání účinnosti a potřebnosti epidemiologických opatření.
Proč vás to trápí natolik, že jste nabídli služby státu?
Věnujeme se tomu z přesvědčení, skutečně si myslíme, že ty dezinformace pro naši společnost skutečně škodlivé jsou. Ono v České republice se to navíc má tak, že zdroje, které publikují dezinformace ke Covidu jak na běžícím pásu, jsou tytéž zdroje, které trvale ukazují ruský pohled na věc, papouškují ruské narativy, samozřejmě ve prospěch Ruska.
Hypotéza, že virus byl vytvořený uměle, k získání vlády nad světem, je ruské provenience?
Když o tom člověk přemýšlí, tak přece vidí, že ani tenhle narativ nepřišel do vzduchoprázdna. Dezinformace o koronaviru jsou v českém prostředí až z 95 procent roznášeny skupinou asi dvaceti webů. Je to tatáž dvacítka, která víceméně tvoří dezinformační scénu u nás, která dlouhodobě brojí proti našemu demokratickému zřízení a proti hodnotám Západu, která nám dává za vzor Rusko, případně Čínu. Tak přesně tato scéna teď rozsévá i covidovské dezinformace. Podle mě ten překryv není náhodný.
A proč vylučovat a priori například hypotézu, že virus má umělý původ? Ze začátku se dokola opakovalo, že nákaza přeskočila na člověka na trhu s živými zvířaty ve Wuchanu, ta je, zdá se, mezitím opuštěna. Jsou lidí, dokonce vědci, kteří tvrdí, že Číňani skutečně manipulovali s virem v laboratoři a že jim buď unikl schválně, nebo nedopatřením.
Tak my nejsme schopni autoritativně určit, jestli byl virus vytvořen pomocí lidské ruky. To není těžištěm naší práce.
Před chvíli jste mi vyjmenoval soubor manipulativních témat, a mezi nimi zpochybňování statistik, kritiku vládních opatření, hypotézu o umělém původu viru.
Náš algoritmus nevyhodnocuje fakta samotná, ale to, jakým způsobem jsou podávána. My jsme schopni v režimu našeho algoritmu ukázat, které z těch článků v obrovském moři článků na dané téma publikovaných lze důvodně považovat za manipulativní. Jaké texty byly určeny k tomu, aby zvětšovaly trhliny, které i v naší společnosti přirozeně jsou. Ale nejsme státní orgánové, pouze chceme, aby někdo, kdo má vliv na veřejné mínění, od nás naši analytickou informaci vzal v potaz.
Jak vlastně určujete témata, která budete mapovat? To vám ministerstvo zdravotnictví vždycky dodá nějaký seznam, a vy pak mapujete cesty, způsob rozšiřování těch informací a domněnek?
Ne. Zadání nejde od ministerstva zdravotnictví., ani od státu, v tomto ohledu jsme proaktivní. My sami identifikujeme a sbíráme narativy, takové ty příběhy, jako že třeba šířit koronavirus pomáhají sítě 5G a podobné nesmysly. Ty my jsme si identifikovali ve firmě sami, a celou řadu z nich analyzujeme. A já předpokládám, že ministerstvo zdravotnictví si nás najalo proto, aby znalosti, které už máme, ono mohlo využít ve prospěch našeho obyvatelstva. My jsme šli proaktivně za ministrem zdravotnictví.
Neboli ty narativy a podnarativy, od původu covidu až ke zpochybňování vládních opatření, jste si sepsali vy sami v Semantic Visions?
Ano. A s některými těmi podnarativy nám už na jaře pomohla Fakulta sociálních věd Univerzity Karlovy.
Neutínáme tím, že některé otázky kolem koronaviru zařadíme mezi dezinformační narativy a podnarativy, předčasně debatu – už vzhledem k tomu, že koronavirus se objevil teprve před tři čtvrtě rokem, a leccos kolem něj je pořád nejasné?
Pozor. Mezi články identifikovanými našim algoritmem se vůbec neobjevují, skoro jako kdyby neexistovaly články z jiných než nám dávno známých dezinformačních zdrojů. Jen asi desetina námi zachycených článkůl byla publikována na všech těch ostatních téměř 5000 českých webech, které sledujeme. Přičemž názory na blozích mezi dezinformace vůbec nezařazujeme. Myslím, že pokud nejste pravidelný čtenář pravdive.eu, CZ24.news, Pravého prostoru, Sputniku a podobně, tak se k článkům, které náš algoritmus vyhodnotil jako dezinformace, vůbec nedostanete. Co formulujete vy – jako že covid je tu s námi příliš krátkou dobu na to, abychom o něm všechno věděli -, to jsou určitě legitimní otázky, takže ani náš algoritmus je jako dezinformace nevyhodnocuje. Důležité je pochopit, že tento algoritmus nebere v úvahu jen fakta samotná, my nejsme fact-checkeři. On bere v úvahu především jazyk, jakým se informace podávají. Dám příklad Ameriky, abych se nedotkl nikoho odsud. Je myslím velký rozdíl, když napíšete, že Joe Biden je nepoučitelný socialista, a když napíšete, že Biden je kryptokomunistické prase. A ten rozdíl naše algoritmy vnímají. Když někdo napíše nenávistné věty typu: Ta německá kráva Merkelová, horší než Hitler atd., tak my to prostě vyhodnotíme jako obsah nebezpečný pro společnost. Můžu vás uklidnit, náš algoritmus označuje jen velké extrémy. Řekl bych, že takové, které s demokratickým právem na diskusi nemají nic společného.
Takže kdybych napsal, že Merkelová zneužívá koronaviru k prosazení nějaké určité politiky – například společné dluhopisy v EU – a odpustil si tu krávu, váš algoritmus mě nezaeviduje?
Přesně tak. Nejdeme ani tak po klíčových slovech, ale po celkovém kontextu.
Neboli jste vlastně takoví češtináři internetu – hodnotíte sloh, kompozici, výrazivo.
Do značné míry ano. Algoritmus nehodnotí jednotlivá tvrzení na základě využití statistiky, jak by si to možná představoval laik. Základem je takzvaná sémantická analýza, která pracuje s morfologií jazyka, významem slov, kontextem a podobně. v, celkový kontext a podobně.
A nejde právě tohle úplně principiálně proti svobodné diskusi, když se ze sebe někdo udělá arbitra stylu a stanovuje, co je ještě přijatelné a co už ne?
Já myslím, že nejde. Tipoval bych, že kdybyste články označené naším algoritmem za manipulativní respektive dezinformační viděl, že byste s obsahem velké většiny z nich nesouhlasil, protože byste si sám řekl, že to už bylo přes čáru.
To je možné, ale neosoboval bych si právo rozhodovat, co je možné psát a co už je fuj. Nota bene s úředním pověřením.
Za prvé my nejsme státní autorita, téhle činnosti se věnujeme z dobré vůle, poněvadž to cítíme jako problém. A chceme státu dát lepší poznání toho, co se v českém kyberprostoru děje. Jak by případně měl komunikaci s lidmi upravit. Například že té komunikaci vůbec nepomáhá, když vládní představitelé říkají každý něco jiného. V takovém prostředí se zdrojům, které se snaží rozdělit českou společnost, logicky pracuje lépe. Tady my poskytujeme ministerstvu zpětnou vazbu, aby upravilo komunikaci a svou informační politiku. Tak aby měla větší dopad na lidi.
Jak vlastně ten váš algoritmus pracuje co ho zajímá? Je to robot, do kterého vy vepíšete nějaké zadání?
Ano, je to robot naprogramovaný člověk, takže ten program nespadá do umělé inteligence. Pohybujeme se v oblasti strojové inteligence, která je pořád ještě chytřejší než inteligence umělá. Náš algoritmus je mimořádně složitý. Vynechám teď, jak se dostane k relevantnímu textu. Ale když už je u něj, když eliminuje reklamu a začne s textem pracovat, tak rozpozná, v jakém je jazyce, rozpozná, jaká témata jsou v něm diskutována. Pracuje s jazykem a snaží se přitom napodobovat práci v našem mozku. Mozek jsme si my lidé vytvořili pro lepší pochopení informací, a pro vytváření představ máme jazyk. Tak ten algoritmus pracuje s jazykem. Prostřednictvím morfologie jazyka pracuje se slovy a jejich významy, se slovními spojeními, a také s širším kontextem. Umí například rozpoznat, kdy jde o nenávistnou řeč. Výsledkem analýzy, kterou takto provedl náš robot, jsou metadata, informace o informacích. Ke každému článku tak 200, 300 metadat.
Můžete dát příklad?
Máte článek o Covidu-19. Algoritmus k tomu přiřadí hodnotu relevance. Například že se článek z 80 procent dotýká covidu. Vypíše další v textu nakousnutá témata: týká se pandemie, zápalu plic, lékařské techniky, plicních ventilátorů, úmrtí, vládních politik… Identifikuje zmíněné instituce a osoby. Zjistí, že se článek týká řekněme ministerstva zdravotnictví, že obsahuje vyjádření toho či onoho. Vypíše, na které zdroje se článek odvolává. Je toho hodně, z každého zpracovaného článku tak vznikne dlouhý seznam čísel. A s těmi algoritmus dál pracuje. Například ho zajímají všechny články, které se týkají nějaké instituce. A nás v Semantic Visions tradičně zajímají články obsahující dezinformační narativy. Z předchozí práce máme těch dezinformačních narativů – typu Rusko bylo vždycky obětí a nevedlo agresivní války – vypracovaných celou řadu. A podobným stylem jsme přistoupili k tématu Covid-19. Takže jsme schopni rozlišit téma covid obecně od manipulativního, nenávistného obsahu, jehož cílem je zmást v této věci veřejnost.
Zadání, z něhož robot pozná, co kolem covidu je manipulativní, tím ho ale krmí vaši lidé?
Přesně tak.
A dávají tam i kritiku vládních opatření, že jsou přehnaná? Tu kritiku jste jmenoval na začátku jako jeden z vašich podnarativů.
Ne ne ne. Teď nevím, jestli nechcete slyšet, co vám vykládám. Aby byl text uznán za dezinformaci, musí splňovat ještě i ty další dimenze, jako je třeba nenávistná řeč. Anebo tam musí být přítomen ještě další narativ, o němž empiricky víme, že tvoří součást repertoáru dezinformační scény. Takže do rastru nám například spadne autor, když napíše, že to je biologická zbraň, a současně tvrdí, že ta biologická zbraň byla vytvořena k oslabení role Ruska a křesťanství ve světě.
Jaký myslíte, že ta dezinformační scéna má v české populaci zásah?
Jsou na to průzkumy, jeden takový si nechalo loni zpracovat ministerstvo vnitra od STEM, a posléze ho nechtělo ani zveřejnit. Tento průzkum došel k závěru, že dezinformačním webům důvěřuje 29 procent našich občanů.
Mně zase připadá, že tu vaši dvacítku dezinformačních webů skoro nikdo nečte. A že okázalým bojem s dezinformační scénou se teď akorát vládě pomáhá šmahem delegitimizovat všechnu kritiku Prymulových opatření. Ale kritika zavřených škol prostě není totéž, co teorie o přenosu koronaviru přes 5G.
My ale jen zprostředkováváme znalost dění v českém kyberprostoru. Kapitána lodi taky bude zajímat, jaké jsou oceánské proudy, v jakých hloubkách a kde se nacházejí živiny. Abyste spustil sítě a našel v nich ryby, potřebujete o moři něco vědět. Jinak pracujete naslepo. A máte nejspíš naprosto zkreslenou představu, co se pod vámi vyskytuje. Vojáci na to mají speciální obrat: situační povědomí. My vládě pomáháme pochopit, co se na internetu s informacemi děje. A co z naší analýzy oni převedou do své politiky, je už jejich věc.
Firma Semantic Visions má kolem 30 zaměstnanců a chlubí se tím, že loni dostala grant od vlády USA, aby proškolila americké analytiky a seznámila je se svým know-how. Vrabel by teď rád v “boji proti dezinformacím” spolupracoval i s českým státem a zakázku od Prymulu považuje za první vlaštovku.
Odpovědět