Očista internetové žumpy. Umělá inteligence zatočí s falešnými zprávami

Pavel Škopek | 22. 8. 2018
Zakladatel největší světové sociální sítě Facebook Mark Zuckerberg se v sobotu oženil se svou dlouholetou přítelkyni Priscillu Chanovou.
Mark Zuckerberg.
Mark Zuckerberg se prezentuje jako filantrop a ochránce práv zvířat a lidí

Boj s falešnými zprávami, tzv. fake news, šířícími dezinformace připomíná boj s větrnými mlýny, nebo příslovečnou hydru, které, když useknete jednu hlavu, narostou dvě nové. Přestože se s nimi sociální sítě snaží bojovat, vymýtit se je nedaří. Pomoci by jim však mohl algoritmus vyvinutý na Michiganské univerzitě, který dokáže identifikovat falešné zprávy lépe než člověk.

(Ne)slušný internet. Ve virtuální komunikaci lidé snadno dají průchod emocím
Společnost

(Ne)slušný internet. Ve virtuální komunikaci lidé snadno dají průchod emocím

Systém umělé inteligence využívá speciální algoritmus schopný identifikovat charakteristické jazykové narážky ve falešných zprávách. V současné studii odhalil algoritmus falešné zprávy v 76 procentech, zatímco člověk jen v 70 procentech.

„Automatizované řešení by mohlo být důležitým nástrojem pro weby, které se potýkají s náporem falešných zpráv, často vytvořených buď pro generování kliknutí nebo pro manipulaci s veřejností,“ řekla Rada Mihalceaová, profesorka počítačových věd a inženýrství na Michiganské univerzitě, která za projektem stojí.

Zachycení falešných zpráv předtím, než mají reálné důsledky, může být obtížné. Zpravodajské agregátory a sociální média dnes silně spoléhají na lidské editory. Ti však často nemohou držet krok s přílivem zpráv. Navíc současné metody odhalování falešných zpráv často závisí na externím ověřování dat, což může být u nejnovějších příběhů obtížné. Často se stává, že v okamžiku, kdy je zpráva identifikována jako falešná, je škoda již napáchána.

Google prý zlepšil agregátor zpráv. V Česku přednostně nabízí dezinformační weby
Byznys

Google prý zlepšil agregátor zpráv. V Česku přednostně nabízí dezinformační weby

Jazyková analýza, kterou používá algoritmus, pracuje s jiným přístupem. Analyzuje kvantifikovatelné atributy jako je gramatická struktura, výběr slov, interpunkce a komplexnost. Pracuje rychleji než člověk a může být použit na různých typech zpráv.

„Mohl by uživatelům poskytnout odhad důvěryhodnosti jednotlivých článků nebo celého zpravodajského webu. Nebo by mohl být první linií obrany v zákulisí zpravodajského média označující podezřelé články pro pozdější přezkoumání. Šestasedmdesáti procentní úspěšnost připouští poměrně mnoho chyb, ale přesto může poskytnout cenný vhled, když je používán s lidmi,“ dodala Mihalceaová.

Nejtěžší bylo algoritmus vycvičit

Jazykové algoritmy, které analyzují psanou řeč, jsou dnes běžné. Skutečná výzva při vytvoření detektoru falešných zpráv pak není podle Mihalceaové ve vybudování samotného algoritmu, nýbrž v nalezení správných dat, pomocí kterých se tento algoritmus vycvičí.

Twitter zablokoval odkazy na některé weby. Ovčáček to srovnává s Protektorátem
Publicistika

Twitter zablokoval odkazy na některé weby. Ovčáček to srovnává s Protektorátem

Falešné zprávy se objevují a mizí velice rychle, což ztěžuje jejich shromažďování. Proces sběru dále znesnadňuje i to, že se vyskytují v mnoha různých žánrech. Například satirické zprávy se sbírají nejsnáze, ale to, že používají ironii a absurditu, je činí nejméně vhodnými pro trénování algoritmu na detekování falešných zpráv, které mají čtenáře uvést v omyl.

Nakonec si vědci vytvořili vlastní data. Online tým přitom přepisoval ověřené pravdivé zprávy na falešné pomocí postupů, které používají skuteční autoři fake news. Na konci tohoto postupu měli vědci k dispozici databázi 500 skutečných a falešných zpravodajských článků.

Falešné zprávy se šíří šestkrát rychleji než pravdivé, říká nová studie
Publicistika

Falešné zprávy se šíří šestkrát rychleji než pravdivé, říká nová studie

Následně nakrmili algoritmus dvojicemi tvořenými pravou a falešnou zprávou. Na nich se tak pomocí lingvistické analýzy naučil rozlišovat mezi pravdou a lží. Nakonec tým předložil algoritmu soubor pravdivých a falešných zpráv stažených z internetu.

Detaily o novém systému a databázi, kterou použili pro jeho trénink, se rozhodli vědci zveřejnit zdarma. Podle Mihalceaové by je mohli použít zpravodajské servery nebo jiné subjekty, aby si vytvořily své vlastní detekční systémy na falešné zprávy. Budoucí systémy by mohly být dále vylepšovány pomocí metadat, jako jsou odkazy a komentáře spojené s danou zprávou.

Twitter odmítá rušit účet konspirátora, jehož smazaly Facebook, Apple a Spotify
Byznys

Twitter odmítá rušit účet konspirátora, jehož smazaly Facebook, Apple a Spotify

Tagy Michiganská univerzita umělá inteligence