Informačná vojna

Umelá inteligencia Facebooku dokáže memy analyzovať, no dokáže im porozumieť? Technológia Rosetta od Facebooku analyzuje miliardy obrázkov, ktoré obsahujú text, no mémy sú pre umelú inteligenciu príliš zložité. Každý deň sa na sociálne siete nahrajú miliardy textov, fotografií a videí. Ide o množstvo informácií, ktoré ľudskí moderátori a ich overovatelia faktov nedokážu komplexne preosiať, kontrolovať a kontrolovať. Spoločnosti ako Facebook a YouTube sa už dlho spoliehajú na umelú inteligenciu, aby zabránili spamu, násiliu, kritickému obsahu a pornografii mimo ich platforiem!

Niečo ako systémovo kritický mém bez textu môže byť pre jeho superpočítače a ich algoritmy ťažké analyzovať a spracovať, pretože táto úloha vyžaduje výpočet niekoľkých rôznych vizuálnych prvkov súčasne. Automatizované systémy, takzvané bot systémy, musia rozpoznať a „čítať“ slová nad fotografiou, ako aj analyzovať a priradiť samotný obrázok. Mémy možno opísať aj ako komplikované kultúrne artefakty, ktoré je ťažké pochopiť mimo kontextu. Napriek výzvam, ktoré predstavujú, všetky hlavné sociálne platformy už používajú AI na ovládanie mémov, vrátane Facebooku, ktorý používa nástroj s názvom Rosetta na analýzu fotografií a videí, ktoré obsahujú text a titulky.

Podľa Facebooku sa Rosetta už používa na automatickú detekciu obsahu, ktorý porušuje smernice o nenávistných prejavoch. S pomocou Rosetta sa Facebook snaží kontrolovať používateľský obsah vrátane fotografií a videí a nielen textových príspevkov. Rosetta podporuje proces, v ktorom sa automaticky kontroluje, či obrázky a videá, ktoré obsahujú text, boli predtým označené ako „kritické“. Rosetta kombinuje technológiu OCR (optické rozpoznávanie znakov) s inými technikami strojového učenia na zobrazenie, spracovanie, klasifikáciu a priradenie textu na fotografiách a videách a na ich uloženie. Po prvé, OCR sa používa na určenie, kde je text v meme alebo videu. To im umožňuje rýchlo transformovať údaje a použiť ich „selektory“ na vyhodnotenie obsahu.

Keď Rosetta vie, kde sú slová, Facebook použije neurónovú sieť, ktorá dokáže porozumieť textu, jeho prepisu a významu. Tento text sa potom môže preniesť cez iné systémy, ako napríklad systém, ktorý kontroluje, či je mém vírusovou správou, ktorá už bola odhalená podľa ich pokynov. Vývojári a výskumníci Rosetta tvrdia, že nástroj teraz dokáže v reálnom čase extrahovať text z akéhokoľvek obrázka verejne nahraného na Facebook a rozpoznať text, ako aj „čítať“ jeho jazykový identifikátor vrátane angličtiny, španielčiny, nemčiny a arabčiny.

Rosetta dokáže analyzovať aj obrázky, ktoré obsahujú text v mnohých rôznych formách, ako sú fotografie protestných nápisov, jedálne lístky reštaurácií, výklady a ďalšie. Viswanath Sivakumar, softvérový inžinier na Facebooku, ktorý pracuje na Rosette, v e-maile uviedol, že tento nástroj funguje dobre na identifikáciu textu v krajine, ako je napríklad značka ulice, aj na memy – ale to druhé je náročnejšie. „V kontexte proaktívneho zisťovania nenávistných prejavov a iného obsahu, ktorý porušuje pravidlá, predstavujú obrázky v štýle meme komplexnejšiu výzvu AI,“ napísal.

Na rozdiel od ľudí, AI zvyčajne potrebuje vidieť desiatky tisíc príkladov, kým sa naučí dokončiť komplikovanú úlohu, hovorí Sivakumar. Memy však nie sú nekonečne kontrolovateľné, dokonca ani pre Facebook, a zhromažďovanie a ukladanie dostatočného množstva príkladov v rôznych jazykoch a emóciách môže byť tiež ťažké. Hľadanie vysokokvalitných správ je neustálou výzvou pre výskum umelej inteligencie v širšom zmysle. Dáta je často potrebné starostlivo ručne označiť a archivovať. Mnohé databázy sú tiež chránené autorským právom.

Aby sa Rosetta naplnila potrebnými údajmi a naučila sa jej užitočnosť, text spolu s jeho titulkami a miestami, z ktorých boli publikované, sú spojené do výpočtového procesu. Jednoducho povedané, vytvorili ste program na vytvorenie presne tých príkladov, ktorých obsah sa zdá sporný. To znamená, že celý proces je do určitej miery automatizovaný: jeden program automaticky vypľuje mémy a iný sa ich pokúša analyzovať. AI bude čeliť veľkým výzvam. Napríklad Rosetta čelí jazykom, ako je arabčina, ktorá sa číta sprava doľava, na rozdiel od iných jazykov, ako je angličtina alebo nemčina. Rosetta „prečíta“ arabčinu dozadu, potom Facebook po spracovaní obráti znaky. Tento trik funguje prekvapivo dobre a umožňuje jednotný model, ktorý funguje pre jazyky písané zľava doprava aj sprava doľava.

Automatizované systémy môžu byť mimoriadne užitočné na moderovanie obsahu a overovanie faktov, no nie sú vždy jednoduché. Napríklad WeChat používa dva rôzne algoritmy na filtrovanie obrázkov. Prvý, program založený na OCR, filtruje fotografie, ktoré obsahujú text o zakázaných témach, zatiaľ čo ostatné cenzurujú obrázky podobné tým na čiernej listine, ktorú pravdepodobne vytvorila čínska vláda. Prostredníctvom filtrov WeChat môžete jednoducho odstrániť vlastnosti obrázka, ako aj sfarbenie alebo zmenenú orientáciu. Rossetta od Facebooku je komplexná, ale pravdepodobne nie dokonalá. Systém sa dá obísť ťažko čitateľným textom alebo zdeformovaným písmom. Všetky algoritmy na rozpoznávanie obrázkov sú tiež stále potenciálne zraniteľné voči konfliktným príkladom, mierne zmeneným obrázkom, ktoré vyzerajú rovnako pre ľudí, ale spôsobujú zmätok AI.

Facebook a ďalšie platformy ako Twitter, YouTube a Reddit sú pod obrovským tlakom, aby strážili určité typy obsahu vo viacerých krajinách. V roku 2018 Európska únia navrhla nové zákony, ktoré by od spoločností sociálnych médií vyžadovali, aby odstraňovali teroristické príspevky do hodiny od oznámenia, inak im budú hroziť pokuty. Rosetta a ďalšie podobne automatizované nástroje už pomáhajú Facebooku a ďalším platformám dodržiavať podobné zákony v krajinách ako Nemecko. A vo svojej práci sa zlepšujú: Pred dvoma rokmi generálny riaditeľ Mark Zuckerberg povedal, že systémy umelej inteligencie Facebooku proaktívne zachytávajú len asi polovicu obsahu, ktorý spoločnosť odstránila. Zvyšok si ľudia musia najskôr označiť. Podľa Facebooku jeho nástroje AI odhalia takmer 100 percent spamu, ktorý odsudzujú, ako aj 99,5 percenta teroristického obsahu a 86 percent grafického násilia. Iné platformy, ako napríklad YouTube, dosiahli podobný úspech s automatickými systémami na rozpoznávanie obsahu.

To však neznamená, že systémy AI ako Rosetta sú dokonalým riešením, najmä pokiaľ ide o jemnejšie formy vyjadrenia. Na rozdiel od jedálneho lístka reštaurácie môže byť ťažké analyzovať význam mému bez znalosti kontextu, v ktorom bol uverejnený. Preto existujú celé webové stránky, ktoré ich vysvetľujú. Memy často obsahujú vtipy alebo sú veľmi špecifické pre určitú online subkultúru a jej morálne a etické pozadie. A umelá inteligencia stále nie je schopná porozumieť mému alebo videu tak, ako by to človek pochopil. Facebook sa zatiaľ bude musieť pri rozhodovaní o odstránení mému spoliehať na ľudských moderátorov a ich overovateľov faktov.

Preklad článku z magazínu Wired zo 14.09.2018. septembra XNUMX

(via Vale Rion)

„Dravens Tales from the Crypt“ už viac ako 15 rokov očaruje nevkusnou zmesou humoru, serióznej žurnalistiky – pre aktuálne udalosti a nevyvážené spravodajstvo v politike tlače – a zombíkov, ozdobených množstvom umenia, zábavy a punk rocku. Draven zo svojho koníčka urobil obľúbenú značku, ktorá sa nedá zaradiť.

Môj blog nebol nikdy navrhnutý tak, aby šíril správy, nieto ešte politický, ale pri aktuálnych udalostiach si nemôžem pomôcť a nezachytím tu informácie, ktoré sú inak cenzurované na všetkých ostatných kanáloch. Som si vedomý toho, že dizajnová stránka sa mnohým v tomto smere nemusí zdať „seriózna“, ale nebudem to meniť, aby som potešila „mainstream“. Každý, kto je otvorený informáciám, ktoré nie sú v súlade so štátom, vidí obsah a nie obal. Za posledné 2 roky som sa snažil poskytnúť ľuďom informácie dosť, ale rýchlo som si všimol, že nikdy nezáleží na tom, ako sú „zabalené“, ale aký je k tomu postoj toho druhého. Nechcem nikomu naliať med na ústa, aby som akýmkoľvek spôsobom splnil očakávania, takže si ponechám tento návrh, pretože dúfam, že raz budem môcť prestať robiť tieto politické vyhlásenia, pretože nie je mojím cieľom pokračovať takto navždy Nechám na každom, ako sa k tomu postaví. Môžete však jednoducho skopírovať a distribuovať obsah, môj blog bol vždy pod Licencia WTFPL.

Je pre mňa ťažké popísať, čo tu vlastne robím, z DravensTales sa za tie roky stal kultúrny blog, hudobný blog, shock blog, tech blog, hororový blog, zábavný blog, blog o nájdených položkách na internete, bizarný internet, trash blog, art blog, ohrievač vody, zeitgeistický blog , Šrotovací blog a blog s názvom grab bag. Všetko, čo je správne ... - a predsa nie. Blog sa zameriava hlavne na súčasné umenie v najširšom slova zmysle.

Pre zabezpečenie chodu stránky ste vítaní Darujte kreditnou kartou, Paypal, Google Pay, Apple Pay alebo inkasom/bankovým účtom. Veľká vďaka všetkým čitateľom a podporovateľom tohto blogu!