Speech 2 Face: Ako konštruovať tváre z hlasov

Speech2Face: Učíme sa tvár za hlasom, neurónová sieť sa učí asociácie tváre z hlasov a nakoniec môže vytvoriť tváre z hlasových záznamov. Funguje to tak zle v detailoch, že ste nedokázali rozpoznať ľudí, ale algoritmus pozoruhodne dobre triedi hlasové nahrávky podľa farby pleti, pohlavia a veku.

Čína už využíva rozpoznávanie tváre umelej inteligencie na prenasledovanie moslimských menšín a je samozrejme priekopníkom vo využívaní rozsiahlych opatrení dohľadu. Takýto algoritmus by pravdepodobne mohol identifikovať Ujgurov v telefónnej sieti pre čínske orgány, aj keď používajú zariadenia alebo čísla, ktoré im nepatria. Rekonštrukcia tvárí z hlasov bude spočiatku zábavná, ale kategorizácia davov pomocou umelej inteligencie podporovaná úryvkami digitálnych identifikátorov (napríklad hlas, fotografia alebo videoklip alebo štýl písania) ako sa už stalo) sa čoraz viac objavuje ako technológia hromadného sledovania. Triky by sa nemali skrývať v skutočnosti, že tieto technológie majú všetko, čo je potrebné na vytvorenie dystopie, aby orwellovské sledovanie skutočnými ľuďmi vyzeralo ako oslava narodenín dieťaťa.

Koľko môžeme odvodiť z výzoru človeka z toho, ako hovorí? V tomto príspevku študujeme úlohu rekonštruovať obraz tváre osoby z krátkeho zvukového záznamu hovoriacej osoby. Navrhujeme a trénujeme hlbokú neurónovú sieť na vykonávanie tejto úlohy pomocou miliónov prirodzených internetových / YouTube videí hovoriacich ľudí. Počas tréningu sa náš model učí korelácie hlasu a tváre, ktoré mu umožňujú vytvárať obrázky, ktoré zachytávajú rôzne fyzické atribúty hovoriacich, ako sú vek, pohlavie a etnická príslušnosť. Robí sa to spôsobom pod vlastným dohľadom, využitím prirodzeného spoločného výskytu tvárí a reči vo videách na internete, bez potreby výslovného modelovania atribútov. Vyhodnocujeme a číselne kvantifikujeme, ako - a akým spôsobom - sa naše rekonštrukcie Speech2Face získané priamo zo zvuku podobajú obrazom reálnych tvárí reproduktorov.

„Dravens Tales from the Crypt“ už viac ako 15 rokov očaruje nevkusnou zmesou humoru, serióznej žurnalistiky – pre aktuálne udalosti a nevyvážené spravodajstvo v politike tlače – a zombíkov, ozdobených množstvom umenia, zábavy a punk rocku. Draven zo svojho koníčka urobil obľúbenú značku, ktorá sa nedá zaradiť.

Môj blog nebol nikdy navrhnutý tak, aby šíril správy, nieto ešte politický, ale pri aktuálnych udalostiach si nemôžem pomôcť a nezachytím tu informácie, ktoré sú inak cenzurované na všetkých ostatných kanáloch. Som si vedomý toho, že dizajnová stránka sa mnohým v tomto smere nemusí zdať „seriózna“, ale nebudem to meniť, aby som potešila „mainstream“. Každý, kto je otvorený informáciám, ktoré nie sú v súlade so štátom, vidí obsah a nie obal. Za posledné 2 roky som sa snažil poskytnúť ľuďom informácie dosť, ale rýchlo som si všimol, že nikdy nezáleží na tom, ako sú „zabalené“, ale aký je k tomu postoj toho druhého. Nechcem nikomu naliať med na ústa, aby som akýmkoľvek spôsobom splnil očakávania, takže si ponechám tento návrh, pretože dúfam, že raz budem môcť prestať robiť tieto politické vyhlásenia, pretože nie je mojím cieľom pokračovať takto navždy Nechám na každom, ako sa k tomu postaví. Môžete však jednoducho skopírovať a distribuovať obsah, môj blog bol vždy pod Licencia WTFPL.

Je pre mňa ťažké popísať, čo tu vlastne robím, z DravensTales sa za tie roky stal kultúrny blog, hudobný blog, shock blog, tech blog, hororový blog, zábavný blog, blog o nájdených položkách na internete, bizarný internet, trash blog, art blog, ohrievač vody, zeitgeistický blog , Šrotovací blog a blog s názvom grab bag. Všetko, čo je správne ... - a predsa nie. Blog sa zameriava hlavne na súčasné umenie v najširšom slova zmysle.

Pre zabezpečenie chodu stránky ste vítaní Darujte kreditnou kartou, Paypal, Google Pay, Apple Pay alebo inkasom/bankovým účtom. Veľká vďaka všetkým čitateľom a podporovateľom tohto blogu!