Filip Dvořák: Lidská mysl není pro AI nejlepším vzorem, v budoucnu objevíme efektivnější architektury

Filip Dvořák: Lidská mysl není pro AI nejlepším vzorem, v budoucnu objevíme efektivnější architektury

Informatika / rozhovor

Deset let strávil v zahraničí, kde pracoval pro technologické giganty i prestižní výzkumné instituce. Jako expert na umělou inteligenci (AI) se podílel třeba na projektech pro americkou výzkumnou agenturu DARPA. Teď nasbírané zkušenosti zúročuje v Praze. Filip Dvořák šéfuje startupu Filuta AI a chce demokratizovat umělou inteligenci.

RNDr. Filip Dvořák, Ph.D., vystudoval na Matfyzu umělou inteligenci a teď jako Chief Executive Officer vede v karlínském Zirkon Office Center projekt Filuta AI (foto: Tomáš Rubín)
RNDr. Filip Dvořák, Ph.D., vystudoval na Matfyzu umělou inteligenci a teď jako Chief Executive Officer vede v karlínském Zirkon Office Center projekt Filuta AI (foto: Tomáš Rubín)

„Rád se neustále inspiruji a učím nové poznatky o světě, proto jsem si vybral umělou inteligenci jako soubor přístupů, které nám umožňují o světě systematicky uvažovat, a jako nejlepší stavebnici, se kterou lze naše chápání světa modelovat,“ říká Filip Dvořák. Poté, co vystudoval Matfyz, zabýval se výzkumem na univerzitě v Torontu a v kalifornském Palo Alto Research Center (PARC). Pracoval i pro soukromé společnosti, ještě za studií pro Google nebo Microsoft a později například pro největšího dodavatele technologií v ropném průmyslu, americkou společnost SLB. Před dvěma lety se vrátil do Prahy a založil startup zaměřený na kompozitní umělou inteligenci. Jeho cílem je rozšířit AI i tam, kde je dosud nedostupná, do středních i malých podniků. S dalšími experty tak vyvíjí vlastní technologii, která bude umět detekovat a řešit problémy různého druhu v rekordním čase. Jeden rekord už má přitom český vizionář a nadšenec do sci-fi literatury za sebou – v loňském roce, jen pár měsíců po svém vzniku, získala jeho firma od investorů 56 milionů korun, v dané době v českém prostředí vůbec nejvyšší první investici.

Náš rozhovor vzniká v půlce srpna. Jak tráví léto zakladatel jednoho z údajně nejzajímavějších českých startupů? Dopřáváte si dovolenou, anebo trávíte letní měsíce spíš pracovně?

Léto je v naší branži jedno z nejaktivnějších období, vědci na univerzitách mají prázdniny, a tak se velká část špičkových konferencí odehrává právě v červnu, červenci a srpnu. Zrovna nedávno jsme se vrátili z Kolína nad Rýnem, kde jsme se účastnili největší herní konference Gamescom. Po pravdě, na dovolené jsem nebyl už dva roky, ale moje profese je současně i mojí vášní, takže pro mě koncept „dovolené od práce“ vlastně ztratil smysl...

Co vás přivedlo na herní konferenci?

Na Gamescom jsme měli vlastní stánek v české sekci spolu s herními studii působícími v ČR, jako je Bohemia Interactive nebo SCS Software. Trh počítačových her dlouhodobě výrazně roste a zvyšuje se i poptávka po autonomním testování. Jenom v roce 2023 se za testování her utratilo více jak deset miliard dolarů. Naši autonomní agenti jsou schopni hrát hry výrazně efektivněji než lidé a identifikovat v nich chyby včetně návrhů na jejich opravu.

Pracujete na technologii, která by měla zautomatizovat řadu procesů, a to s využitím tzv. kompozitní umělé inteligence. O co přesně jde?

Kompozitní umělá inteligence zkoumá problémy reálného světa a možnosti jejich řešení pomocí kombinace heterogenních modelovacích přístupů. V oblasti umělé inteligence je množství modelovacích technik a každá z nich se hodí na jiný typ teoretického problému. Problémy reálného světa v sobě ale kombinují několik teoretických problémů současně. Cílem kompozitní umělé inteligence je najít a udržovat to nejlepší mapování mezi reálnými problémy a kompozicemi problémů teoretických. Tato oblast je extrémně přínosná, i když v praxi málo řešená, je na ni totiž třeba mít vysokou expertízu v několika oborech umělé inteligence najednou; proto bylo dosud v AI trendem specializovat se na jednu techniku (kladivo) a tu používat na všechny problémy (vše je hřebík).

Kde konkrétně se takový přístup dá využít?

Zajímavou aplikací, na které jsme pracovali, je multimodální modelování v logistice. V Los Angeles jsme spojili toky v grafech reprezentující silniční síť s rozvrhováním vlaků a autobusů a modely strojového učení zachycující chování individuálních účastníků provozu. Naše kompoziční řešení mělo výrazně lepší výsledky než jiná řešení, díky tomu se nám něj podařilo získat i celosvětový patent.

To znamená, že například pro logistickou firmu dokážete vybrat nejoptimálnější způsob přepravy z bodu A do bodu B?

Nejkratší přeprava mezi dvěma body bývá elementární úlohou v logistických problémech. Nad tím ale vzniká bohatý repertoár „kompozitních“ aplikací. Například pro jednu taxi službu jsme nasadili řešení, které maximalizuje spokojenost pasažérů, řidičů i počet realizovaných jízd v rámci celé dané taxi sítě v reálném čase, a navíc dokáže predikovat, jaký řidič bude chtít vzít jakého pasažéra a za jakou cenu bude chtít pasažér jet se kterým řidičem. Dalším zajímavým problémem je automatická kategorizace strojírenských návrhů, kde zpracováváme stovky tisíc návrhů a velmi přesně dokážeme dohledat ty, které se nejvíce blíží návrhu novému, na který přišla našim továrním zákazníkům poptávka.

Kombinujete různé přístupy a jedním z nich je symbolická AI, údajně vůbec nejstarší druh umělé inteligence. V čem se liší oproti jiným přístupům?

Symbolická AI je souhrn modelovacích a rozhodovacích přístupů, které zachycují problémy pomocí abstrakce do explicitně popsaných matematických struktur, jako jsou například výroková a predikátová logika nebo omezující podmínky. Oproti tomu strojové učení typicky zachycuje modely formou aproximace řešící funkce (klasifikační a regresní úlohy), a hodí se tak na problémy, jejichž řešící funkce jsou spojité. Problémy reálného světa jsou složeny ze spojitých i nespojitých podproblémů a symbolická AI vždycky bude klíčovou metodikou, jak nespojité podproblémy řešit.

Přibližte to na něčem konkrétním…

Symbolická AI se hodí na problémy, jejichž řešící funkce je silně nespojitá. Tak třeba v symbolické AI se optimální naplňování rozvrhu univerzitních přednášek může dramaticky změnit i při velmi malé změně vstupu, například když konkrétní profesor nemůže učit konkrétní den v týdnu, ale ve strojovém učení, kdy rozpoznáváme kočku od psa, změna jednoho pixelu nepovede ke změně výstupu.

Dočetla jsem se, že se symbolická AI používá ve vesmírných technologiích. Kde jste se s ní v praxi setkal vy?

Symbolická AI, například v podobě plánování a rozvrhování, dlouho existuje v továrních a logistických prostředích, a je pravda, že vesmírné aplikace často motivovaly posun výzkumu. Například Mars Rover, který přistál v únoru 2021 na Marsu, využívá adaptivního plánování a jeho autonomní řízení je koncepčně blízké našim agentům, které používáme na testovaní her. V minulosti jsem pracoval pro SLB, největšího dodavatele technologií pro těžbu ropy, kde jsem nasazoval a patentoval autonomní plánování v několika byznys doménách.

Při odprodeji výzkumných výsledků komerční firmě se za tím, co člověk vybudoval, „zavře hladina“, to mi nevyhovovalo, chtěl jsem být blíž skutečným dopadům svojí vědecké práce.

Prý jste už v pěti letech hrál šachy a taky jste nějaký čas patřil mezi nejlepší české hráče StarCraftu… Co nasměrovalo váš zájem na umělou inteligenci?

V dětství na mě mohly mít vliv neustále docházející kostičky lega, což mě později navedlo až k objevení krásy nekonečného množství „kostiček“ matematických struktur… Jsem taky velký nadšenec do literatury a skoro dvě desetiletí jsem četl veškerou sci-fi a fantasy produkci, která se mi dostala do rukou. Velký vliv měl můj otec, který na mě coby vědec a průkopník moderních technologií přenášel svoje nadšení a kreativitu, a také matka, která působila ve vědeckém prostředí na Akademii věd.

Umělou inteligenci chápu jako horizont nejnovějších technologií, které nám pomáhají lépe chápat svět okolo nás a zlepšovat naši interakci s ním. Na tento horizont jsem byl orientovaný vždycky, a při studiu na Matfyzu jsem ho formálně označil za „umělou inteligenci“.

V jednom nedávném rozhovoru jste zmínil, že na Matfyzu jste konečně potkal lidi, kteří byli chytřejší než vy, a začal jste se opravdu rozvíjet. Jak moc a v čem vám Matfyz rozšířil obzory?

Především mi umožnil zorientovat se v množství matematických a informatických vědeckých směrů. Taky způsob uvažování, který se na Matfyzu učí, koníčky a inspirativní diskuse s kolegy a profesory daly základ životnímu nastavení, ke kterému jsem teď o 20 let později došel. Prostředí doktorandských kruhů mi bylo vždycky nejvíc blízké, ať už šlo o Matfyz, LAAS-CNRS, University of Toronto nebo Berkeley.

Jako vůbec první Čech jste získal uplatnění ve Výzkumném centru v Palo Alto (Palo Alto Research Center; PARC) v Kalifornii. Tam v minulosti vznikla řada klíčových technologií jako třeba první osobní počítač nebo laserová tiskárna. Jaké to tam bylo?

PARC (dnes spadající pod Stanford Research Institute) se nachází v samotném srdci Křemíkového údolí a byl navržený jako zázemí s maximálním pohodlím a financováním pro ty nejkreativnější vědce. Velká část informačních technologií, které dnes známe, je spjata s vědeckými výstupy PARCu. Měl jsem příležitost se tam potkat s vědeckými kapacitami, kteří za těmito výstupy stály, a u oběda s nimi probírat směřování technologií a taky s nimi spolupracovat na nových aplikovaných výzkumech. Byla to skvělá rozvíjející zkušenost.

Čím jste se tam zabýval?

Primárně jsem se věnoval kompozitní umělé inteligenci v oblasti logistiky. Vedl jsem AI na projektu TRANSNET financovaném ARPA-E, jehož cílem bylo zvýšení logistické efektivity bez zásahů do infrastruktury. Poté jsem se věnoval DARPA projektu zaměřenému na kompozitní umělou inteligenci v továrnách postavených z 3D tiskáren. A v mezičase jsme s několika kolegy v PARCu navrhli a realizovali vypuštění vlastního satelitu na orbitu pro monitorování gravitačních fluktuací a monitorování výpadků moderních čipů při expozici kosmickému záření.

Proč jste se po dvou letech v PARC rozhodl vrátit do soukromé sféry a později také zpátky do Prahy?

Z PARCu jsem odcházel, protože naše výzkumy končily jako takzvaně proof of concept, kdy se vyvinuté technologie a související patenty odprodávaly komerčním firmám, které pokračovaly s jejich nasazením na trh. Při odprodeji výzkumných výsledků komerční firmě se za tím, co člověk vybudoval, „zavře hladina“, to mi nevyhovovalo, chtěl jsem být blíž skutečným dopadům svojí vědecké práce. Je velmi naplňující vidět, že vaše technologie pomáhá světu, a prostředí deeptech startupu je pro to ideální platformou.

Do ČR jsem se vrátil, abych využil zkušenosti, které jsem nasbíral v USA, a propojil skvělé české technické talenty. Navíc ČR je krásné místo na život s rozumnými životními náklady, odkud se dá vyvíjet produkt, který má celosvětový dopad. S vědci pořád spolupracuji a díky tomu se naše firma může držet na špičce výzkumu v oblasti symbolické a kompozitní umělé inteligence – publikujeme nové výzkumy a klíčové technologie taky celosvětově patentujeme.

Vývoj umělé inteligence jde velmi rychle kupředu. Dnes jsou hitem jazykové modely, co může být trendem za nějakých deset patnáct let?

Klíčovou otázkou pro příštích 15 let bude, jak automaticky propojovat expertízu v různých podoblastech umělé inteligence do kompozitních řešení. Vědecký výzkum posledních desetiletí pomohl najít rozumná řešení v mnoha specializovaných oblastech a automatizace schopnosti využít koncepty z jedné oblasti v jiné odemkne obrovské množství hodnoty. Jazykové modely sehrají klíčovou roli jako transformátory mezi různými formálními systémy, což potenciálně umožní vznik kompozitních AI systemů, které se budou přibližovat našemu chápání „AGI“.

Jak dlouho ještě potrvá, než dojdeme k něčemu, čemu by se dalo říkat obecná umělá inteligence (Artificial general intelligence; AGI)? Kdy budou počítače schopné „myslet jako lidé“?

Zárodky obecné umělé inteligence se objevují už nyní v podobě modelů, které v sobě spojují strojové učení a jazykové modely, řešiče optimalizačních problémů a jazykový komunikační interface. Tyto systémy se budou postupně zlepšovat a svojí kvalitou přibližovat lidskému myšlení. Ačkoli lidské myšlení nemusí být tím nejlepším směrem a vzorem pro rozvoj obecné umělé inteligence, je to naše jediné srovnání, které máme k dispozici. V budoucnu očekávám, že objevíme efektivnější architektury, než je myšlení založené na biologických neuronových sítích.

Vnímáte jako reálnou hrozbu, že bychom jednou mohli stvořit něco jako Frankensteinovo monstrum?

Hlavní hrozbu vidím ve špatně zadaných cílech a jejich nevhodné interpretaci potenciální obecnou umělou inteligencí. Koncept Frankensteinova monstra často předpokládá rozvoj emocí, které jsou u lidí silně závislé na hormonální soustavě. Tato soustava je přitom evolučně velmi náchylná k „zadávání špatných cílů“. Doufejme, že zadávání cílů pro obecnou umělou inteligenci si budeme schopni ohlídat lépe, než to umíme sami u sebe.

Jak se jako odborník a běžný člověk připravujete na budoucí výzvy?

Snažím se držet v rovnováze svoji vědomou, fyzickou i emocionální část. Tělo není stroj v továrně, kterému dáte rozvrh a ono se podle něj řídí. Z dlouhodobého hlediska se proto snažím najít si čas na fyzické i mentální zotavení, což znamená, že si třeba rád přečtu novou sci-fi knihu, strávím víkend lezením po horách, zajdu si do sauny anebo se potkávám s přáteli a diskutuji s nimi i o jiných oborech, než je umělá inteligence.


Mohlo by vás také zajímat:

Finalistka „herních Oscarů“: Chci ve hrách upozorňovat na důležitá témata
Pham Huu Uyen: Bylo štěstí, že mě poslali na Matfyz
Jan Čurn a Jakub Balada: Jsme běžci na dlouhé trati