Jan Čurn a Jakub Balada: Jsme běžci na dlouhé trati

Jan Čurn a Jakub Balada: Jsme běžci na dlouhé trati

Informatika / rozhovor

Před necelými 20 lety si jako studenti vysnili, že budou společně podnikat. Dnes Jan Čurn a Jakub Balada vedou úspěšný startup Apify. Jejich technologii na stahování dat z webu využívají klienti z celého světa včetně velkých korporací, jako je Samsung nebo Microsoft.

Jakub Balada (vlevo) a Jan Čurn v kalifornském Mountain View (foto: archiv Apify)
Jakub Balada (vlevo) a Jan Čurn v kalifornském Mountain View (foto: archiv Apify)

Web je plný informací, k velké části obsahu se ale nedá dostat jinak než manuálně – procházením jednotlivých webových stránek. Pro stroje jsou data z webu obtížně čitelná. Toho si kdysi všimli Jan Čurn a Jakub Balada, když pracovali na svém školním projektu. A ukázalo se, že stejný problém netrápí jenom studenty, ale v praxi také řadu firem. Z původní studentské práce se tak o pár let později zrodila firma Apify. Technologie, za kterou stojí dva absolventi Matfyzu a jejich nyní už 80členný tým, dokáže sledovat a automaticky vyhodnocovat prakticky cokoli, co je zveřejněné na webu – od cen produktů přes nabídky nemovitostí, právní dokumenty až třeba po výroky politiků.

Nápad na vaše podnikání vznikl před lety na Matfyzu. Jak k tomu došlo? Jak jste se s Jakubem dali dohromady?

Jan Čurn: S Jakubem jsme se potkali a začali kamarádit v prváku na informatice na Matfyzu, tuším někdy v roce 2002. O pár let později jsme v rámci předmětu Softwarový projekt postavili nástroj, který dokázal procházet webové stránky nabízející ojeté automobily, automaticky z nich stahovat nabídky ve strukturované podobě a ty pak prezentovat na jednom místě ve webové aplikaci. Bohužel, náš nástroj byl postaven na takové proto-umělé inteligenci, která měla poměrně vysokou chybovost, takže výsledky nebyly moc přesné. Navíc jsme měli velmi naivní představu o tom, jak takový projekt komerčně rozjet. Mysleli jsme si, že to postavíme a lidi přijdou, jak se říká. Koneckonců bylo to v době, kdy slovo „startup“ v Čechách nikdo neznal, ve světě ještě nefungovaly žádné startupové akcelerátory a nebylo moc firem, od kterých by se know-how dalo naučit. Náš projekt nakonec skončil v šuplíku, já jsem odjel na doktorát do Irska a Jakub pokračoval ve studiu tady v Praze. Zůstali jsme ale v kontaktu a pořád nás lákalo společně podnikat. A tak jsme se někdy okolo roku 2011 rozhodli, že si ke studiu něco přivyděláme, a ještě s dalším kamarádem z Matfyzu jsme založili firmu na zakázkovou výrobu software.

Jakub Balada: Tenkrát jsme na zakázku vyvíjeli software pro korporace jako Oracle nebo Siemens, za což byly slušné peníze, ale stále jsme jenom prodávali náš čas. Naším snem bylo mít produkt, který by se prodával sám a ideálně do celého světa. Mezi referencemi na našem webu jsme stále měli Honzův projekt z Matfyzu. No a co se nestalo, postupně se nám začaly ozývat různé firmy, že by měly o podobnou technologii zájem, např. kvůli stahování dat z e-shopů nebo analýze nabídek na realitním trhu. Tehdy jsme začali tušit, že by to mohlo mít potenciál. Jenže stále tam byla ta vysoká chybovost, a tak Honza začal vyvíjet novou verzi, která již nepoužívala umělou inteligenci, byla zcela deterministická, a tudíž i výrazně přesnější. A tak vznikl zárodek našeho produktu.

Zaměřujete se na moderní techniky získávání a strukturování dat – web scraping a RPA. Co to konkrétně znamená?

J. Č.: Apify v podstatě umožňuje lidem automatizovat jakoukoli činnost, kterou mohou provést manuálně ve webovém prohlížeči. To lze využít pro extrakci dat z webu (web scraping), kdy robot automaticky prochází webové stránky a stahuje z nich data ve strukturované podobě. Web scraping využívají třeba firmy, které něco prodávají online a potřebují vědět, co dělá jejich konkurence. Stačí jim nastavit robota, který každý den nebo týden automaticky projde e-shop konkurence, získá z něj seznam produktů, jejich popis, fotky, ceny atd. Firma tato data pak může použít pro úpravu vlastních cen, zlepšení reklamy nebo pro nabídku nových produktů.

J. B.: Jde o to, že mnoho webových stránek a aplikací nemá žádné API (Application Programming Interface – rozhraní pro programování aplikací, které umožňuje výměnu informací ve strojově čitelné podobě; pozn. red.), byly postaveny pouze pro zobrazení, a tak z nich nelze snadno získat strukturovaná data nebo je zvenku programovat. Často jediný způsob, jak tyto webové stránky zvenku programovat, je pomocí automatizace operací, které by provedl uživatel v prohlížeči, např. vyplnění textu do formuláře, klepnutí na tlačítko nebo stažení souboru. A tomu se říká právě Robotic Process Automation (RPA). Hodí se to pro různé situace, např. existují produkty, které automaticky přistupují k vašemu internetovému bankovnictví přes web a spravují váš bankovní účet, například pro integraci účetního systému, protože banky často nenabízejí dostatečné API. Vlastně právě proto jmenujeme Apify – umožňujeme lidem vytvořit si vlastní API pro libovolnou webovou stránku.

Kde všude se tedy váš nástroj dá využít?

J. Č.: Nejjednodušší způsob, jak použít Apify, je pomocí předpřipravených nástrojů, které nazýváme „actory“. V našem obchodě jich máme už přes tisíc a umožňují např. stahovat data z Instagramu, TikToku, Google Search, ale i jiné úkoly zcela mimo web scraping, např. posílat emaily nebo validovat datasety. Pokud zákazník v našem obchodě nenalezne actor pro svůj problém, může si postavit vlastní – platforma Apify je zcela otevřená, nabízíme API, SDK pro Node.js a Python, spoustu dokumentace a tutoriálů. Pro většinu vývojářů je vytvoření nového actoru otázka pár hodin. Navíc k tomu mohou využít všechny již existující actory. Vývojářům také umožňujeme, aby své actory prodávali u nás v obchodě, a tak si zajistili vlastní pasivní příjem.

Zmínili jste, že vaši službu využívají například online obchodníci ke sledování konkurence. Spolupracujete ale také s neziskovými organizacemi…

J. Č.: Dobrý příklad je náš neziskový projekt Hlídač shopů. Je to extenze do prohlížeče, která na 30 nejpopulárnějších online obchodech v ČR, jako je třeba Alza.cz nebo Mall.cz, ukazuje přímo na stránce s produktem graf vývoje jeho ceny v čase. Takže díky tomu přesně víte, jestli je výrobek ve slevě nebo ne. Pro Hlídač shopů dodáváme data, která stahujeme přímo z webových stránek daných obchodů. Tento projekt mimochodem velmi pomohl tomu, aby obchody uváděly slevy přesně a pravdivě.

Jiný pěkný případ použití je naše spolupráce s americkou neziskovou organizací Thorn, která provozuje nástroj Spotlight pro hledání ztracených a zneužívaných dětí. Pro Thorn stahujeme obsahy inzerátů z amerických portálů nabízejících sexuální služby včetně fotografií a Thorn je pak schopen v této databázi vyhledávat ztracené děti. Tímto způsobem jsme už pomohli identifikovat více než 17 tisíc dětí.

Většina mladých startupů neskončí proto, že jim dojdou peníze nebo že je převálcuje konkurence. Končí hlavně proto, že se zakladatelé rozhádají nebo narazí na nějakou překážku a nemají vůli ji překonat.

Na začátku vašeho podnikání vám hodně pomohla účast v americkém akcelerátoru Y Combinator. Jak vás napadlo, že si pro rady zajedete rovnou do Silicon Valley?

J. Č.: To byla úplná náhoda. Y Combinator je nejprestižnější startupový akcelerátor na světě, který pomohl nastartovat firmy jako Airbnb, Stripe nebo Coinbase. A kromě toho provozuje i populární fórum Hacker News, které rádi čteme. Někdy v létě 2015 tam oznámili, že plánují udělat odlehčenou verzi svého programu nazvanou „Y Combinator Fellowship“, která bude určená pro startupy v ještě ranějších fázích vývoje. A protože jsou zvyklí dělat vše rychle, na přihlášku dali jen jeden týden. Y Combinator se nám vždy líbil, měli jsme zárodek produktu, který jsme chtěli rozjet, a tak jsme neváhali, sepsali přihlášku a poslali ji.

Bylo obtížné projít sítem výběrového řízení?

J. B.: Když skončil termín poslání přihlášek, dozvěděli jsme se, že se celkem přihlásilo 6 000 projektů z celého světa. Mysleli jsme, že nemáme šanci. Ale nějakým zázrakem nás vybrali jako jeden z 60 projektů na interview. I když to interview bylo možné absolvovat online, rozhodli jsme se, že na něj dorazíme osobně, abychom měli větší šanci.

A tak jste vyrazili 10 tisíc kilometrů na 10minutové interview…

J. Č.: Asi jsme udělali dobrý dojem, protože nás vybrali spolu s dalšími asi 30 projekty. To znamená, že jsme uspěli, i když šance byla asi jen 0.5 %. Dostat se do Y Combinatoru je statisticky těžší, než dostat se na Harvard. Ale stojí za to to zkusit.

V Americe jste strávili dva měsíce – jaké byly a co vám to přineslo?

J. Č.: Byla to pro nás neuvěřitelná zkušenost. Y Combinator svým startupům doporučuje trávit čas jen prací na produktu, diskusemi s uživateli, sportem a spánkem. Vše ostatní je ztráta času. A toho jsme se drželi a dva měsíce nedělali v podstatě nic jiného. Je neuvěřitelné, kolik se toho dá stihnout, když pracujete 14 hodin denně včetně víkendů. Nejde to sice dělat dlouhodobě, ale pár měsíců člověk zvládne, zvlášť když je mladý.

J. B.: Jde taky o to, že se potkáváte s lidmi z těch nejúspěšnějších startupů na světě, jako je třeba Sam Altman (společně s Elonem Muskem zakladatel laboratoře OpenAI zaměřené na výzkum umělé inteligence; pozn. red.), Garry Tan (první investor online směnárny kryptoměn Coinbase; pozn. red.) nebo Justin Kan (zakladatel platformy Twitch pro živé streamování videoher; pozn. red.). A když se vás takoví lidé zeptají, proč ten svůj produkt stále ještě neprodáváte online a v čem je problém, a navíc jste v obklopení desítek dalších extrémně tvrdě pracujících a namotivovaných lidí z ostatních startupů, tak zkrátka nechcete zůstat pozadu a také do toho dáte maximum, abyste měli každý týden, co nového ukázat.

J. Č.: V tom je největší síla Y Combinatoru – je to něco jako olympijské hry, jen místo sportovních disciplín soutěžíte v budování startupů. Prostě vás to posune k výkonu, o kterém jste nevěděli, že ho dokážete.

95 % českých startupů prý zkrachuje do roka od svého založení. Co je podle vás základem úspěchu a na jaká úskalí je třeba dát pozor?

J. Č.: Nejdůležitější je vydržet. Většina mladých startupů neskončí proto, že jim dojdou peníze nebo že je převálcuje konkurence. Končí hlavně proto, že se zakladatelé rozhádají nebo narazí na nějakou překážku a nemají vůli ji překonat. Budování startupu není sprint, ale běh na dlouhou trať, takový maraton na pět až deset let, kdy se emoce často mění z „dobyjeme svět“ na „jsme ztraceni“, často během jednoho dne. Je potřeba to takto brát.

J. B.: Samozřejmě, startupy musí rychle iterovat, a pokud např. zjistí, že původní myšlenka nefunguje nebo že trh pro jejich produkt není dostatečně velký, tak musí rychle udělat změnu. V podstatě nápad není ani tak důležitý jako zakladatelský tým. Nápad lze snadno změnit, zakladatelský tým a jeho schopnosti nikoli.

Co byste doporučili studentům, kteří chtějí rozjet vlastní podnik?

J. Č.: Všem začínajícím startupistům vždy doporučuji přečíst si knihu Startup Playbook od Sama Altmana. Tato krátká publikace krásně shrnuje celou filozofii Y Combinator ohledně budování startupů. A něco o tom vědí – pomohli jich vybudovat tisíce v celkové hodnotě přes 300 miliard dolarů, to je více než HDP České republiky. Obecně, Y Combinator je taková univerzita, kde učí, jak dělat startupy. A jsou v tom nejlepší na světě, mají tuny kvalitních materiálů, článků, videí atd. Dokonce pořádají i Startup School. Pokud začnete tam, určitě nic nezkazíte.

Firmu Apify jste založili před šesti lety. Jaké máte další plány?

J. Č.: Jsme stále teprve na začátku naší dlouhodobé vize vytvořit největší tržiště na světě, kde vývojáři mohou snadno vyvíjet a dodávat svoje automatizační softwarové roboty firmám, které jim za ně budou platit. Firmy v rozvinutém světě potřebují stále více dat a automatizace. A s tím jim nejvíce pomohou lidé, kteří takové nástroje umí budovat a používat, tedy vývojáři. V Apify se snažíme usnadnit výměnu služeb a peněz oběma těmto stranám. Firmám tím zlepšíme jejich podnikání a vývojářům umožníme si slušně vydělat. Takže práce máme před sebou ještě hodně a stále hledáme šikovné lidi, kteří nám s tím pomohou.

Co děláte ve volném čase? Pokud se tedy nějaký najde...

J. Č.: Od té doby, co se mi před třemi lety narodil syn, už volný čas nemám... Věnuji se rodině, rád hraji fotbal, i když ne moc dobře, běhám, chodím na koncerty, filmy, občas pivo s kamarády. Takové ty běžné věci.

J. B.: Když je možnost, tak rád plachtím na moři, nedávno jsem se zúčastnil mistrovství světa v námořním jachtingu. V létě pak s kamarády pořádáme dva festivaly – už přes 15 let hudební Studnice fest a nově také Hacker Camp.


Mohlo by vás také zajímat:

Nezůstávejte jen ve svém rybníčku, radí softwarový inženýr
Michal Šrajer: Chci, aby lidem bylo v práci dobře
Martin Balko: Od počítačových her jsem utekl