Čerstvý absolvent Matfyzu Martin Spišák se stal absolutním vítězem mezinárodní soutěže diplomových prací z informatiky IT SPY. Za návrh algoritmu, který vylepšuje personalizované doporučování zboží na internetu, získal nejen hlavní cenu, ale zvítězil také ve dvou vedlejších kategoriích.
Martin Spišák obstál v konkurenci více než tisícovky dalších prací, které v loňském roce obhájili studenti informatiky na českých a slovenský univerzitách. Porotu IT SPY zaujal „perfektní myšlenkou a dotažením do praxe“. Ve své diplomové práci Zlepšování škálovatelnosti doporučovacích systémů pomocí řídkých přibližných inverzů navrhl algoritmus, který vylepšuje personalizované doporučování pro velké e-commerce.
„S rostoucím vlivem personalizace je důležité zlepšovat kvalitu doporučování. Avšak kvalitativní zlepšení často přináší i nárůst výpočetních nákladů, což znemožňuje, aby byly nejlepší modely využívány ve velkých a v praxi běžných doménách. To se týká i jednoho z nejlepších modelů současnosti, kterým je EASE). Na velkých doménách však můžeme vynechat většinu parametrů EASE bez ztráty kvality – stačí kostra klíčových parametrů,“ vysvětluje Martin Spišák. V diplomové práci, kterou vedl dr. Ladislav Peška z Katedry softwarového inženýrství, ukázal, že tuto „kostru“ je možné efektivně nalézt pomocí moderních výpočetních technik.
Nový model SANSA komprimuje EASE do o několik řádů menší řídké struktury a dá se využít na 100x větších katalozích než doposud, což z něj dělá ideální produkt ke komerčnímu využití. Zároveň však tento model může sloužit také výzkumníkům jako cenově dostupnější alternativa.
„Jako vedoucí práce musím říct, že mi bylo velkou ctí s Martinem spolupracovat. Moje práce byla v jeho případě až překvapivě snadná – vlastně jsem jen „moudře“ kýval hlavou a sem tam ho trošku popíchnul s tím, co by se ještě dalo zkusit, a pak jen spokojeně sledoval, co Martinovi pod rukama vzniká,“ okomentoval na Facebooku úspěch svého svěřence dr. Peška.
Projekt Martina Spišáka již našel praktické uplatnění u významného českého e-shopu. Zatímco srovnatelné algoritmy bylo doposud možné efektivně využívat zejména u menších a středních e-shopů, nový model byl úspěšně otestován v obchodu s několika milióny položek. Absolvent Matfyzu si díky tomu vysloužil v soutěži IT SPY nejen titul absolutního vítěze, ale také ocenění Magenta Award for Excellence in IT a Cenu Raiffeisenbank v oblasti aplikace umělé inteligence, které udělují partnerské společnosti.
Více k tématu přibližuje Martin Spišák:
Co pro vás znamená vítězství v soutěži IT SPY? Co vám soutěž dala?
Vítězství mě velmi příjemně překvapilo. Konkurence v soutěži byla velmi silná a práce tak různorodé, že muselo být opravdu těžké určit vítěze. Jsem moc rád, že se právě moje diplomová práce setkala s tak pozitivním ohlasem. Rád bych ještě poděkoval svému vedoucímu Ladislavu Peškovi, který mě motivoval, abych se nespokojil jen s „dobrými“ výsledky. Děkuji také dalším spoluautorům našeho navazujícího článku – prof. Miroslavu Tůmovi a Antonínovi Hoskovcovi a Radkovi Bartyzalovi ze společnosti GLAMI.
Účast v soutěži mi přinesla cenné zkušenosti a feedback – například musím ještě zapracovat na svých prezentačních schopnostech.
Jak dlouho jste pracoval na vývoji modelu?
Vývoj modelu SANSA trval přibližně půl roku. Nejtěžší částí byla rozhodně rešerše již existujících numerických metod a implementací. Kromě toho mi dala zabrat i implementace chybějících částí, která vyžadovala několik triků, a intenzivní testování a profilování vznikající metody.
Váš nástroj již slouží v praxi. Kde všude se dá využít?
Model jsme úspěšně aplikovali u industry partnera GLAMI, kde funguje na doporučování z milionů módních produktů. Oproti jiným metodám dokáže doporučovat produkty i uživatelům s nízkým počtem interakcí z tzv. long-tailu (předměty s malým množstvím interakcí). Tato vlastnost se hodí právě v doménách s obrovskými katalogy, kde long-tail tvoří absolutní většinu katalogu. Chceme také podpořit využití naší metody v průmyslu a mezi výzkumníky, a tak jsme model zveřejnili jako open-source.
Kromě toho si myslím, že metoda najde uplatnění i mimo doporučovací systémy. Jejím základem je efektivní výpočet „kompaktního“ odhadu velké inverzní matice, který má různé aplikace v numerice, statistice nebo například pro zpětnovazební učení (konkrétně contextual multi-armed bandits algoritmus).
Co s nástrojem zamýšlíte dál?
Aktuálně pracujeme na vydání Python balíčku a dále chceme náš model implementovat do známých frameworků pro doporučovací systémy. Stále je však prostor pro zlepšení efektivity, tomu se chceme věnovat do budoucna.
V září jste na Matfyzu obhájil diplomovou práci. Kam teď povedou vaše kroky?
Pokračuji v GLAMI, kde jsem začal pracovat už během studia a kde jsme spolupracovali i na článku. Jako Machine Learning Engineer se zabývám doporučováním pro naše zákazníky. Uvažuji také o doktorském studiu, během kterého bych mohl víc času věnovat vylepšení naší metody. Zatím mám však dost práce naběhnout do produkčního koloběhu, a tak na finální rozhodnutí ještě nebyl čas.
Do 14. ročníku IT SPY bylo nominováno téměř 1200 prací, z nichž ambasadoři vysokých škol vybrali nejprve 49 projektů a poté deset finalistů. Ti své práce představili minulou středu v malostranském refektáři.