Další díl seriálu Spojeni (s) Matfyzem představuje oceňovanou jazykovědkyni prof. Evu Hajičovou.
Vystudovala jste bohemistiku a anglistiku na Filozofické fakultě Univerzity Karlovy. Jak jste se dostala k počítačové lingvistice?
Může za to tak trochu můj manžel. Coby inženýr pracující v oblasti hardwaru se na mě vždycky díval trochu svrchu, protože byl přesvědčený, že pro budoucnost je potřebná technika a počítače, nikoli ta moje lingvistika. Když se na Filozofické fakultě otevíral dvouletý postgraduální kurz algebraické lingvistiky, připomnělo mi to, že jsem na gymnáziu inklinovala k matematice, a navíc jsem si řekla, že manželovi ukážu. Tehdy se mi tento obor zalíbil. V roce 1962 jsem mohla nastoupit do Oddělení strojového překladu a algebraické lingvistiky, které na Filozofické fakultě založil v roce 1959 prof. Petr Sgall, tenkrát odborný asistent.
Existovala už tehdy spolupráce s Matematicko-fyzikální fakultou?
Petr Sgall měl takové dvě malé skupiny. Jedna byla na Filozofické fakultě a druhá právě na Matfyzu. Úsilí a osobní zapojení Petra Sgalla bylo velmi silné a fakt, že vznikalo něco nového, vyvolávalo velký zájem. Jádra se postupně zvětšovala, až se nakonec v lednu 1968 sloučila v Laboratoř algebraické lingvistiky Karlovy univerzity.
Z politických důvodů byla po srpnu 1968 laboratoř zrušena a její pracovníci v roce 1972 přesunuti z Filozofické fakulty na Matfyz. Jak jste se jako lingvisté s matfyzáky sžívali?
Tenkrát se o nás zasloužili dva lidé – prof. Fabian, tehdejší děkan Matematicko-fyzikální fakulty, a prof. Koubek, tehdejší prorektor. Díky nim jsme jako jednotliví pracovníci mohli na Matfyz přejít. Sice jsme nesměli učit a přijímat zahraniční návštěvy, ale přestup nás zachránil.
S matfyzáky jsme postupně navázali dobré vztahy, přestali jsme být cizorodým prvkem a po malých krůčcích se naše situace vylepšovala. I když jsme bezesporu měli matematické myšlení, byli jsme až na výjimku lingvisté, takže jsme se museli snažit.
Co považujete za největší úspěch české počítačové lingvistiky?
Na to se těžko odpovídá. V teoretické rovině by to byl asi pojmový rámec pro formální popis přirozeného jazyka, tzv. funkční generativní popis jazyka, jak ho formuloval na počátku 60. let Petr Sgall a který v podstatě rozvíjíme dodnes. Sgallovská škola dala světu formální popis informační struktury věty, v češtině se tomu říká aktuální členění. Ve formálním popisu jazyka se tomuto jevu dostalo pozornosti poprvé právě v Praze. V lingvistice je to dodnes jeden z nosných směrů výzkumu.
Za další velký úspěch považuji zrod Pražského závislostního korpusu. Vznikl jako druhý počítačový korpus na světě, po Penn Treebank v Pennsylvánii. Tento rozsáhlý soubor textů využívají jednak lingvisté pro zkoumání jazyka, jednak se na jeho základě vyvíjejí programy, které jsou užitečné pro jiné oblasti, například pro vyhledávání informací, strojový překlad nebo výukové programy pro učitele. Dnes u nás máme několik korpusů, a tak se už začíná mluvit o Prague Family of Treebanks.
Ústav formální a aplikované lingvistiky se od počátku podílí i na projektu Malach. Jak vznikl?
Natáčení filmu Schindlerův seznam přivedlo režiséra Stevena Spielberga k myšlence založit nadaci a poskytnout peníze na uskutečnění dvouhodinových video rozhovorů s přeživšími holocaustu. Těch rozhovorů nakonec vzniklo asi 52 tisíc v 35 různých jazycích. Tak rozsáhlý materiál bylo potřeba nějak zpracovat a bylo jasné, že to nepůjde jinak než počítačově.
Zásluhou prof. Freda Jelinka vznikl v USA vědecký projekt Malach (Multilingual Access to Large Spoken Archives), který se toho měl zhostit. Prof. Jelinek je velkou postavou počítačové lingvistiky. Po válce s matkou emigroval do USA, ale pořád se cítil jako Čech. V IBM Research Centre se zabýval strojovým překladem, což nás spojilo dohromady. V USA se na projektu Malach podílela Univerzita Johna Hopkinse v Marylandu, na kterou prof. Jelinek z IBM Research Centre přešel, a díky iniciativě prof. Jana Hajiče se mohl zapojit i náš ÚFAL a plzeňská univerzita.
Všechny rozhovory jsou teď uloženy na University of Southern California a vedle toho bylo zřízeno asi 20 – 30 center po celých Spojených státech, která k dokumentům poskytují vzdálený přístup. V Evropě jsou tato centra tři, z toho jedno právě na Matfyzu v Praze. Materiál, který se postupně rozrostl o výpovědi pamětníků dalších genocid, je dnes v podstatě otevřený všem, ne jen badatelům nebo židovské komunitě. Centrum vizuální historie Malach pořádá programy pro školy, učitele i veřejnost. V tom vidím i hlavní smysl celé této iniciativy – dbát na to, aby se nezapomnělo.
Co vás osobně nejvíc baví na počítačové lingvistice?
Mně se na lingvistice vždycky líbilo, že se musí opírat o nějaký materiál. Jazyk je celek, který má svou strukturu a přesné zákonitosti. Ty je možné objevovat a přesně popisovat. Zní to možná směšně, když v 83 letech říkám, že mě pořád baví analýza diskurzu. Ale je to pravda. A také mě těší, že můžu jazyk zkoumat na různých rovinách a ty pak propojovat dohromady.
Jak se díváte na vztah pedagog-student?
Pro mě je velmi důležitá slušnost a vzájemný respekt mezi kolegy i v poměru ke studentům. A já doufám, že jsem se toho ve svém životě držela. Nikdy jsem vůči studentům neměla pocit nadřazenosti. Někdo mě možná považoval za příliš kompromisní, ale když si stojíte za svým, tak pak je i ten kompromis slušný.
prof. PhDr. Eva Hajičová, DrSc. (* 23. 8. 1935)
Působí jako profesorka lingvistiky v Ústavu formální a aplikované lingvistiky MFF UK. Zabývá se obecnou a komputační lingvistikou, zejména sémantickou strukturou věty a studiem diskurzu.
Ústav formální a aplikované lingvistiky deset let vedla (1990 – 2000). Čtyři roky stála v čele Centra komputační lingvistiky MFF UK (2000 – 2004). Byla první prezidentkou Evropské sekce Asociace počítačové lingvistiky (1982–1987), prezidentkou Asociace počítačové lingvistiky (1998) a Societas Linguistica Europaea (2006–2007). Předsedala Pražskému lingvistickému kroužku. Je členkou Mezinárodního výboru počítačové lingvistiky, řady vědeckých společností a redakčních rad mezinárodních vědeckých časopisů.
Obdržela několik ocenění, mj. mezinárodní cenu Alexandra von Humboldta (1995), stříbrnou medaili Karlovy univerzity (2000), medaili I. stupně MŠMT ČR (2007), cenu za celoživotní dílo Asociace počítačové lingvistiky (2007), medaili Josefa Hlávky (2017) a mezinárodní cenu Antonio Zampolli Prize za celoživotní přínos v oblasti korpusové lingvistiky (2018).