Strojové zpracování obrazu je jednou z významných součástí velmi bouřlivě se rozvíjející vědní disciplíny zvané „počítačové vidění“. Její kořeny a inspirace můžeme hledat v televizní technice, kybernetice nebo výpočetní technice. Při řešení konkrétních problémů se však nezanedbatelně uplatňují principy klasické optiky či obecně fyzikální zákonitosti, pochopitelně za silné podpory matematických a numerických metod.
Prostředky zpracování obrazové informace mohou vytvářet například zpětnou vazbu pro získání informace o průběhu a zejména pak kvalitě průmyslové výroby. Rostoucí náročnost výroby a neustále stoupající požadavky na kvalitu výrobků a jejich přesnost vytvářejí ideální prostor pro praktické uplatnění metody zpracování obrazových informací (angl. Image Processing) s cílem dále je využít při řízení konkrétní průmyslové aplikace.
Typickou úlohu zpracování obrazu můžeme obvykle rozdělit do tří základních kroků, kdy je vstupní obraz podroben:
- předzpracování (např. diskretizace, prahování, hledání hran),
- segmentaci (hledání oblastí a objektů v obraze),
- rozpoznávání a porozumění obrazu.
Pro každou část lze použít celou řadu metod, algoritmů a konkrétních předem vytvořených postupů v daném programovém prostředí. Vždy je však třeba počítat s tím, že každá úloha může mít své specifické vlastnosti, vyžadující řadu dílčích změn nebo doladění konkrétních postupů a algoritmů. Důležité je rovněž optimální nasvícení scény.
V oblasti řešení úloh a algoritmů lze aplikovat řadu postupů. V tomto mini seriálu se proto zaměříme jen na některé vybrané zajímavé metody zpracování obrazových informací, které už byly v praxi použity, například při kvalitativní kontrole hromadné výroby bižuterních kamenů. Díky tomu narazíme na některé méně tradiční postupy.
„Fuzzy“ svět kolem nás
V běžném životě jsme každodenně vystavováni potřebě zpracovávat informace a konfrontovat je s celou řadou situací, v nichž musíme rozhodovat na základě svých zkušeností a získaného souboru zkušeností. Tato znalostní báze (někdy se setkáme i s pojmem expertní systém) se formuje a doplňuje celý život. Nové informace se do ní přidávají a řada z nich se modifikuje, takže dochází k její aktualizaci. Nabytých zkušeností pak využíváme v podstatě automaticky a významnou roli při tom hraje způsob reprezentace.
Důležitou funkcí znalostního systému je tzv. inferenční mechanismus, kdy podle jistých faktů usuzujeme souvislosti a následně vybíráme správnou konkrétní znalost ze znalostní báze s cílem řešit zadaný problém. Je zřejmé, že ne vždy bude tato báze obsahovat všechny potřebné informace, proto je důležitou vlastností inferenčního mechanismu schopnost pracovat s neurčitostí (dosud neznámou skutečností).
Neurčitost vyplývá zejména z nepřesnosti, neúplnosti nebo nekonzistentnosti údajů, z určité nejasné nebo nejisté znalosti, resp. z vágnosti pojmů. Protože v reálném světě je neurčitost vždy v různé míře přítomna, musíme se s ní naučit pracovat a jeden z možných přístupů nabízí fuzzy logika. Ta dnes v praxi nachází uplatnění mimo jiné v oblastech řízení a regulace technologických procesů, například v podobě tzv. fuzzy regulátoru.
Za výhodu fuzzy regulátoru lze považovat zejména relativní jednoduchost jeho návrhu. Díky tomu dnes již existuje velké množství aplikací fuzzy logiky od řízení praček přes automatické řízení výtahů v mrakodrapech až k vesmírným programům. Za příklad můžeme uvést použití fuzzy regulátoru pro řízení automatického ramene při opravě Hubbleova teleskopu.
Zajímavou a nesnadnou úlohou je sdělovat nabyté znalosti a zkušenosti jinému člověku nebo je uložit (třeba v podobě algoritmu) do automatu (obvykle počítače), aby je bylo možno využívat obecněji. Při sdělování znalostí a zkušeností používáme nejčastěji (a zejména při sdělování jinému člověku) nástrojů přirozeného jazyka. Zde lze také spatřovat důvod a motivaci pro reprezentaci znalostí v podobě jazykových (někdy se říká lingvistických) pravidel typu JESTLIŽE – POTOM (angl. IF – THEN).
Velkou předností fuzzy logiky je její schopnost matematicky popsat a formulovat informace vyjadřované slovně a pracovat tak s nejednoznačnými pojmy, velice často využívanými v lidské řeči. Ve fuzzy logice lze také s úspěchem řešit smírně problémy typu „pravdu mám buď já, nebo ty“ výsledným konstatováním, že „každý má trochu pravdu“.
Fuzzy logika a staří filozofové
Zkoumání shody mezi tvrzením a skutečností, tedy hledání pravdy a pravdivosti, je velmi staré a patří mezi základní otázky nejen v soudnictví, ale i ve filozofii a vědě. Jako jeden z prvních klasických filozofických pohledů na pravdivost vyslovil Aristotelés (384 př.n.l.-322 př.n.l.): „Pravdivé je říci o něčem, co je, že to je, a o něčem, co není, že to není.“ Z tohoto výroku lze vyvodit, že tvrzení může být buď pravdivé, nebo nepravdivé a nějaká jiná (třetí) možnost neexistuje.
Podobně se vyjadřoval ve středověku katolický filozof a scholastik Tomáš Akvinský (1225-1274), v novověku pak astronom, fyzik a filozof Galileo Galilei (1564-1642). Učenci se domnívali, že přesné změření určité veličiny je otázkou píle, času či metodiky. Hlubším zkoumáním a poznáváním rozmanitosti světa však postupně docházeli k poznání, že čím přesněji změří jednu veličinu, tím méně ví o jiné. Tuto komplementaritu docela výstižně vyjádřil Albert Einstein (1879-1955) ve svém aforismu: „Čím lépe matematické zákony popisují realitu, tím jsou méně přesné, a čím jsou přesnější, tím hůře popisují realitu.“
Snad nejznámější a nejpoužívanější formulací uvedených úvah ve fyzice je Heisenbergův princip neurčitosti, který formuloval v roce 1927 německý fyzik (nositel Nobelovy ceny za kvantovou fyziku z roku 1932) Werner Heisenberg (1901-1976). Podle tohoto základního principu kvantové mechaniky je nemožné současně přesně změřit polohu částice a její hybnost. Čím přesněji tedy určíme jednu z veličin, tím méně toho víme o druhé. Znamená to (bohužel), že ani sebelepší zdokonalení měřicí techniky nedovolí získat přesné výsledky.
Přirozeným výsledkem dosavadních filozofických úvah bylo hledání pravdy či nepravdy, tedy jakási forma dvouhodnotové logiky. Při aplikaci matematických poznatků se ovšem často setkáme s problémem přílišné složitosti popisu zdánlivě jednoduchých jevů. Ukazuje se totiž, že přesnost za každou cenu je násilná. Významný britský matematik, filosof a spisovatel (nositel Nobelovy ceny za literaturu za rok 1950) Bertrand Russell (1872-1970) ve své práci Vagueness z roku 1923 popsal jako jeden z prvních pojem neurčitosti neboli vágnosti.
Dalším, kdo použil pojem vágnosti v logickém popisu skutečnosti, byl matematik a filozof Max Black (1909-1988) narozený v Ázerbajdžánu. Od tří let s rodiči žil ve Francii, později v Německu, ve Velké Británii a nakonec v USA. Ve své práci Vagueness: An exercise in logical analysis z roku 1937 se zabýval povahou a pozorovatelností vágnosti a jejím významem pro logiku.
Nemalou měrou do teorie matematické logiky přispěly práce matematiků a logiků soustředěných v tzv. Lvovsko-varšavské škole (dnes ukrajinský Lvov byl až do roku 1939 významným polským městem). Její vůdčí osobností byl hrdý lvovský rodák, významný matematik (a dokonce jistou dobu i ministr v polské vládě) Jan Łukasiewicz (1878-1956). Ten rozpracoval mimo jiné vícehodnotovou logiku, nejprve s pravdivostními hodnotami (0, ½, 1), kdy mluvíme o tzv. ternární logice, později s pravdivostními hodnotami z intervalu <0, 1>. Není bez zajímavosti, že v roce 1920 publikoval například způsob bezzávorkového zápisu logických, aritmetických a algebraických výrazů, tzv. polskou notaci, kterou v 70. letech použila firma Hewlett-Packard u svých kalkulaček.
Našemu (řekněme zjednodušeně evropskému), uvažování vycházejícímu z klasické Aristotelovské dvouhodnotové logiky „pravda – nepravda“ je poněkud cizí uvažování založené na logice s větším počtem úrovní „hodnot pravdivosti“. V některých orientálních filozofiích je naopak tento způsob uvažování velmi přirozený. Příkladem může být klasická čínská (taoistická) filozofie vycházející z „dialektického“ soupeření dvou opačných, a přitom vzájemně se doplňujících sil Jin a Jang. Elementy Jin (ženská, tmavá, pasivní síla) a Jang (mužská, světlá, tvořivá síla) jsou popisem doplňujících se opaků, které se neberou doslovně. Každá věc živé i neživé části vesmíru je trochu Jin a trochu Jang. Všechny síly v přírodě mají oba dva stavy a tyto stavy jsou v neustálém pohybu.
Je jistě zajímavé, že významný impuls ke změně aristotelovského chápání pravdivosti přišel zprostředkovaně z oblasti odvěkých střetů kultur, z oblasti dědiců perské kultury. V roce 1965 totiž vyšel v americkém časopise Information & Control článek Fuzzy Sets, který odstartoval významnou etapu ve vývoji problematiky vágní logiky a množin. Autorem této práce byl matematik a profesor počítačových věd Lotfi Askar Zadeh (1921-2017), který se narodil v Baku, hlavním městě Ázerbajdžánu. V roce 1944 se L. A. Zadeh po studiích na teheránské univerzitě přesunul do USA, kde začal působit na význačných univerzitách. Jako první použil pro definici výkladu funkce příslušnosti do množiny místo původně používaného pojmu „vágní“ (vagueness) slovo „fuzzy“, tedy střapatý, ochmýřený. Toto slovo se pro svůj jednoznačný a dosud neotřelý význam ujalo i v jiných jazycích včetně češtiny.
Od roku 1965, kdy byla publikována první práce na téma fuzzy logiky, se ve světě objevila celá řada prací a monografií na toto téma. V současné době je fuzzy logika předmětem výuky v různých oblastech aplikací, je také zajímavé, že někteří autoři se vracejí k původním pracím J. Łukasiewicze a dále je rozvíjejí.
V dalším díle seriálu konkrétněji probereme aplikování některých metod pro zpracování obrazové informace.