Matykání: Rytíři svatého integrálu

Matykání: Rytíři svatého integrálu

Matematika / článek

Integrujete svisle, nebo vodorovně? Tato zdánlivě nesmyslná otázka nás dovede k poznání, že plocha pod grafem funkce se dá spočítat dvěma způsoby. Své jméno jim propůjčili dva rytíři matematiky: Bernhard Riemann a Henri Lebesgue.

Klasická komedie Monty Python and the Holy Grail začíná scénou, ve které král Artuš objíždí starobylé hrady a hledá rytíře za účelem celostátního pátrání po svatém Grálu. Hned před prvním hradem ho ovšem nevlídná hradní stráž nechce vpustit dovnitř a jak je u britského sdružení Monty Python zvykem, konverzace se během několika replik přesune do říše absurdní dada. Než se divák naděje, král Artuš a strážce hradu na sebe přes hradní příkop hulákají své názory na to, zda vlaštovka unese kokosový ořech, což má s původním problémem pramálo společného.

Když jsem se poprvé setkal s Lebesgueovým integrálem, připadal jsem si jako král Artuš ve zmíněné komedii. Místo abych se posunul v hledání svatého integrálu a naučil se nějakou super-raketovou metodu integrace, byl jsem svědkem jakési akademické diskuse, jejímž jediným výsledkem bylo, že pár naprosto bizarních a zhola nepraktických funkcí, které se klasickým (riemannovským) způsobem nedaly zintegrovat, najednou integrál jacobi mávnutím kouzelného proutku získaly.

Nicméně i přes mou subjektivní nevoli zůstává faktem, že Lebesgueův integrál se stal zlatým standardem integrování a pokud se někde v matematickém textu mluví o integrálu, rozumí se tím zpravidla ten Lebesgueův. Nejenže se dá aplikovat na širší třídu funkcí, ale má i lepší vlastnosti při konvergenci. Tedy máte-li posloupnost funkcí, která se v nějakém smyslu blíží k limitní funkci, tak byste chtěli, aby i příslušné integrály členů posloupnosti konvergovaly (a tady už je to konvergence čísel) k integrálu té limitní funkce.

Na tom, že Lebesgueova verze integrálu v matematice zvítězila, nemění nic ani fakt, že pro praktický výpočet se používá klasická Riemannova verze (buď numericky nebo přes primitivní funkci).

Lebesgueův integrál je také základním stavebním kamenem pro prostory funkcí, kterým se říká L2 a které si můžete představit jako funkce, pro které se dá spočítat integrál – v Lebesgueově smyslu – ze čtverce dané funkce. Na těchto funkcích je v podstatě vybudován matematický formalismus kvantové mechaniky (dá se pro ně zavést skalární součin, který v prostoru vlnových funkcí umožňuje používat geometrické metody).

V tomto Matykání rozvinu několik témat, o kterých už více méně byla řeč v předchozích dílech, ale protože myšlenku dvojího přístupu k integraci považuju za důležitou z hlediska ilustrace fungování matematiky, rozhodl jsem se shromáždit je pod jednou střechou.

Riemannův integrál

Zatímco derivace je v podstatě lokální záležitost, integrál se zajímá o globální vlastnosti dané funkce a počítá akumulovanou funkční hodnotu (tedy to, čemu někdy říkám spojitý součet). Geometricky si hodnotu integrálu funkce f(x) mezi dvěma body ab můžeme představit jako plochu pod grafem funkce a těmito dvěma body ohraničenou (obrázek vlevo: a = 0.2, b = 0.6).

Abychom si to mohli představit ještě názorněji, budeme v pravé části obrázku předstírat (jako jsme to udělali u limit), že osa x se skládá z diskrétních bodíků, které mají libovolně malé rozestupy Δx. No a my pak prostě pochodujeme podél grafu funkce od a = 0.2 do b = 0.6 s pytlem od brambor a příslušné funkční hodnoty do toho pytle házíme, abychom je mohli doma v klidu sečíst (a zjistit tak, kolik funkce mezi body ab vlastně máme).

Samozřejmě musíme nějak zohlednit rozestupy Δx mezi jednotlivými body, aby se nestalo, že ty rozestupy zmenšíme na polovinu a akumulovaná hodnota se rázem zdvojnásobí (neb se nám najednou v pytli ocitne dvakrát víc funkčních hodnot). Proto do toho pytle de facto házíme funkční hodnoty pronásobené těmi rozestupy: f(x) Δx.

Integrál je tedy spojitá verze diskrétního součtu

(diskrétní) ∑ f(x) Δx
(spojitý) ∫f(x) dx
(důležitý rozdíl je, že v integrálu se nám podařilo rozestupy udělat nekonečně malé, takže je značíme tzv. diferenciálem dx, a na sečtení budeme potřebovat aparát Calculusu).

Pochopitelně ještě musíme naznačit, odkud kam sčítáme či integrujeme, což se obvykle provede tak, že se k sumačnímu či integrálnímu symbolu připíšou různé subskripty, které ukazují meze součtu či integrálu. Ty se pak používají při vyčíslování.

Stejně jako při sčítání, musíme při integrování dávat pozor na znaménko. Například součet 2 + 2 + (-4) je roven nule, přestože všechny jeho členy jsou nenulové. Integrál si obdobným způsobem „pamatuje“ znaménko, takže pokud počítáme plochu funkce, která to znaménko mění, musíme ji spočítat zvlášť pro kladné a záporné oblasti, aby se nám ta znaménka nevyrušila a my nedostali nulovou plochu.

Integrálu s naznačenými mezemi říkáme určitý a reprezentuje konkrétní číslo (plochu pod grafem). A to je kolbiště pro naše rytíře, Lebesguea a Riemanna, jak za chvíli uvidíme. Pokud meze naznačeny nejsou, říkáme mu integrál neurčitý a na ten se můžeme dívat jako na funkci, která výpočet plochy umožňuje. Říkáme jí „primitivní funkce“ (k funkci f) a značíme ji odpovídajícím velkým písmenkem:

F(x) = ∫f(x) dx

V porovnání s určitým integrálem (plochou) je rozdíl v tom, že jeden z bodů vymezujících vystínovanou oblast bude proměnný (x), zatímco ten druhý (řekněme s) bude mít nějakou pevnou, zafixovanou hodnotu. Hodnota F(x) je tedy plocha pod grafem f od pevného s do proměnného x.

Tady stojí za to uvědomit si jednu zajímavou věc. Protože při změně bodu s na s' se nám ta primitivní funkce posune o konstantu (odpovídající ploše pod funkcí mezi body ss'), v zápisu se k primitivní funkci obvykle automaticky připlácne tzv. integrační konstanta C, která tuto skutečnost zohledňuje (v závěru se k tomu vrátím).

Všimněte si ovšem, že pro výpočet plochy mezi body ab integrační konstanta vypadne, takže si s ní pro tyto účely nemusíme lámat hlavu.

plocha mezi ab = F(a) + C - (F(b) + C)

Zatím ale není vůbec jasné, jak se magická funkce F, která umí počítat plochy, vlastně najde. Nejdůležitější vlastnost primitivní funkce (k dané funkci f) vyplývá z následujícího pozorování.

Spočítejme si derivaci primitivní funkce F. Tj. podívejme se, jak moc se její hodnota změní, pokud se posuneme z bodu x o nějaký malý kousíček dx. Při tomto malilinkatém posunutí se plocha pod grafem zvětší o hodnotu:

nárůst plochy = F(x + dx) - F(x) = f(x) dx

Plocha mezi body x a x + dx se totiž dá spočítat přes infinitesimální obdélníček s výškou f(x) a šířkou dx a to znamená, že pro derivaci primitivní funkce dostaneme:

F'(x) = (F(x + dx) - F(x)) / dx = f(x)

Zjistili jsme tedy, že primitivní funkce má derivaci, která se rovná f(x). A to je přesně funkce, o jejíž plošné vlastnosti se zajímáme. Jinými slovy, pokud nám někdo dá do ruky funkci f(x) a požádá nás, abychom spočítali její primitivní funkci, musíme najít funkci takovou, že její derivace je to, co držíme v ruce.

Každá dobře spočítaná derivace nám prozrazuje jednu primitivní funkci. Např. víme-li, že (x2)' = 2x, pak to znamená, že primitivní funkce k f(x) = 2x bude F(x) = x2:

∫ 2x dx = x2

A to znamená, že plocha pod funkcí f(x) = 2x od 1 do 2 bude rozdíl její primitivní funkce F, tj. v tomto případě x2, vyčíslený v obou bodech:

plocha pod f od 1 k 2 = F(2) - F(1) = 22 - 12 = 3
(což jsme v tomto případě mohli spočítat přímo z lichoběžníku)

Skutečnosti, že derivace integrálu (či chcete-li derivace primitivní funkce) je funkce původní se říká Fundamentální věta calculusu a v podstatě nám naznačuje, že derivování a integrování jsou navzájem inverzní operace – tedy když funkci zintegrujete a pak zderivujete, jste více méně tam, kde jste byli. Podobně jako když nějaké nezáporné číslo umocníte a pak odmocníte (na tu samou mocninu), dostanete nazpátek to samé číslo.

Teorie míry

V jednom starším Matykání jsme viděli, že matematika funguje na principu abstrakce. Tedy nezabývá se konkrétními příklady, ale snaží se vzít nějakou skupinu zajímavých objektů, vyhmátnout, co mají společného, a takto vzniklou abstraktní entitu potom zkoumá – tj. ze společných vlastností těch objektů usuzuje, jak se skupina objektů chová a jaké další zajímavé vlastnosti by mohla mít.

Výhodou takového přístupu je, že jakmile najdete další objekt, který má dané vlastnosti, tak už pro něj nemusíte budovat žádnou další teorii, ale pouze ho prohlásíte za další konkrétní příklad vaší abstrakce a jeho chování odvodíte z již rozvinuté teorie. Výbornou ukázkou takového přístupu je teorie míry.

Jistě vám neuniklo, že v životě je potřeba věci měřit, ať už jsou to motouzy, okenní tabulky nebo dýně. U 1D objektů měříme délky, u 2D obsahy, u 3D objemy a u vyšších dimenzí pak hyperobjemy. Samozřejmě bychom v každé dimenzi mohli pracně vybudovat teorii, jak se tyto veličiny (tedy délky, obsahy, objemy a jejich zobecnění) chovají, ale matematici pro jejich zkoumání prostě vymysleli nový abstraktní pojem – říkají mu míra – který v sobě všechny výše vyjmenované zahrnuje jako speciální případy.

A to není nic překvapivého. Od délek, obsahů i objemů vyžadujeme určité elementární vlastnosti, které mají společné. Takže místo abychom rozvíjeli hafo speciálních teorií, vybudujeme pouze jednu na základě společných vlastností.

Zjednodušeně řečeno míra μ je funkce, kam se na vstupu vhodí množina a na výstupu vám vypadne číslo, které říká, jak je množina velká. Ta funkce není samozřejmě nějaká hej-počkej, ale musí splňovat následující vlastnosti:

(1) μ(M) ≥ 0 (míra je nezáporná)
(2) μ(∅) = 0 (míra prázdné množiny je 0)
(3) μ(A∪B) = μ(A) + μ(B)

Třetí podmínka říká, že pokud si vezmeme dvě disjunktní množiny (tj. nemají žádné společné prvky), pak míra jejich sjednocení je prostě součet jejich dílčích měr (v plné verzi je tato podmínka o něco komplikovanější). Což samozřejmě známe z praxe: když do litrové bandasky nalejete dva půllitry piva, vyjde to tak akorát.

Stejně jako jsme u lineárních prostorů viděli, že norma (tedy něco, co měří délky vektorů) se dá zavést mnoha různými způsoby, i míra (která měří velikosti množin) není v daném kontextu určená jednoznačně. Vezměme si např. míru M, která bude měřit množiny na reálné ose tak, že to, co bude záporné (nalevo od nuly), budeme měřit normálně, zatímco to, co bude kladné (napravo od nuly), nafoukneme dvakrát. Interval (-1, 1) bude mít v tomto případě délku 3, protože 1 dílek připadne na interval (-1, 0) a dva na (0, 1). Můžete si ověřit, že takto definovaná míra skutečně splňuje podmínky (1-3).

Tato volnost v definici míry má velkou výhodu v tom, že příslušný abstraktní pojem dokáže popsat nejen běžné míry tak, jak je známe z občanského života, ale i různé speciální míry, které se používají pro speciální typy problémů.

Představte si například 1D nehomogenní drát vyrobený tak, že má v různých místech různou hustotu (např. na předchozí příklad se můžeme dívat jako na drát, který má nalevo od nuly hustotu 1 a napravo 2). Tím pádem už pro hmotnost kousku jednotkové délky nestačí pronásobit jeho délku nějakou konstantou (lineární hustotou). Důležité ale je, že na hmotnost se v tomto případě můžeme dívat jako na míru (stále splňuje podmínky 1–3) a s jako takovou s ní zacházet. Jen už to nebude míra běžná (pronásobená nějakou konstantou), ale prostě speciální míra, která se mění bod od bodu (tak jako se naše předchozí ukázka skokově změnila v nule). A hmotnost drátu se zde spočítá integrací.

Extrémní ukázkou je situace, kdy se veškerá (řekněme jednotková) hmotnost drátu přesune do jednoho bodu. Označme si ho x0. Míra každé množiny pak bude 1, pokud tato obsahuje bod x0, anebo 0, pokud ne. I takto divoká funkce kupodivu stále splňuje podmínky (1–3), takže je to opravdická a nefalšovaná míra. A dokonce má uplatnění i ve fyzice. Říká se jí Diracova míra a podstatně usnadňuje práci s Diracovou delta funkcí.

Pro tyto „netradiční“ míry se nemusí budovat žádná nová teorie, ale prostě se zahrnou do stávajícího aparátu jako speciální případy. Přesto se ale asi shodneme na tom, že nejužitečnější míry jsou takové, které se shodují s těmi, které používáme v běžném životě (tj. délka, obsah, objem atd.). Takovým mírám se říká Lebesgueovy a značí se písmenkem λ (z pohledu matematiky tedy obsah není nic jiného než dvourozměrná Lebesgueova míra).

Zajímavou roli hrají množiny s nulovou mírou. Tedy v 1D množiny s nulovou délkou, ve 2D s nulovým obsahem atd. Přímo z podmínky (2) je vidět, že prázdná množina má nulovou míru. Ale nenašla by se i nějaká neprázdná? Nu, našla a ne jedna. Například každý bod na přímce má nulovou míru. Proč? To už tak jednoduché není.

My totiž umíme měřit nenulové míry (odvozené z délek intervalů), ale to že množina N má nulovou délku, obsah či objem je otázka poněkud choulostivější. Nemůžete si prostě vzít šupléru a milou bodovou množinu změřit. Musí se to udělat obchvatem přes nenulové míry. V podstatě ukážeme, že množina N se dá vložit do nadmnožiny M, jejíž (kladná) míra se dá udělat libovolně malá. Za tím účelem si nejprve uvědomíme, že z podmínky (3) vyplývá celkem přirozená nerovnost pro podmnožinu (ta má vždy menší míru než množina mateřská):

(4) pokud N ⊆ M, pak je μ(N) ≤ μ(M)

Tím pádem nulové míry můžeme detekovat tak, že si zvolíme nějaké libovolně malé číslo ε a zkusíme zkonstruovat nadmnožinu, jejíž míra je menší než to ε (trochu to připomíná definici limity, což?).

Přesněji: množina N má nulovou míru, pokud platí:

(5) pro každé ε > 0 se dá najít M⊇N tak že μ(M) < ε
(kdyby totiž byla míra takové množiny N nenulová, zvolili bychom si prostě ε < μ(N) a hned bychom se dostali do sporu s výše uvedenou podmínkou)

Pro danou bodovou množinu, řekněme N = {2}, se taková nadmnožina M najde lehce – bude to interval (2 - ε/2,2 + ε/2), který je evidentně nadmnožinou bodu {2} a jeho délka je přesně ε (splňuje tedy podmínku (5)). Takže bod má míru 0.

O něco komplikovanější případy jsou spočetné bodové množiny, např. celá či racionální čísla. U celých čísel bychom ještě jakž takž uvěřili, že mají nulovou míru, protože cítíme, že jejich doplněk poměrně úspěšně celou číselnou osu vyplňuje (neobsahuje žádné „díry“, tedy malé interválky s kladnou mírou). U racionálních čísel se ale zdravý rozum vzpouzí té nulové míře uvěřit. Přesto ji ale mají. A ukáže se to stejně jako v předchozím příkladu. Najdeme nadmnožinu zlomků, jejíž míra se dá udělat libovolně malá.

Racionálních čísel je spočetně mnoho, dají se tedy očíslovat q1, q2, q3... atd. To první pokryjeme intervalem (nadmnožinou) délky ε/2, to druhé intervalem délky ε/22, třetí intervalem délky ε/23 atd. Všechna racionální čísla se tedy dají pokrýt sjednocením intervalů o celkové délce ε (to vyplývá ze součtu geometrické řady – podrobnosti zde). A protože ε se dá udělat libovolně malé, mají racionální čísla míru nula.

Množiny s nulovou mírou hrají v matematice velmi důležitou roli, protože reprezentují zanedbatelné entity (umožňují nám soustředit se na jádro daného problému). Pokud v matematice něco platí s výjimkou množiny míry nula, říkáme technicky, že to platí skoro všude (a tady to není jen tak nějaké vágní plácnutí do větru, ale přesná kvantifikace).

A závěrečnou poznámku této sekce věnuji matematickým obludám – neměřitelným množinám. Prakticky všechny množiny, se kterými se běžný smrtelník v praxi setká, jsou měřitelné, tedy dá se jim rozumně přiřadit (Lebesgueova) míra, protože jsou to v podstatě iterace procesu průniku či sjednocení jednodušších množin. Přesto se ale dají zkonstruovat množiny, které se změření naprosto vzpouzejí. Tyto neměřitelné množiny se ovšem nedají zkonstruovat jen tak (obrazně řečeno) pravítkem a kružítkem, ale při jejich konstrukci je nutno použít nekonstruktivní matematické nástroje, jako je například kontroverzní axiom výběru. Existence výsledných oblud pak ukazuje, že přiřazení míry množinám nějakého prostoru je silně netriviální proces, jehož ramifikace vedou k hlubokým paradoxům, jako je Hausdorffův nebo Banach-Tarského.

Lebesgueův integrál

Rozdíl mezi Riemannovým a Lebesgueovým přístupem k integraci nejlépe pochopíme z následujícího obrázku.

Vlevo je schematicky znázorněna Riemannova integrace. Plochu pod funkcí f (jejíž velikost nám integrál udává) spočítáme tak, že ji nakrájíme na vertikální nudličky tak úzké, že v rámci každé z nich můžeme na funkci pohlížet jako na konstantu a jednu každou dílčí plošku spočítat z obsahu malého obdélníčku. Délka každé nudličky odpovídá funkční hodnotě. Buď to uděláme pro malé, ale nenulové hodnoty Δx – a pak de facto provádíme diskrétní součet čili numerickou integraci – anebo to uděláme infinitesimálně přes diferenciály dx a odpovídající plošky (co plošky, plošičky!) sečteme spojitě pomocí integrálního počtu.

Lebesgueova integrace (vpravo) plochu také nařeže na nudličky, ale tentokrát horizontální. Nekrájíme tedy definiční obor (proměnné x), ale obor funkčních hodnot (proměnné y). Pro danou hodnotu y je délka každé nudličky zhruba určena velikostí (mírou) množiny, na které funkce nabývá danou hodnotu (nebo vyšší). Celkovou plochu pak opět dostaneme sečtením všech nudliček. Pro Lebesgueův integrál je tedy v první řadě nutné, aby na prostoru, kde integrujeme, existovala míra. Pokud se vám podaří míru zadefinovat na prostoru pingpongových míčků, můžete na něm z fleku začít integrovat.

V podstatě se pro danou hodnotu y zajímáme, kolik hodnot x na ni dosáhne (a míru těchto x přes každou vrstvu nakonec posčítáme). To rozřezání na nudličky se pochopitelně neprovede cirkulárkou, ale trochu sofistikovaněji – pomocí tzv. jednoduchých funkcí.

Nejprve si zadefinujeme indikátorovou funkci I množiny M takto:

I(x) = 1 pokud je x prvek M
I(x) = 0 pokud není

Na obrázku vpravo vidíme indikátorovou funkci intervalu [1/4, 1/2].

Lebesgueův integrál indikátorové funkce (plocha pod jejím grafem) je pak míra příslušné množiny.

∫ I(x) dx = μ(M)
(v našem případě dostaneme 0.25)

Jednoduché funkce jsou konečné lineární kombinace těchto indikátorových funkcí a jejich integrál je příslušná lineární kombinace měr. A protože každá rozumná funkce se dá pomocí jednoduchých funkcí obstojně aproximovat, integrály obecných funkcí se získají limitním procesem. Přístup je to poměrně technický a dál ho na této úrovni rozvíjet nebudu – koho zajímají krvavé detaily, může konzultovat nějakou učebnici teorie míry a integrálu.

Princip rozdílu mezi Riemannovým a Lebesgueovým integrálem se ale dá pochopit i bez teoretické erudice. Představte si následující příklad. Jste výběrčí daní (něco jako Josef Hlinomaz v Pyšné princezně), projíždíte danou vesnicí a u každého domku shrábnete váček s mincemi (jejichž celková hodnota představuje daň dané rodiny). Máte v zásadě dvě možnosti, jak mince (a tudíž celkovou daň vyždímanou z dané vesnice) posčítat.

Buď prostě na místě každý váček vysypete, spočítáte jeho hodnotu, někam si ji zapíšete a na závěr pak všechny dílčí hodnoty sečtete. To je Riemannova integrace: roztřídit podle nezávisle proměnné (domek ve vsi), spočítat zvlášť pro každý z nich a nakonec sečíst.

Anebo si ty váčky jen hodíte do brašny u sedla a vysypete je všechny teprve doma na stůl, když už je máte všechny vybrané. Na stole mince pečlivě roztřídíte podle hodnoty (na tolary, pětitolary, desetitolary atd.) a sečtete si, kolik každého typu mince máte. Pokud na stole máte 45 tolarů, 60 pětitolarů a 30 desetitolarů je jasné, že jste z této vesnice na daních vyždímali 645 tolarů. A to je princip Lebesgueovy integrace: roztřídit podle funkční hodnoty (mince), spočítat zvlášť pro každou z nich a nakonec sečíst.

Ale nebojte se. Jak jsem předeslal, přínos Lebesgueova integrálu je převážně teoretický (v tom že umožňuje integrovat některé exotické funkce a že umožňuje lepší zacházení s limitami funkcí), a pokud budete někdy muset něco integrovat, Riemannův integrál vám postačí (on to za vás stejně nakonec spočítá počítač, takže ani s primitivní funkcí si nebudete muset krabatět čelo).

Nicméně důležitým impulsem pro rozvoj Lebesgueovy integrace byla statistika, která se na pravěpodobnost dívá (v moderním pojetí) jako na speciální typ míry, která umožňuje „měřit“ podmnožiny v prostoru jevů. Například indikátorová funkce z předchozího obrázku odpovídá pravděpodobnosti, že náhodně vybrané číslo z jednotkového intervalu bude větší než 1/4, ale menší než 1/2. Tato pravděpodobnosti je

∫ I(x) dx = μ(M) = ¼

Položme si teď otázku, jaká bude pravděpodobnost, že si z jednotkového intervalu náhodně vyberete číslo racionální. Tady bychom potřebovali integrovat indikátorovou funkci racionálních čísel (což je Dirichletova funkce na dalším obrázku vpravo).

Na ní si Riemannův integrál vyláme zuby, protože tato funkce je v každém bodě nespojitá a divoce přeskakuje mezi 0 (pokud je x iracionální číslo) a 1 (pokud je x racionální). V Lebesgueově verzi se hodnota integrálu spočítá snadno, protože se jedná o indikátorovou funkci racionálních čísel a integrál (přes jednotkový interval) bude roven míře racionálních čísel na tomto intervalu, což je nula (podobný příklad ještě zde).

Abychom se ale v těch jemných nuancích mezi Lebesgueovým a Riemannovým náhledem neutopili, podíváme se na závěr ještě jednou na primitivní funkce. Pro drtivou většinu příkladů se totiž integrál spočítá jejím vyčíslením a získaná plocha pak obvykle souhlasí s oběma přístupy (tj. s vertikálními i horizontálními nudličkami).

Jak jsem předeslal v úvodu, integrování je inverzní operací k derivování, a to v tom smyslu, že hledání ploch (integraci) „obstarává“ primitivní funkce, tedy funkce, jejíž derivací je to, co integrujeme.

Podívejme se tedy obecně na inverzní vztahy trochu podrobněji. Pokud nějaká funkce převádí hodnoty x na hodnoty y, pak inverzní funkce převádí hodnoty y zpátky na hodnoty x. Např. exponenciála převádí 0 na 1, zatímco logaritmus vrací 1 zpátky do 0. Pro derivaci a integrál to funguje obdobně (i když se na ně musíme dívat jako na operátory, tedy funkce operující na funkcích). Pokud derivace převádí funkci f na f', pak integrace (zosobněná primitivní funkcí) převádí f' zpátky na f. Proto se také primitivní funkci říká v angličtině antiderivace. Ale má to malý háček.

Při hledání inverzní funkce musíme dávat pozor, zda je funkce prostá, tedy zda převádí různé hodnoty x na různé hodnoty y. Pokud tomu tak není, vznikne problém. Například sin(x) převádí jakýkoliv násobek π na TU SAMOU hodnotu, konkrétně 0. A co teď s inverzní funkcí (arcsin)? Má převést 0 na 0 nebo na π nebo na 2π nebo na co?

Tato patálie se dá vyřešit dvěma způsoby. Buď prostě původní funkci omezíme na interval, kde je prostá, a tam inverzní funkci definujeme jednoznačně, anebo tu nejednoznačnost nějakým způsobem vyřešíme dodatečně. Např. řešíme-li rovnici

sin(x) = 0

dostaneme x = arcsin(0) = 0.

To ale nejsou všechna řešení. To je pouze řešení, které jsme vyždímali z té omezené funkce. Abychom dostali všechna, musíme přidat libovolný násobek π:

x = 0 + nπ

No a s integrací je to podobné. Protože derivace jakékoliv konstanty je nula (konstanty mají všude nulovou směrnici), všechny funkce posunuté o konstantu, tj. f(x) + c, se derivací převádí na TU SAMOU funkci f'(x). A co teď s inverzním procesem, tj. s integrací? Na kterou z posunutých funkcí se má převést f'(x)?

Vyřešilo se to šalamounsky – podobně jako s tím sinem – a to tak, že se ke každé primitivní funkci připlácne libovolná konstanta.

∫ f(x) dx = F(x) + C

Příklad z první sekce tedy bude správněji zapsán takto:

∫ 2x dx = x2 + C

Při hledání ploch se integrační konstanta vyruší, ale třeba při řešení diferenciálních rovnic (přespříště) hraje důležitou roli.

A ještě jednu poznámku k integraci jako inverznímu procesu. Podívejme se pro jednoduchost nejprve na mocninu (druhou) a její odmocninu. A pouze na celých číslech. Mocnina převádí 1, 2, 3, ... na 1, 4, 9, ... a není s ní žádný problém. Když ale začneme na celých číslech operovat s odmocninou, zjistíme, že velmi často se nám výpočet v celých číslech zadrhne. Odmocninu z 16 sice ještě v celých číslech najdeme (je to 4), ale odmocninu ze 17 už ne. Ta nejenže není celé číslo, ale není ani číslo racionální (tedy vyjádřitelné zlomkem). Pokud chceme s inverzním procesem (odmocninou) nějak rozumně operovat, musíme podstatně rozšířit obor, ze kterého jsme vystartovali.

A tato (trochu nepřesná) analogie platí i pro derivování a integrování. S derivací není žádný problém a prakticky každou rozumnou funkci f(x) lze zderivovat, tedy najít f'(x) pomocí kombinačních vzorečků. S integrací je to horší a existují funkce, např. sin(x)/x, pro které tu primitivní funkci nelze najít. Tedy alespoň ne ve stejné množině funkcí (stejně jako jsme nedokázali najít odmocninu ze 17 v množině celých čísel).

A tak jako jsme pro odmocninu museli rozšířit svůj operační prostor, musíme to udělat i pro integraci. Ne každý integrál lze vyjádřit jako kombinaci elementárních funkcí. Tím samozřejmě není řešeno, že primitivní funkce k sin(x)/x neexistuje. Ona existuje, ale nedá se vyjádřit pomocí známých funkcí (podobně jako se sqrt(17) nedá vyjádřit jako racionální číslo, přestože hodnota samotná samozřejmě existuje a je rovna 4.12311...). Musí se pro ni zadefinovat úplně nový typ funkce, tak jako se pro sqrt(17) musel zavést úplně nový typ čísla (iracionální). A to by k integraci prozatím asi stačilo.

Článek je redakčně upravenou verzí blogového příspěvku na serveru iDNES.cz. Publikováno s laskavým svolením autora. Další díly a původní texty jsou dostupné na blogu Jana Řeháčka.

Další články k tématu