pátek 20. listopadu 2009

Perličky z nerovnovážné statistické termodynamiky

S přechodem na biofyziku jsem se trochu bál toho, že veškeré přednášky budou vesměs experimentálního rázu. O to více jsem byl překvapen, když jsem zjistil, že jsem se dostal k hodně přednáškám teoretickým, a to rozhodně velmi zajímavým. Asi nejvíce překvapující a novou pro mne je nerovnovážná statistická fyzika a termodynamika přednášená Dr. Šandou, na kterou tímto příspěvkem vlastně dělám reklamu.

Člověk se zde dozví o poměrně exotických objektech, jako je Wignerův operátor hustoty, který představuje nejbližší kvantovou obdobu statistického rozdělení pravděpodobnosti obsazení stavu na fázovém prostoru a má tu pozoruhodnou vlastnost, že na hodně malých oblastech FP může být i záporný. To je pro pravděpodobnost trochu divné .. ale vše se spraví jakmile integrujeme dost velkou oblast, aby byl uspokojen princip neurčitosti a pravděpodobnosti jsou pak vždy kladné. To vše v rámci probírané látky. Člověk se však dozví i spoustu zajímavostí navíc, které jsou od Dr. Šandy bonusem. U některých mi to nedá a musím se o nich rozepsat konkrétně, dokud je mám v čerstvé paměti. (V důsledku asi budu někde fakticky nepřesný, ale snad přimhouříte oko.)

Jedna z hodně zajímavých oblastí je popis Brownova pohybu a difuze pomocí stochastických sil. Takové síly působí náhodně a my známe jen jejich korelační funkce (<F(t)F(0)> a vyšší - zkrátka určují, že pokud částici náhodná síla kopla teď, v následujících chvílích bude mít trochu jinou pravděpodobnost kopnutí, než kdybychom o prvním kopnutí nevěděli). Všechno se přitom zjednoduší, jsou-li korelační funkce δ-funkce. Pokud pak chceme spočítat, jak se pod vlivem δ-korelované stochastické síly bude částice pohybovat na dlouhou vzdálenost, potřebujeme z jistých technických důvodů počítat integrály, kde tato δ-funkce sedí právě na hranici integrační oblasti. A nyní ta zajímavost: Zatímco pro fyzika je přirozené započítat půlku z δ-funkce (což odpovídá představě, že je to vlastně jen velmi lokalizovaná funkce, kterou integrační oblast rozpůlí), matematici používají v podstatě stejný popis pro analýzu fluktuací cen akcií na finančních trzích. Ve svém popisu do integrálu berou δ-funkce celou. (Itō-Stratonovichovo dilema.) Rozdíl v ceny na finančním trhu a brownovské částice je tedy v podstatě v tomto detailu. A zajímavá je jeho interpretace: Zahrnutí půlky δ-funkce odpovídá tomu, že část informace o korelaci je v minulosti a část v budoucnosti. Zkrátka pokud na částici teď působila síla, je jakási šance, že ještě chvíli působit bude. Oproti tomu zahrnutí celé δ-funkce vlastně znamená, že všechna informace je v minulosti a my do budoucna o fluktuaci nevíme nic. To je pro finanční trhy velice přirozené, protože pokud by někdo tuto informaci měl, skoupil by akcie o kterých ví, že porostou a tím by vnesl fluktuaci ceny, která původní informaci o budoucím vývoji ceny vymaže.



Wikipedie, ilustrativní obrázek.



Dalším velmi přínosným a pro mne novým vhledem byla statistika Léviho stabilních distribucí, která má hluboký dopad na statistiku obecně, i když si to mnoho lidí vůbec neuvědomuje. Obecně se totiž soudí, že pokud mám rozdělení mnoha náhodných vlivů, výsledné rozdělení odpovídá Gaussově funkci. To nám říká tzv. centrální limitní věta. Ta ovšem platí pouze v případech, že zkoumaná distribuční funkce má konečný druhý moment (rozptyl). Jako hezký fyzikální vhled, proč tomu tak je, beru fakt, že Gaussova funkce je funkcí, která maximalizuje entropii při fixní střední hodnotě a rozptylu. Jakmile je rozptyl nekonečný, maximalizace entropie selhává a není důvod, aby výsledné rozdělení bylo gaussovské. Pak nastupují tzv. Léviho stabilní distribuce, což jsou funkce které se pouze škálují, pokud sčítám výsledky měření podle více takovýchto rozdělení. (Tj. jen se škálují při konvoluci..) Jejich třída je obecně širší - má čtyři parametry, které vesměs charakterizují střední hodnotu (je-li konečná), asymetrii a parametry algebraických ocasů. (Rozdělení s divergujícím rozptylem typicky má algebraický ocas klesající pomaleji než 1/x^3, který divergenci způsobuje.)

Co je zajímavé je, že pokud je limitní rozdělení Léviho distribuce, neplatí základní věci ze statistiky, na které jsme zvyklí. Např. pokud odhadujeme průměr rozdělení z měřených dat, typicky spočítáme průměr hodnot. Pokud prokládáme daty závislost, používáme metodu nejmenších čtverců. (Obojí se odvodí z principu maximální pravděpodobnosti - zkoumáme, za jaké podmínky máme největší pravděpodobnost na správný fit, a pokud je rozdělení chyb gaussovské, vyjdou nám tato pravidla.) Pokud není, pak ani jedna z těchto metod nefunguje! Hodnoty, které pravděpodobně jsou z algebraických ocasů rozdělení musíme vážit nějakou funkcí, která je typicky charakteristická pro danou Léviho distribuci a vše se komplikuje.

Zajímavé také je, že k tomuto patologickému chování dochází poměrně často. Pro fyziky třeba jakékoliv statistiky řídící se Lorentzovým rozdělením. Ale třeba také výpočty kolem 6 degrees of sepatation, rozdělení velikosti měst (Zipfovo rozdělení), nebo rozdělení majetku napříč populací (Paretovo rozdělení). Z toho, jak podotkl Dr. Šanda, plyne např. to, že průměrná mzda může být nejenom nevypovídající (protože běžného člověka spíš zajímá medián), ale navíc i zavádějícím způsobem vysoká oproti skutečnosti, protože při jejím výpočtu se dost možná vychází z mylného předpokladu gaussovského rozdělení chyb.

Musím říci, že zajímavých věcí podobného rázu je na přednášce mnoho a mně nezbývá, než se těšit na další.