V tomto příspěvku bych chtěl komentovat Tegmarkovu knihu Matematický vesmír. Je to téma, které je úzce spojeno s antropickými úvahami, o kterých jsem psal výše. Pokud jste knihu nečetli, pak vězte, že hlavním tvrzením, které v knize autor vysvětluje je klasifikace mnohasvětových teorií. Tegmark začíná relativně dobře přijímanými teoriemi a postupně se dostává až k velmi spekulativnímu tvrzení, že žijeme v multiverzu všech myslitelných matematických struktur. A právě k tomu bych rád přidal několik technických poznámek, ale nejprve se pojďme podívat na Tegmarkovu klasifikaci multiverz:
Typ 1: Pokud je náš vesmír nekonečný (v prostorovém smyslu, nejen v tom smyslu, že se bude do nekonečna rozpínat), nebo pokud se bude expanze vesmíru urychlovat, jak aktuální měření kosmologické konstanty napovídají, pak jsou v něm regiony, kam se za dobu jeho existence nikdy nedostaneme. Objekty za kosmologickým horizontem. V případě prostorově nekonečného vesmíru se dokonce dá tvrdit, že všechno, co se tu dnes na Zemi děje, se někde v dálce za horizontem zopakuje s přesností na libovolně malé ε. Ale i pokud je vesmír na něco takového příliš malý, není asi důvod si myslet, že vzdálené části vesmíru za horizontem neexistují jenom proto, že je nemůžeme (a nikdy nebudeme moci) pozorovat.
Typ 2: Pokud se vesmíry nějakým procesem rodí, pak multiverzum druhého typu jsou různé vesmíry, které jsou od sebe prostorově oddělené. Jedním konkrétním případem, který je mezi kosmology dobře přijímaný, jsou bubliny vzniklé rozpadem inflatonového pole. Má se za to, že v minulosti vesmír prošel tzv. inflací, což bylo časově extrémně krátké období, kdy se exponenciálně zvětšoval objem vesmíru díky tomu, že byl vyplněn hypotetickým polem, které při rozpínání neztrácí hustotu energie, a způsobuje kladnou hodnotu kosmologickou konstanty, která urychluje rozpínání vesmíru. Pole by se mělo rozpadat náhodným fázovým přechodem, který se nastartuje v nějakém konkrétním bodě a pak se šíří rychlostí světla. Jelikož se ale regiony, kde inflatonové pole rozpadlé není, rozšiřuje exponenciálně rychle, je podle této teorie vesmír tvořen téměř všude nerozpadlým inflatonovým polem a pak mnoha prostorově oddělenými bublinami s "normálním" prostorem, jako je ten náš. Byli bychom tedy jednou z mnoha takových bublin, což je Tegmarkovo multiverzum 2.
Typ 3: Kvantová mechanika má hodně interpretací. Zatímco některé buď předpokládají, že vlnová funkce objektivně prochází kolapsem, nebo že jenom představuje informaci pozorovatele o stavu světa, který se lépe poznat nedá, mnohosvětová interpretace nabízí vysvětlení, že žijeme v obrovské vlnové funkci, která popisuje všechny možné stavy vesmíru rozvětvené od jeho počátku, a kolaps vlnové funkce je jenom zdánlivý jev daný tím, že jako pozorovatelé uvnitř této vlnové funkce sami procházíme dělením na mnoho větví, a nakonec vždy vidíme jen tu jednu, ve které daná naše kopie skončí. Výhoda je, že teorie nepotřebuje přidané předpoklady o tom, jak kolaps probíhá, jenom základní rovnice kvantové mechaniky. Její existence by tedy podle Occamovy břitvy měla být jednodušší a proto pravděpodobnější. Kvantové světy jsou Tegmarkovým multiverzem 3.
Typ 4: Tegmark argumentuje, že nejobecnějším objektem, který je nějak správně formálně uchopený, jsou matematické struktury. Měli bychom tedy předpokládat, že v nějakém smyslu existují, a my se podle antropického principu nacházíme uvnitř těch, které jsou jednak v nějakém smyslu "hojné", a podporují struktury podobné našim mozkům, které zjevně generují zážitky.
Pokud znáte Tegmarkovu knihu, skočte sem!
Mezi fyziky jsou multiverza 1-3 poměrně často diskutována, byť ne vždycky nadšeně přijímána. Typ 4 ale působí tak exoticky a bez opory v experimentu, že jsem nepotkal příliš fyziků, kteří by se jím vůbec nějak zabývali. Zkusil jsem si představit nějaký model, který by byl dostatečně dobře technicky uchopený, aby alespoň mohl dávat nějaké empirické předpovědi (v návaznosti na antropický princip a self-sampling assumption).
Jednou velmi nadějnou třídou matematických struktur jsou Turingovy stroje. Ať už je chceme použít jako samotné Tegmarkovy matematické struktury, nebo jenom jako struktury, které nějak formálně popisují Tegmarkovy matematické struktury, budou užitečné. A to proto, že umí plně popsat všechny problémy, pro které vůbec existuje algoritmus. Pokud máme nějaký Turingův stroj, který generuje řetězce znaků, mohli bychom chtít vědět, jaká je pravděpodobnost, že řetězec 1, 2, 3, 4, 5, 6 bude pokračovat číslem 7, a ne třeba 123. Někdo by mohl namítnout, že každá posloupnost je stejně pravděpodobná a proto nemá smysl očekávat, že by řada měla pokračovat sedmičkou a ne číslem 123. Intuitivně však cítíme, že sedmička je v nějakém smyslu přirozenějším pokračováním této sekvence. Tuto intuici formalizuje tzv. Solomonoffův prior: Každá sekvence má takovou apriorní pravděpodobnost, jako je 2^-K, kde K je velikost nejmenšího programu na Turingově stroji, který danou sekvenci generuje. (Kolmogorova složitost)
K čemu je to dobré? Především teď můžeme porovnávat, jak složité jsou jednotlivé teorie. Asi znáte Occamovu břitvu, která říká, že nejjednodušší vysvětlení s co nejmenším počtem předpokladů je nejpravděpodobnější. Teď ale vidíme, že Occamova břitva řeže velmi ostře: každý bit v minimálním popisu teorie navíc činí teorii dvakrát méně pravděpodobnou. Zároveň, pokud se chceme nějak zabývat Tegmarkovým multiverzem, můžeme se podívat, jak by vypadalo pro tento konkrétní případ. Má to ale několik háčků.
Mícháme popis objektu s objektem?
Jedna z námitek proti multiverzu 4 je, že zaměňuje popis za realitu. Konec konců je jasné, že mapa není území a že fyzikální teorie není vesmír. A už samotný Solomonoffův prior jako míra má jisté rysy, které na tento problém ukazují. Přesná váha 2^-K totiž záleží na Turingově stroji, který popis realizuje. Představme si, že bychom chtěli vědět, jaká je Kolmogorova komplexita čísla pí. Můžeme si zvolit nějakou typickou Turingovu mašinu v podobě např. holého jazyka C, jazyka Rust, nebo assembleru pro nějaký konkrétní procesor a dát lidem výzvu, aby napsali co nejkratší program, který bude pí na N míst generovat. Pokud pak vezmeme výsledný kód a komprimujeme jej, přibližně bychom mohli čekat, že dostaneme K, které ale bude záležet na přesně zvoleném jazyku. (Pokud vám z takto hrubého inženýrského odhadu vstávají vlasy hrůzou na hlavě, můžete místo toho napsat formální Turingův stroj a spočítat délku pásky, komprimovat zdrojové kódy asi může obsahovat nějaké systematické chyby proti přesnému formalismu).
Můžeme tedy multiverzum 4 shodit ze stolu? Myslím, že ještě ne. Na námitku, že mícháme popis a realitu se dá odpovědět tak, že nikdo přece neříká, že když matematické modely používáme k popisu naší reality, že stejný matematický popis v nějakém hlubším slova smyslu taky realitou není. Nezaměňujeme mapu a území, jenom říkáme, že jsou dobré důvody si myslet, že mapa i území jsou vybrané ze stejné množiny objektů.
Ale co s tím, že váha matematických struktur, kterou chceme použít (Solomonoffův prior) je zjevně závislá na Turingově stroji? Na to se dá odpovědět alespoň dvěma způsoby: Ten první je: co když je multiverzum 4 opravdu nějaký konkrétní Turingův stroj, jen nevíme přesně jaký? Pak můžeme těmito úvahami získat alespoň nějaký vhled do situace, i když identifikovat přesný stroj asi bude těžké (pokud vůbec teorie nějaké empirické předpovědi dává.) Ale vyloučit to nelze, byť by to pak teorie byla opravdu hodně specifická.
Druhý způsob, kterým bychom mohli odpovědět je, že možná matematické struktury mají nějakou vlastní složitost, něco jako průměr mezi Turingovými stroji, pokud něco takového dává smysl. (Tady se už pouštím na docela tenký led). Na jednu stranu asi vždycky můžu postavit velmi speciální Turingovu mašinu tak, aby danou strukturu nějak obsahovala (kompilátor, který pro prázdný program vypíše hodnotu pí), nebo s ní naopak měla problémy, ale čekal bych, že velká třída Turingových strojů na tom bude tak nějak podobně.
Musím ukázat? A pokud ne, není to divné?
Číslo pí někde ve svém rozvoji obsahuje jakoukoliv sekvenci. Pokud bych chtěl ale tu sekvenci najít a identifikovat, musím popsat od jakého desetinného místa začíná. Typicky bude ukazatel stejně dlouhý, jako sekvence samotná. Pí má možná Kolmogorovu komplexitu malou, ale pokud bych chtěl popsat nějaký složitý objekt, pokud na něj musím ukázat, nepomůžu si.
Jak chápu Tegmarkovu vizi já, ukázat bych nemusel. To je nutné pro premisu, že "jednoduché světy mají větší váhu". A že jednoduché světy mají vyšší váhu je zase nutné, abychom mohli tvrdit, že vesmíry s jednoduchými zákony (a možná i s jednoduchými počátečními podmínkami) jsou typické. Kdyby nebyly, tak by aplikace antropického principu (self-sampling assumption) předpovídalo, že svět bude náhodnou sekvencí nekoherentních zážitků, jako náhodná simulace která jenom náhodou obsahuje struktury nějak odpovídající mozkům.
Intuitivně mi připadne trochu podivné, že "napsání několika rovnic" by mělo způsobit větší vnitřní komplexitu, než detailní popis každého atomu. Ale pokud se na to člověk dívá prismatem toho, že jednoduchý program může vygenerovat velmi komplexní chování, a to, že je krátký znamená, že je více častý ("snáz se najde v náhodných datech"), zase mi to dává smysl.
Dává to nějaké empirické předpovědi?
Hlavní předpověď, kterou taková formulace Tegmarkova multiverza 4 dává je, že jednoduché světy by měly být daleko pravděpodobnější. Jako pozorovatel jsem strukturou, která odpovídá mému tělu a hlavně mozku. A jako takový můžu být zakódován v různých prostředích. Mohl bych být jenom Boltzmannovým mozkem, který se náhodou vytvořil - v tomto případě ne z náhodných stavů částic, které se zrovna poskládaly do struktury mého mozku tady a teď a zase se rozpadnou, jak si to představoval Boltzmann, ale jako náhodná matematická struktura, která obsahuje jenom ten mozek a nic dalšího. Taky můžu být simulace, jak si Bostrom představuje ve své simulační hypotéze. Ne nutně provozované na počítači v nějakém fyzickém vesmíru, ale přímo v jako jednu z alternativních matematických struktur se Solomonoff priorem. A nakonec můžu být mozkem savce na planetě Zemi, která je součástí nějaké matematické struktury popisující celý vesmír s jeho počáteční podmínkou.
Jak se tyto tři varianty poměřují? Pokud bych chtěl najít samotný můj mozek, bude jeho struktura (ať už v simulaci nebo jako Boltzmannův mozek) úměrná počtu synapsí a neuronů (krát velikost popisu těchto prvků). To je celkem řádově alespoň 10^15 bitů. Nevím, jak složitý je minimální popis zákonů fyziky a jaké jsou, ale pokud je to jednoduchá rovnice / struktura, může mít stovky až desítky tisíc bitů. Poměr pravděpodobností, že se najdu v takovém vesmíru vs. jako simulace mozku by pak byl cca 2^-1000 ku 2^(-10^15), tedy nesrovnatelně víc ve prospěch fyzikálních vesmírů.
Je vesmír skutečně jednoduchý, když obsahuje složitou počáteční podmínku?
Odpověď na tuto otázku bychom museli dát ve finální fyzikální teorii (minimálně např. kvantově), ale snazší asi bude to ilustrovat na klasických kuličkách. Když bych chtěl popsat krabici ve které je N molekul, potřeboval bych 6xN čísel. Z hlediska toho, jak se běžně formuluje termodynamika je každý mikrostav rovnocenný, takže složitost každého stavu je prostě 6N. Ale pokud byste psali počítačovou simulaci, jistě víte, že daleko úsporněji zapíšete např. stav, který molekuly rovnoměrně rozhodí po prostoru, nebo jim dá nějakou pseudo-náhodnou polohu a rychlost, než libovolný pozdější stav, který už je z daleko obecnějšího prostoru stavů. I kdybyste chtěli opustit analogii programů, v rovnicích bude mít takový speciální stav taky daleko jednodušší popis. Čili v jistém smyslu se dá tvrdit, že speciální počáteční podmínka může být jednoduchá.
Z čeho jsem pořád zmatený?
Jednak je tu námitka, že pokud mám nějaký popis vesmíru, existuje popis, ve kterém je podmínka, že od určitého času se začne něco chovat jinak, než zákony popisují. Kdyby takové modifikace byly v metrice Solomonoffova prioru jednoduché, pak by tato verze Tegmarkova multiverza 4 předpovídala, že místo normálního pokračování podle přírodních zákonů budeme pozorovat náhodné modifikace našeho vesmíru. ("Od času T zvedni Planckovu konstantu o x".) Pokud tato námitka nemá teorii diskvalifikovat, museli bychom ukázat, že takové modifikace jsou buď o hodně složitější (protože např. musí přesně popsat "od času T", což v komplikovanější teorii může být složitý objekt), anebo že skoro všechny takové modifikace jsou neslučitelné s fungováním inteligentních pozorovatelů, což by takovou modifikaci zabránilo komukoliv pozorovat a zůstala by v antropickém stínu.
Pak jsem taky zmatený z této námitky: Pokud je číslo pí jednoduchý objekt, možná jednodušší než minimální popis našeho vesmíru, a přesto obsahuje každou myslitelnout sekvenci; a pokud nepotřebuji specifikovat ukazatel na danou strukturu, neměly by být simulace a Boltzmannovy mozky (ve smyslu simulací našeho mozku) stejně časté jako fyzikální pozorovatelé? Nebo jsou struktury uvnitř čísla pí meta-popis, který znovu vygeneruje nový seznam Turingových strojů a bude to znovu replikovat Solomonoffův prior? Pak by to chtělo minimálně dokázat, že popis a meta-popis jsou jedno a to samé a ne dvě různé neekvivalentní věci.
Tegmarkovo multiverzum 4 možná vůbec není self-konzistentní, a pokud je, pak asi stejně není pořádně falzifikovatelné ("not even wrong"). Ale pořád se mi nedaří ho myšlenkově opustit a tohle byl další pokus o zamyšlení nad ním.
Žádné komentáře:
Okomentovat