Frank Wilczek, Il Sole-24 Ore 8/11/2009;, 8 novembre 2009
COMPRIMERE L’UNIVERSO
La compressione dei dati è un problema fondamentale nella tecnologia della comunicazione e dell’informazione. Sono convinto che ci offra una prospettiva nuova e importante sul significato e sull’importanza della semplicità nella scienza. Quando trasmettiamo informazioni, vogliamo sfruttare al meglio la larghezza di banda. Pertanto condensiamo il messaggio, eliminando le informazioni ridondanti o non essenziali. Acronimi quali mp3 e jpeg sono ben noti agli utilizzatori di iPod e di macchine fotografiche digitali; mp3 è un formato di compressione audio e jpeg è un formato di compressione delle immagini. Ovviamente, per riprodurre il messaggio originario il ricevente all’altra estremità deve prendere i dati condensati ed espanderli. Quando vogliamo immagazzinare informazioni emergono problemi simili: vogliamo mantenere i dati compatti, ma pronti a tornare nella forma originaria.
Da una prospettiva più ampia, molte delle sfide affrontate dagli esseri umani per decifrare il mondo sono problemi di compressione dei dati. Le informazioni sul mondo esterno inondano i nostri organi sensoriali.
Dobbiamo adattarle alla larghezza di banda del nostro cervello. Le nostre esperienze sono troppe per avere ricordi precisi di tutto; la memoria cosiddetta fotografica è rara e limitata, nella migliore delle ipotesi. Tutti noi costruiamo modelli funzionanti e regole empiriche che ci consentono di usare piccole rappresentazioni del mondo, adatte per agire correttamente al suo interno. «Arriva la tigre!» comprime gigabyte di informazioni ottiche, più forse qualche megabyte di audio dal ruggito della tigre e forse anche – e qui sono guai – qualche kilobyte del suo odore e dell’aria che smuove, in un minuscolo messaggio ( per gli esperti: 16 byte in Ascii). Molte informazioni sono state soppresse, ma dalle poche presenti possiamo tirar fuori alcune conseguenze molto utili.
Costruire teorie fisiche profondamente semplici è un gioco olimpico di compressione dei dati. L’obiettivo è trovare il messaggio più corto possibile – idealmente, una sola equazione – che una volta espanso produca un modello dettagliato e preciso del mondo fisico. Come tutti i giochi olimpici, anche questo ha un insieme di regole. Due delle più importanti sono: la vaghezza fa perdere punti di stile; le teorie che formulano previsioni sbagliate sono squalificate.
Una volta compresa la natura di questo gioco, alcune delle sue strane caratteristiche diventano meno misteriose. In particolare: per il non plus ultra della compressione dei dati, dobbiamo aspettarci codici complicati e difficili da leggere.
Consideriamo, per esempio, la frase: «Take this sentence in English». Eliminando le vocali, la accorciamo: «Tk ths sntnc n nglsh». Questaè più difficile da leggere, ma quale sia la frase rappresentata in realtà non è dubbio. In base alle regole del gioco, è un passo nella direzione giusta. Eliminando gli spazi, possiamo renderla ancora più corta: «Tkthssntncnnglsh». Così inizia a diventare più discutibile. Si potrebbe pensare erroneamente che si tratti della frase: «Took those easy not nice nine ogles, he». Com’è ovvio, l’inglese è così bizzarro che questo genere di codice perde molti punti di stile, per la vaghezza. difficile essere certi di quali siano esattamente le frasi che si possono considerare legittime. Nel gioco della semplicità profonda, dobbiamo realizzare la decompressione usando procedure matematiche definite in modo preciso. Come suggerisce questo semplice esempio, tuttavia, dobbiamo aspettarci che i codici corti siano meno chiari del messaggio originale e che decodificarli richieda abilità e lavoro.
Dopo secoli di sviluppo, i codici più corti potrebbero diventare piuttosto oscuri. Potrebbero essere necessari anni di preparazione per imparare a usarli – e un duro lavoro per leggere qualsiasi messaggio particolare.
Ora capite perché la fisica moderna ha l’aspetto che ha! In realtà, la situazione potrebbe essere molto peggiore. noto che il problema generale di trovare il sistema ottimale per comprimere un insieme arbitrario di dati è irresolubile. La ragione è strettamente legata al famoso teorema di incompletezza di Gödel e (in particolare) alla dimostrazione di Turing che il problema di decidere se un programma farà entrare un computer in un ciclo infinito è irresolubile. Di fatto, la ricerca del non plus ultra per la compressione dei dati fa immediatamente spuntare il problema di Turing: non possiamo essere certi che l’ultimo meraviglioso stratagemma per costruire codici corti non faccia entrare il decodificatore in un ciclo infinito.
Ma i dati della natura sembrano lontani dall’arbitrarietà. Siamo riusciti a ideare codici corti che descrivono grandi parti della realtà in modo completo e preciso. Di più, in passato, realizzando codici sempre più corti e più astratti, abbiamo scoperto che dallo sviluppo dei nuovi codici si ottengono messaggi espansi che si dimostrano corrispondere a nuovi aspetti della realtà.
Quando Newton codificò le tre leggi di Keplero del moto dei pianeti nella legge della gravitazione universale, si ottennero le spiegazioni delle maree, della precessione degli equinozi e di molte altre oscillazioni e inclinazioni. Nel 1846, dopo quasi due secoli di trionfi su trionfi della gravità di Newton, si scoprirono piccole differenze tra osservazioni e previsioni nell’orbita di Urano. Urbain Le Verrier scoprì che ipotizzando l’esistenza di un altro pianeta tali differenze risultavano spiegabili. Gli osservatori rivolsero i telescopi dove Le Verrier aveva suggerito di guardare ed ecco che apparve Nettuno! (Il problema odierno della materia oscura ricorda in modo inquietante queste vicende). Equazioni profondamente semplici sempre più compresse da cui partire, calcoli sempre più complessi per svilupparle, risultati sempre più ricchi con cui il mondo si rivela in accordo. Questa, a mio parere, è un’interpretazione ragionevole di ciò che intendeva dire Einstein con la frase «sottile è il Signore, ma non malizioso ». Impegnandoci per procedere nell’unificazione, siamo convinti che la fortuna continuerà ad arriderci.