Questo sito utilizza cookies tecnici (propri e di terze parti) come anche cookie di profilazione (di terze parti) sia per proprie necessità funzionali, sia per inviarti messaggi pubblicitari in linea con tue preferenze. Per saperne di più o per negare il consenso all'uso dei cookie di profilazione clicca qui. Scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie Ok, accetto

 2016  febbraio 06 Sabato calendario

SE IL GHOST WRITER È UN ALGORITMO


«Dicevano che questo giorno non sarebbe mai arrivato». Iniziava così il famoso discorso di Barack Obama del gennaio 2008, dopo la vittoria nelle primarie in Iowa contro Hillary Clinton. Chi avrà scritto quell’intervento, in quanti ci avranno lavorato? E chi scrive oggi i discorsi politici della stessa Clinton, di Donald Trump, di Ted Cruz e degli altri protagonisti della lunga corsa alla Casa Bianca? Proprio in coincidenza con l’inizio delle primarie per le elezioni presidenziali, un giovane ricercatore americano ha messo a punto un algoritmo che potrebbe mettere al tappeto, una volte per tutte, il collaudato sistema di ghost writing a stelle e strisce.
«Inizialmente volevo soltanto scoprire, per il mio corso di natural language processing (elaborazione del linguaggio tramite calcolo elettronico, ndr), se i discorsi politici riproponessero, indifferentemente dal loro orientamento o contenuto, le medesime strutture e gli stessi passaggi lessicali», spiega a pagina99 Valentin Kassarnig, il ricercatore della University of Massachusetts Amherst che ha creato l’algoritmo che genera discorsi elettorali.
«L’idea di costruire una macchina che potesse creare discorsi politici in conformità a un determinato partito o a un argomento specifico era elettrizzante», ricorda Kassarnig, «volevo dimostrare che, proprio in questo ambito, non è il contenuto quello che rende credibile un intervento, quanto il ripetersi di una certa struttura semantica standardizzata».
Ma come funziona il sistema? Alla base di tutto, afferma Kassarnig, c’è un database. Una grande banca dati che contiene 3.857 orazioni politiche pronunciate dal 2005 in poi nei 50 Stati degli Stati Uniti, per un totale di 50 mila frasi, ciascuna delle quali composta in media da 23 parole.
Ogni discorso è catalogato attraverso due criteri: l’orientamento politico di chi parla (democratico o repubblicano) e il favore o meno nei confronti di un dato argomento.
A questo punto la macchina è in grado di creare a richiesta quattro diversi tipi di interventi politici: si può scegliere quello repubblicano a sostegno di una data questione e quello contrario, e lo stesso si può fare a partire dall’ottica democratica.
«La parte più complicata per realizzare il sistema di generazione automatica di discorsi», precisa Kassarnig, «non era tanto il database, quanto invece il metodo di analisi da utilizzare». Bisognava trovare, infatti, due modelli di predizione – uno grammaticale e l’altro logico – che consentissero di scrivere dei discorsi di senso compiuto, grammaticalmente corretti e dal contenuto appropriato.
Per quanto riguarda il modello grammaticale, il ricercatore ha prima assegnato a ciascuna parola di ogni frase un tag (etichetta) linguistico, specificando la sua funzione (sostantivo, verbo, aggettivo o altro). Ha poi utilizzato un modello logico di linguaggio predittivo (n-6 gramma) molto semplice. «Per ogni sequenza di sei parole consecutive», illustra Kassarnig, «calcoliamo la probabilità di vedere comparire la sesta parola, viste le cinque precedenti. Questo ci permette di determinare molto rapidamente tutti i vocaboli la cui incidenza può verificarsi dopo i precedenti cinque e cosi via».
Il processo di generazione dei discorsi politici è quindi lineare. Kassarnig dice all’algoritmo che tipo di discorso – repubblicano o democratico – deve scrivere e se a favore o no di un dato argomento. L’algoritmo, tramite i due modelli predittivi di riferimento, esamina il database e sceglie le prime cinque parole a caso per iniziare il suo discorso. Una volta selezionati i vocaboli, inizia a prevedere parola dopo parola, fino a quando lo speech non è completo.
Quello di Kassarnig non è il primo caso in cui un algoritmo viene utilizzato per generare testi. Già nel 2014 Swiftkey, programma di videoscrittura capace di imparare lo stile “letterario” di una persona, era in grado di generare poesie imitando Shakespeare o Keats. Sempre nello stesso anno, Quill, un prodotto della compagnia Narrative Science, ha iniziato a scrivere articoli di giornale pressoché perfetti. E anche nel campo della narrativa, un sofisticato algoritmo creato dall’economista e programmatore Phil Parker è riuscito a produrre interi libri (800 mila già in vendita su Amazon tra fiction e thriller) in una manciata di minuti.
Quello che però sorprende di più dell’invenzione di Kassarnig è la qualità linguistica e logica dei testi generati. «Abbiamo effettuato vari test grammaticali e di contenuto e la maggior parte dei discorsi sono risultati estremamente buoni», dice, «tant’è che in una scala da 1 a 10 la media dei punteggi è stata di 8,1».
«Come è intuibile», prosegue Kassarnig, «il limite della mia invenzione è proprio il database. Dal momento che il sistema genera discorsi unicamente basandosi su quelli presenti nel suo archivio, non può scrivere qualcosa che non possiede». Tradotto: l’algoritmo non può produrre nuovi discorsi. Se quindi il presidente degli Stati Uniti volesse utilizzare il programma, dovrebbe inserire nella banca dati una serie di interventi dello stesso tipo di quello che intende produrre. «Il prodotto, seppur limitato, sarebbe abbastanza soddisfacente anche per un presidente», sostiene il creatore dell’algoritmo.
Nonostante le grandi potenzialità della sua creazione, fin qui nessun politico ha pensato a contattare Kassarnig. «Ho messo il codice sorgente in open source su Github», commenta lui sorridendo, «incoraggio chiunque a migliorarlo, forse ci sarà qualche politico che già si starà divertendo a usarlo. Chi lo sa!». Tuttavia, conclude Kassarnig «non inviterei mai nessun politico a utilizzare il mio sistema. Anzi, il fatto che un elaboratore sia in grado di produrre interventi simili a quelli reali, dovrebbe essere un campanello d’allarme. Dovrebbe far capire a chi vuole governare che deve prestare maggiore attenzione a ciò che dice, evitando di cadere proprio in quelle frasi e strutture standard che rendono questo tipo di discorsi tutti uguali fra loro».