Questo sito utilizza cookies tecnici (propri e di terze parti) come anche cookie di profilazione (di terze parti) sia per proprie necessità funzionali, sia per inviarti messaggi pubblicitari in linea con tue preferenze. Per saperne di più o per negare il consenso all'uso dei cookie di profilazione clicca qui. Scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie Ok, accetto

 2010  aprile 19 Lunedì calendario

LA LINGUA NON DIVIDE PI NELLA BABELE DEL WEB

Lost in Translation non a Tokyo come nel film di Sofia Coppola, ma nel web multilingue. Mai come ora sulla Rete si avvertono le interconnessioni fra globalizzazione e traduzione, nella conversazione globale che i blog e wiki hanno reso alla portata di tutti con la pubblicazione multimediale di facile utilizzo. Ormai non basta più l’inglese, "lingua franca" della babele digitale. i siti in mandarino rappresentano un quinto della blogsfera mentre l’arabo sta recuperando velocemente il suo ritardo sul web. Nell’evoluzione della rete, la funzione della traduzione automatica da caratteristica complementare diventa essenziale, e infatti è in piena esplosione in tutto il mondo il mercato dei software che garantiscono la traduzione simultanea incrociata fra tutte le lingue del mondo. Si va verso un’Internet senza più barriere linguistiche: in un futuro neanche troppo lontano un cinese potrà leggere una pagina di Repubblica in perfetto mandarino e vedere i video tradotti nella sua lingua. Uno scenario verosimile grazie allo sviluppo di diversi servizi di traduzione, automatizzati o gestititi da esseri umani (con tutti i prevedibili miglioramenti in termini di qualità della traduzione), in tempo reale o semireale una volta assai costosi, e oggi offerti spesso gratuitamente online.
Tanto per cominciare ci sono i sistemi di traduzione automatica incorporati nei principali motori di ricerca: Google Translate, Babelfish di Yahoo, Bing di Microsoft. A livello quantitativo Google batte tutti con 51 idiomi. Certo, non è facile affidare ad una macchina la tradzione ma tecnicamente è superato il modello di traduzione che si appoggia a un lessico di riferimento e a regole sintattiche e semantiche precise. Ci si basa invece su un processo di tipo statistico, nel senso che i sistemi vengono addestrati con milioni di frasi prese da testi paralleli (testo originale e la sua traduzione umana), queste formano le memorie di traduzioni. Il sistema "impara" a riconoscere le corrispondenze tra parole e segmenti di frase in ogni coppia di lingue e assegna una probabilità più alta alle associazioni più ricorrenti, in modo da poterle poi riprodurre in fase di traduzione applicando altri algoritmi e parametri statistici.
Inizialmente questi motori di traduzione erano focalizzati sul supporto tecnico e le memorie di traduzione erano circoscritte a materiale tecnico. Con la loro evoluzione si è ampliato il database: si utilizza per esempio l’archivio delle traduzioni in 11 lingue del Parlamento Europeo. Per i segmenti che non hanno trovato corrispondenza, così come per gli idiomi minori, interviene un umano. Si arricchisce continuamente il patrimonio digitale di risorse linguistiche, come ad esempio il progetto dell’università Ca’ Foscari: dall’inglese al veneto. Per superare il limite delle traduzioni automatiche, che colgono il senso del testo originale ma non le sfumature linguistiche, interviene il "modello transitorio" delle traduzione collettive svolte da studenti e professionisti della lingua che, spesso a costo zero, lavorano per la realizzazione dell’Internet poliglotta.
«Tempo e prossimità geografica sono concetti irrilevanti sul web, rimane la frammentazione linguistica», dice Brian McConnell, sviluppatore di Worlwide Lexicon WWL, software open source per creare, modificare e condividere le traduzioni online. WWL è il programma utilizzato dalle migliaia di volontari che, gratuitamente traducono pubblicazioni occidentali dall’Economist a Time. Il potere dell’intelligenza artificiale si fonde con quella umana mixato allo spirito collaborativo da web 2.0. Sin dal 2007, Yeeyan è la più famosa comunità di volontari di traduzione online dalla stampa inglese in mandarino. Dopo essere incappato, lo scorso 30 novembre, in un periodo di oscuramento per decisione delle autorità cinesi, il sito ha riaperto a gennaio cambiando linea editoriale: abbandonata l’attualità politica per tecnologia, scienze e business.
L’analogo per l’arabo è Meedan.net con un aggiunta di social networking dove utenti che parlano inglese e arabo dibattono questioni sul Medio Oriente. I post automaticamente tradotti nell’altra lingua sono aggiustati da editor che sono anche mediatori fra lingue e culture oltre che traduttori. Ma in fondo anche le voci di Wikipedia sono disponibili in 200 lingue e il 36% dei 7 milioni di blog che girano su WordPress non è in inglese. Ora WWL dovrebbe diventare un’applicazione di Wordpress. Altra iniziativa di traduzioni aperte e collaborative è dotSub. Il sito che consente agli utenti di sottotitolare i video in ogni lingua per poterli poi tradurre senza fare riferimento alla lingua originale del film semplificando il lavoro dei doppiatori.
Il professionista remunerato rimane l’alternativa migliore con il vantaggio di aver abbassato i prezzi grazie al cosiddetto crowdsourcing, l’esternalizzazione flessibile di piccoli compiti a una rete di individui disposti a svolgerle a fronte di un pagamento a cottimo, tutto online. Così sono nati ProZ e SpeakLike che ha un pool di 3mila traduttori e offre traduzioni nel giro di poche ore al costo di 0,050,15 cent a parola a seconda della fascia oraria.