Potremmo anche noi leggere le lingue estinte | Ecco come sarà possibile

Già da qualche anno filologi e archeologi sfruttano l’AI e l’apprendimento automatico per tradurre automaticamente le lingue perdute e morte che, normalmente, non riusciamo a decifrare. Abbiamo notizia di migliaia di lingue estinte mai decifrate. E ora potrebbero essere penetrate attraverso il trattamento di traduzione automatica.

Nel mondo, secondo i glottologi, ci sono almeno settemila lingue in uso. Ma nel corso della storia umana gli uomini hanno parlato più di ventimila lingue diverse, molte delle quali oggi sono perdute, estinte e sconosciute. Dietro queste lingue morte e dimenticate si nascondono però informazioni, percorsi, contenuti e saggezze che gli storici vorrebbero recuperare. Ecco perché i ricercatori del MIT e di Google Brain si sono impegnati per creare un nuovo sistema basato sull’intelligenza artificiale in grado di decodificare qualsiasi lingua morta.

Un’iscrizione in lineare B, la lingua degli Achei (wikipedia) – curiosauro.it

Lingue estinte: una app per decodificarle

In linguistica, la morte di un linguaggio è il luttuoso evento che segna la fine di una lingua parlata o scritta. Ciò avviene quando una popolazione scompare o un sistema culturale ed espressivo viene fagocitato da un’altra cultura. Nel periodo moderno, cioè dalla scoperta dell’America in poi, sono scomparse migliaia di lingue. Milioni di persone hanno abbandonato la loro lingua madre a favore di una lingua franca straniera. Interi popoli sono scomparsi. E in questo modo abbiamo perso anche la capacità di interpretare documenti e reperti storici del passato.

Definiamo estinta una lingua che non ha più parlanti. Una lingua morta, invece, è un sistema non più parlato ma che viene compreso dagli interpreti. Il latino, per esempio, è una lingua morta. L’etrusco, la lingua greca lineare B, il protosardo, l’accadico, le lingue degli indios dell’America del Sud, sono invece lingue isolate o estinte.

Tutte le lingue cambiano, evolvono, si perdono. Ma molti dei simboli con cui vengono trascritte non variano e sono collegabili con altre lingue ancora vive. Non cambiano nemmeno la distribuzione dei caratteri e di determinate parole. Ecco perché gli scienziati del MIT possono provare a decodificare una lingua antica e creduta estinta.

AI e filologia per decifrare la lineare B e la cuneiforme ugaritica

Iscrizioni di lingue estinte: ora possiamo decifrarle! (wikipedia) – curiosauro.it

Attraverso questo sistema e all’uso dell’AI, i ricercatori del MIT sono già riusciti a decifrare la prima lingua greca lineare B (parlata intorno al 1400 a.C.) e una lingua cuneiforme ugaritica (una forma molto antica dell’ebraico). L’approccio dei ricercatori si è concentrato su quattro proprietà chiave relative al contesto e all’allineamento dei caratteri da decifrare. Queste proprietà sono: la somiglianza distributiva, la mappatura dei caratteri monotona, la sparsità strutturale e la significativa sovrapposizione affine.

In pratica, la AI cerca in un testo di una lingua estinta dei caratteri ricorrenti, per capire la frequenza con cui ogni parola appare o venga espressa accanto a ogni altra parola. Questo modello rende disponibile una firma che definisce la parola in uno spazio parametrico multidimensionale. Ogni parola, infatti, è un vettore all’interno di questo spazio. E questo vettore può indicare una direzione e quindi un significato. Attraverso la matematica e alcune istruzioni di base, la AI crea una traiettoria di senso e quindi un significato.

In pochi anni, lo studio della linguistica ha fatto passi da gigante sulle lingue estinte. Grazie alla disponibilità di enormi database e di tecniche per far sì che le AI imparino autonomamente come tradurre e interpretare una lingua, oggi possiamo analizzare testi e reperti un tempo incomprensibili. Il MIT ha reso disponibile una app utilizzabile da chiunque, anche da chi ne capisce poco di linguistica e glottologia.

Previous articleUn’ora di sonno persa e rischi la tua vita
Next articleInflisse agli inglesi un’epocale sconfitta: il condottiero di cui non si parla