L’archivio segreto del Vaticano non è più così segreto

Senza categoria

Di

Montagne di manoscritti antichi, e una difficoltà che sembrava insuperabile: decodificarli. Ora, grazie al deep learning, è possibile riconoscerne la scrittura. E avremo presto altre novità

di Tatiana Sharon Vani

85 chilometri lineari di scaffali. Questa la grandezza dell’Archivio Segreto Vaticano. Milioni di carte e pergamene, oltre mille anni di storia racchiusi in uno dei centri di ricerca più celebri al mondo. Manoscritti difficilissimi da decifrare, la maggior parte in latino medievale. La consultazione nell’Archivio Segreto Vaticano è gratuita e aperta a ricercatori qualificati – il requisito necessario è il possesso del titolo di Laurea specialistica -; tuttavia per gli studiosi è molto complicato capire queste oscure carte: gli stili di scrittura rendono difficile anche solo l’esercizio della lettura.

Proprio per questo Paolo Merialdo, Donatella Firmani ed Elena Nieddudell’Università di Roma 3 insieme a Marco Maiorino dell’archivio Vaticano stanno cercando di risolvere queste problematiche. Come? Con il progetto In Codice Ratio. Un programma di ricerca che mira a sviluppare nuovi metodi e strumenti per supportare l’analisi del contenuto e la scoperta della conoscenza da ampie raccolte di documenti storici. L’obiettivo è fornire agli studiosi di discipline umanistiche nuovi strumenti per condurre studi basati sui dati su grandi fonti storiche.

Per ora il software è riuscito a riconoscere il 96% delle lettere. Invero, alcune lettere vengono ancora confuse: le “n”, per esempio, sono facilmente scambiate con con “ii”

Infatti, se per i caratteri a stampa mobile il riconoscimento automatico di scrittura è più facile, con i manoscritti le cose cambiano: nella scrittura a mano le lettere sono unite tra loro. Sul sito, scrivono: «Stiamo sviluppando un sistema completo per la trascrizione automatica dei contenuti dei manoscritti. Seguiamo un approccio nuovo, basato sulla segmentazione del personaggio. La nostra idea è di governare una segmentazione dei caratteri imprecisa considerando che i segmenti corretti sono quelli che danno luogo a una sequenza di caratteri che più probabilmente compongono una parola latina. Abbiamo progettato una soluzione di principio che si basa su reti neurali convoluzionali e modelli linguistici statistici».

I ricercatori dunque hanno pensato di sfruttare il diverso spessore dei tratti vergati con pennini e penne d’oca per isolare i singoli colpi di penna, per poi utilizzare una tecnica a puzzle per ricostruire le lettere. Per ora il software è riuscito a riconoscere il 96% delle lettere. Invero, alcune lettere vengono ancora confuse: le “n”, per esempio, sono facilmente scambiate con con “ii” (per esempio la parola “anno” diventa “aiino”); anche le “s” e le “f” vengono spesso scambiate (ma questo non accade solo al software, perché gli antichi copisti allungavano la s facendola assomigliare a una f, dunque è facile sbagliare).

Per ora i risultati sono comunque soddisfacenti. Nonostante alcuni errori, si può comprendere il contenuto di un testo e questo è un importante avanzamento. I ricercatori sono stati aiutati da diversi studenti dei licei romani, ai quali è stato chiesto di verificare i risultati. Avevano davanti un esempio da manuale, l’immagine reale e l’interpretazione del programma. Dopo abbastanza risposte, il programma impara e affina la tecnica. E, piano piano, l’Archivio sarà sempre meno “segreto”.

 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

CAPTCHA ImageChange Image

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Traduci
Facebook
Twitter
Instagram
YouTube