Esempi del Semantic Web nella Digital History

De Cliomatica - Digital History
Tempo di lettura 13 minuti - per Federico Mazzoni


Come si sarà intuito da questa breve presentazione, il Semantic Web è un potente strumento adatto ai più molteplici utilizzi. In ambito di Digital History, possiamo rilevare tre possibili macro-utilizzi:

  • Classificazione: come detto il Semantic Web è particolarmente adatto a creare tassonomie. Allo storico è così dato modo di catalogazione le varie fonti, ad esempio, a seconda del loro periodo storico o della loro veridicità. Il contenuto stesso delle fonti può essere catalogato, ad esempio, separando nettamente personaggi o fatti realmente esistiti da altri la cui esistenza è supposta, o solo leggendaria;
  • Ricerca: la fitta rete di relazioni semantiche che si viene a creare in una ontologia può portare a scoprire la correlazione di due oggetti: ad esempio, due eventi distanti l’un l’altro possono aver avuto gli stessi protagonisti o due personaggi storici possono essere legati da una linea di sangue (le ontologie sono particolarmente adatte a realizzare degli alberi genealogici). Il ragionatore di OWL può inoltre trovare inconsistenze all’interno della ricerca, portando lo storico a rivalutare la bontà di alcune delle fonti utilizzate;
  • Esposizione: sorta di controparte “lato utente” dei primi due utilizzi, che sono invece “lato ricercatore”. I contenuti frutto della ricerca dello storico possono essere offerti al pubblico gerarchizzati, permettendone la fruizione in modo intuitivo. Partendo da un oggetto di proprio interesse, l’utente può poi passare ad altri sfruttando le relazioni semantiche che li legano (un quadro di uno stesso periodo storico, o di uno stesso autore).

Come già accennato, uno dei grandi punti di forza del Semantic Web è l’inter-operabilità dei grafi e, più in generali, delle ontologie – ontologie diverse sviluppate indipendentemente da un diverso gruppo di persone possono facilmente essere integrate l’un l’altra. D’altra parte, uno stesso oggetto potrebbe essere stato classificato diversamente da due ontologie.

Il consorzio Data for History [1] fornisce una soluzione con il progetto OntoME [2], che propone un insieme di classi e proprietà pensati per i più disparati utilizzi in ambito storico. L’utilizzo di OntoME per la realizzazione di ontologie, e la loro successiva integrazione, massimizza così l’interoperabilità del Semantic Web, con tutti i conseguenti vantaggi. Ad esempio, se volessimo classificare l’evento “destructionOfAndreaDoria” potremmo usare la classe Destruction [3], sottoclasse di End of Existence [4] (che racchiude anche Death, Dissolution e Transformation), a sua volta sottoclasse di Event [5], consapevoli che qualunque altro ontologia realizzata partendo da OntoME avrà proposto la medesima classificazione.

Il sito del consorzio, che consigliamo ai lettori di visitare, offre anche vari paper e video delle conferenze periodicamente organizzate e un indice dei progetti realizzati con OntoME [6]. Cliccando su un progetto e poi su “Graph”, è possibile osservare come le varie classi utilizzate da un progetto si relazionano fra loro (ma purtroppo non gli individui all’interno di ciascuna classe).


Catalogo generale dei Beni Culturali

MAZZONI esempi dh 01.png

Nel marzo del 2021 il Ministero della Cultura della Repubblica italiana ha lanciato il nuovo Catalogo generale dei Beni Culturali [7], forse il progetto più “di alto profilo” realizzato in Italia con il Semantic Web. Il sito rientra nel “filone espositivo” di cui abbiamo accennato: al visitatore è data la possibilità di accedere alle diverse opere nel catalogo per autori, luoghi, settori o anche itinerari realizzati ad hoc. Per ogni opera catalogata è anche mostrato un knowledge graph e altre opere dello stesso periodo o dello stesso autore. Il carattere estremamente eterogeneo delle opere classificate (da beni musicali a storico-artistici) pone il progetto al di fuori delle ontologie in senso stretto: il Catalogo generale è un ottimo esempio di linked data. Sul canale YouTube del Ministero della Cultura è possibile visualizzare la presentazione del Catalogo [8], dove Valentina Presutti, fra le curatrici del progetto e ricercatrice presso il CNR, ha brevemente mostrato una possibile evoluzione del Catalogo in senso virtuale: le varie opere catalogate potrebbero essere ricreate in una realtà virtuale, permettendo all’utente di interagire direttamente con i vari “link semantici”.

Vespasiano da Bisticci, Lettere

MAZZONI esempi dh 02.png

Vespasiano da Bisticci fu un importante libraio e umanista toscano del XV secolo. Il suo ampio corpus di lettere è stato digitalizzato dall’Università di Bologna ed indicizzato in un’ontologia online [9], liberamente accessibile dal pubblico e nelle sue funzionalità periodicamente aggiornata. Il sito offre la possibilità di visionare ogni lettera di Vespasiano per corrispondenza, per luogo, per data, per segnatura, agevolando il più possibile la ricerca di particolari lettere. Uscendo dall’ambito del web semantico, di ogni lettera sono poi annotati – con il linguaggio di mark-up XML – elementi quali le persone o i luoghi citati.

MAZZONI esempi dh 03.png

Se il Catalogo dei Beni Culturali si rivolgeva a un pubblico generalista, il corpus di Vespasiano è pensato come un potente strumento di ricerca per lo storico e rappresenta così tanto un punto d’arrivo, quanto un punto di partenza. Particolarmente interessante risulta anche la sezione del sito dedicata alla metodologia [10] dietro il progetto, che bene descrive i processi dietro la creazione di un corpus come quello di Vespasiano – dall’annotazione del testo alla conversione in linguaggio RDF.  

Dantesources

MAZZONI esempi dh 04.png

Altro importante progetto italiano, Dantesources [11] permette di “navigare” il corpus del Sommo Poeta analizzando di ciascuna opera i dati relativi alle fonti a cui Dante ha attinto, agli autori citati, alle aree tematiche delle opere citate. Il sito offre un’interfaccia intuitiva che, grazie a grafici e tabelle interattive, permette all’utente di visualizzare “a colpo d’occhio” i risultati di una ricerca. Nell’immagine seguente notiamo, ad esempio, che Cicerone è citato da Dante in tutte le sue opere, ma in particolare nel Convivio. Cliccando sul titolo dell’opera possiamo esplorarla ancora più a fondo e scoprire che la maggior parte delle citazioni è inclusa nel capitolo 6 del libro 4.

MAZZONI esempi dh 05.png
MAZZONI esempi dh 06.png








La possibilità di esportare i risultati della ricerca rendono il sito un utile strumento di ricerca per l’approfondimento delle opere di Dante – effettivamente, una versione estremamente versatile ed interattiva di un indice bibliografico. È anche possibile effettuare ricerche attraverso SPARQL, il linguaggio di interrogazione di RDF.  

The Enslaved Ontology

MAZZONI esempi dh 07.png

Realizzata da un gruppo di ricercatori della Michigan State University con diversi partner (fra cui la University of Maryland), la Enslaved Ontology [12] è un imponente progetto dedicato alla plurisecolare tratta degli schiavi che ha tristemente caratterizzato il continente nordamericano. Il progetto indicizza quasi 500.000 persone – fra schiavi e padroni – e i luoghi e gli eventi in qualche modo legati a loro. Per dare un’idea della sua vastità: l’evento più antico indicizzato risale al 1508 (la nascita del futuro conquistador Juan Garrido [13]), quello più recente, la morte dello schiavista John Bryce, al 1975 [14]. L’ontologia si inserisce in tutti e tre i filoni che abbiamo individuato: è una grande classificazione che permette al pubblico non specializzato di accedere a dati interessanti e agli storici di effettuare ricerche. Scrive il Washington Post:

I fondatori di Enslaved.org auspicano che la piattaforma ad accesso libero aiuti a sfatare l’immagine comune di persone poco istruite. che avrebbero lavorato e sofferto nelle piantagioni per poi morire. Molte delle persone ridotte in schiavitù erano dotate di grandi competenze – hanno, ad esempio, portato la conoscenza della produzione di riso nelle pianure della Gerogia, del South Carolina, nel nord-est del Brasile[1].

Il progetto non sarebbe stato possibile senza l’interoperabilità che caratterizza il Semantic Web: molti dati provengono da dataset già esistenti [15] e realizzati indipendentemente. Altri, invece, sono il risultato di un processo di astrazione e digitalizzazione delle storie raccontate da alcune biografie [https://enslaved.org/stories+. Il progetto è in continua evoluzione ed espansione. L’auspicio è di riuscire a documentare la vita – e i nomi – dei tanti schiavi anonimi che, per ora, non hanno trovato posto nei libri di Storia.  

Altri progetti

Mapping Manuscript Migration

MAZZONI esempi dh 08.png

Di particolare interesse per lo storico può risultare il progetto Mapping Manuscript Migration [16], ontologia che si prefigge di catalogare la stesura e il trasferimento di proprietà di manoscritti europei medioevali e rinascimentali. A differenza che nell’ontologia di Vespasiano, i documenti non sono digitalizzati ma vengono indicate le collezioni in cui possono essere reperiti.





CDEC Digital Library

MAZZONI esempi dh 09.png


Un progetto dalle finalità analoghe a quelle della Enslaved Ontology è la CDEC Digital Library [17], la cui principale mission – leggiamo sul sito – è «promuovere lo studio delle vicende, della cultura e della realtà degli Ebrei, con particolare riferimento all’Italia ed all’età contemporanea e con esse contrastare ogni forma di razzismo e antisemitismo». La Fondazione CDEC ha promosso un’ontologia dedicata alla Shoah, per la cui realizzazione ho avuto un ruolo determinante le peculiarità del Semantic Web: grazie al reasoner è stato possibile «ricostruire su base semantica i legami fra le varie “entità”: persone appartenenti allo stesso nucleo familiare; persone e luoghi; persone che vissero comuni esperienze (di incarceramento, di trasporto, di reclusione nei campi nazisti)».



CultureSampo

MAZZONI esempi dh 10.png

Gli appassionati di cultura finlandese troveranno particolarmente interessante i progetti promossi dal sito http://www.kulttuurisampo.fi/ [18], o CultureSampo (che prende il proprio nome dal Sampo, il magico oggetto al centro del Kalevala), che applicano la logica del web semantico alla storia finlandese in età moderna, al Kalevala stesso, alla biografia di personaggi famosi e via dicendo. Solo poche delle pagine di CultureSampo sono però tradotte in inglese, impedendo così la fruizione degli ottimi contenuti al pubblico internazionale.




BiographyNet

Segnaliamo infine BiographyNet [19], un progetto multidisciplinare (ha un occhio di riguardo per il NLP) che si promette di connettere e comparare le biografie di più personaggi storici. I risultati ottenuti dal gruppo di ricerca non sono però liberamente accessibili dal pubblico.


Bibliografia e sitografia



Citazione di questo articolo
Come citare: MAZZONI, Federico . "Esempi del Semantic Web nella Digital History". In: CLIOMATICA - Portale di Storia Digitale e ricerca. Disponibile in: http://lhs.unb.br/cliomatica/index.php/Esempi_del_Semantic_Web_nella_Digital_History. il giorno: 29/06/2024.






Informare errori in questa pagina