Mudanças entre as edições de "Database centrato sulle fonti"

De Cliomatica - Digital History
 
Linha 1: Linha 1:
{{HeadTrad|nome=Tiago Luís|cognome=Gil|tradutoreNome=Daria|tradutoreCognome=Mikhaylova|testo=}}
+
{{HeadTrad|nome=Tiago Luís|cognome=Gil|tradutoreNome=Daria|tradutoreCognome=Mikhaylova}}
  
  

Edição atual tal como às 06h39min de 26 de janeiro de 2022


Tempo estimado de leitura deste artigo 23 minutos - por Tiago Luís Gil (tradotto da Daria Mikhaylova)


Grandi nomi come Manfred Thaller e Alan Macfarlane hanno preferito lavorare con le basi di dati relativi a fonti omogenee. Entrambi hanno adottato come modello di lavoro una sorta di trascrizione strutturata, attraverso la quale il documento viene trascritto come di consueto, ma alcuni dati (frammenti, parole, numeri e date) vengono etichettati in modo che il computer possa elaborarli. Questo metodo di lavoro fu adottato anche da Joaquim Carvalho[1], che affermò: «i migliori metodi di inserimento dei dati da fonti storiche sono quelli che conservano la struttura originale delle informazioni»[2]. A prescindere dall’approccio adottato, dobbiamo però creare delle tabelle e dei campi per trasformare le nostri fonti in byte. Vediamo alcuni esempi.


Registri battesimali

Cominciamo da una fonte tradizionale per l’elaborazione con strumenti informatici: i documenti di battesimo. I documenti più antichi che trattano di battesimi sono conservati in alcune città italiane, ma possiamo trovarli in tutta Europa, in Africa e nelle Americhe. Trattando questo tipo di fonte, è opportuno prima informarsi - leggendo articoli e libri - sul loro corretto uso e sulle possibili variazioni nel formato (o sull’esistenza di formati del tutto anomali). Nel corso del tempo è stata sviluppata una vasta metodologia per l’analisi delle fonti battesimali; tutti i metodi potrebbero perciò rivelarsi utili a diversi stadi della ricerca. Spesso ci si può trovare a dover applicare altri approcci di ricerca, inizialmente non previsti. Quando questo accade, avere a disposizione una base di dati pronta per l’uso che sia adatta ad accogliere nuove voci risulterà molto più utile. Non si può certamente creare una base di dati che preveda ogni possibile opzione, ma certamente si può scomporre i dati dei battesimi a livello tale da poter poi provvedere a una loro ricomposizione in forme diverse.

Osserviamo come sono organizzati i registri battesimali. I registri sono di norma trascritti in un libro, forma comune e ufficialmente richiesta dalla Chiesa. Quindi, di norma, gli archivi contengono registri battesimali organizzati in libri. Il numero dei registri di battesimo per ogni volume corrisponde a n: non ne esiste né un numero minimo, né uno massimo. I libri non hanno alcuna struttura interna predefinita: i battesimi sono semplicemente elencati in ordine cronologico, l’uno dopo l'altro. Se i registri provengono da una località sudamericana, metà del libro potrebbe contenere battesimi di schiavi, mentre l’altra metà battesimi di persone libere; nelle colonie esisteva infatti la separazione dei registri per la popolazione indigena. Queste differenze non costituiscono una regola, ma in alcune occasioni sono state riscontrate, quindi il nostro modello concettuale dovrebbe prenderle in considerazione.

Anche se i documenti sono raccolti all'interno di libri, questi costituiscono una serie. I libri sono i contenitori dei registri e costituiscono una modalità per tenerli organizzati: se fosse possibile avere un libro infinito, questo libro li conterrebbe tutti. Quindi il concetto di libro è importante, ma non è centrale. L’attenzione invece deve concentrarsi sul registro stesso, che ha una struttura interna relativamente regolare. Il documento di solito inizia con la data, per proseguire con il nome della persona battezzata e il riconoscimento della condizione (o meno) di figlio/a legittimo/a e i nomi dei suoi tutori legali, per esempio i genitori; talvolta sono rinveniamo anche i nomi dei padrini. Il registro si chiude con la firma del prete e, talvolta, in calce vengono aggiunti anche commenti sui partecipanti, lo status sociale, la nazionalità, la residenza e persino sul luogo di nascita del battezzato.

Quanto descritto fino adesso ci permette di osservare che incontreremo elementi costanti e attesi: il nome del prete, dei genitori e dei padrini. Possiamo immaginare altre informazioni come i nomi dei nonni, un dato non frequente. Troveremo anche contenuti unici, presenti in un singolo registro e del tutto assenti in altri (“il figlio del capitano” per esempio fa riferimento alla professione del padre). I battesimi si svolgevano per lo più in chiese parrocchiali, ma anche su terreni di proprietà o nelle case private. Allo stesso modo il bambino può essere battezzato in extremis (battesimo “per imminente pericolo di morte”), ma poi sopravvivere e incontrare il prete per l’unzione successivamente. Pertanto il prete che registra il battesimo potrebbe non essere la stessa persona che lo ha battezzato.

Possiamo ora iniziare il nostro lavoro. Prendiamo un foglio di carta e annotiamo tutte le nostre osservazioni. A questo punto conosciamo anche la mole di lavoro da affrontare: uno, due o tre libri. Consideriamo che ogni pagina ha, in media, quattro registri e i tre volumi constano di 650 pagine. Questi ci permetterà di stimare il numero totale dei registri: circa 2600. Una volta fatta la stima possiamo pensare alle tabelle necessarie. Ne consigliamo almeno tre: una per registrare i libri, un’altra, più importante, per registrare i battesimi, e una terza per registrare le informazioni accessorie sui partecipanti al battesimo: il loro status sociale, la loro residenza, ecc.


Img6 relazioni battesimi.png



Creiamo delle tabelle ad hoc, quando i frammenti che identifichiamo nelle nostri fonti hanno rilevanza e specificità sufficiente, tali da meritare uno spazio esclusivo, creato su misura.

Pensiamo ora ai campi della tabella, iniziamo da "LIBRI". Il primo campo obbligatorio è il "codice", che identifica ogni record nella base di dati e, nel caso specifico, ogni singolo libro. Alcuni usano l'espressione "Identificatore" o "ID", altri preferiscono "Matricola". Personalmente preferisco chiamarlo "codice", soprattutto perché in esso sarà inserito un codice alfanumerico (parlante) che eventualmente corrisponderà alla fonte. Nel caso dei battesimi, farei "SAnt_bat_001" per identificare il libro di battesimo numero 1 della parrocchia di Sant'Antonio. I programmatori chiamano questo tipo di campo "chiave primaria". Vedremo successivamente che i documenti del battesimo avranno un'etichetta simile, costituita dal numero della pagina e dal numero del documento nella pagina. Il campo successivo è il nome della parrocchia, un testo; un altro campo è il numero del libro, un codice numerico e il campo successivo, testuale, descrive l’anno del primo e dell’ultimo battesimo riportato nel libro. Risulta importante avere un campo per il numero totale dei documenti nel libro e uno per il numero di pagine. Farei un campo per il preambolo del libro e un altro per la chiusura. Finirei con un campo “Osservazioni”. Forse è il caso di creare un campo anche per il nome del volume, perché alcuni libri hanno un titolo. Finora abbiamo perciò:


TABELLA LIBRI


CAMPO TIPO COMMENTI
Codice_libro* Testo (chiave primaria) Massimo 12 caratteri
Parrocchia Testo Libero
Numero del libro Numero Massimo 3 caratteri
Data iniziale Data (o testo) AAAA
Data finale Data (o testo) AAAA
Numero totale dei documenti Numero Massimo di 5 caratteri
Numero totale delle pagine Numero Massimo di 4 caratteri
Preambolo Testo Libero
Chiusura Testo Libero
Commenti Testo Libero

* Indica che il campo sarà da mettere in rapporto con un’altra tabella.

Ora dobbiamo occuparci della tabella “BATTESIMI”, questa richiederà più lavoro. Cominciamo nuovamente con il campo "codice_libro", che riporterà il codice del libro per tutti i documenti al fine di collegare libri e documenti. Per farlo non dovremmo inserire nuovamente le informazioni sul libro per ogni documento: queste verranno ereditate dal “padre”. Questa relazione è talmente importante che molti programmatori la mettono in evidenza nominando i campi "ID" (identificatore) e "ID_genitore" (identificatore del “padre”). Questa è una possibilità, ma preferisco usare la parola "codice" seguita da un'altra che indica ciò che viene codificato. In questo caso particolare, è importante usare lo stesso nome, perché presto creeremo un altro campo "codice" per un altra relazione, in questo caso con la tabella “DETTAGLI”. Il nuovo campo si chiamerà "codice_battesimo". Il campo successivo potrebbe essere "trascrizione", da impiegare per il testo completo del documento di battesimo: ci aiuterà ad evitare i successivi viaggi in archivio. Vediamo quali altri campi sarebbero necessari:

TABELLA BATTESIMI

CAMPO TIPOLOGIA COMMENTI
Codice_libro* Testo Massimo 12 caratteri
Codice_documento* Testo Massimo 19 caratteri
Trascrizione Testo Libero
Luogo di nascita Testo Libero
Luogo di battesimo Testo Libero
Officiante Testo Menù a tendina
Scrittore Testo Menù a tendina
Data di battesimo Data o Testo Libero
Data di nascita Data o Testo Libero
Nome del battezzato Testo Libero
Sesso Testo Menù a tendina (M, F)
Legittimità Testo Menù a tendina (L, N)
Padre Testo Libero
Madre Testo Libero
Padrino Testo Libero
Madrina Testo Libero
Nonno paterno Testo Libero
Nonna paterna Testo Libero
Nonno materno Testo Libero
Nonna materna Testo Libero
Commenti Testo Libero

* Indica che il campo sarà da mettere in rapporto con un’altra tabella.


Cominciamo con il campo "Codice_documento" (lungo non più di 19 caratteri), composto dal "codice_libro", dal numero della pagina del libro e dal numero progressivo del battesimo, per esempio - SAnt_bat_001_023v_3. In questo caso il codice significa: Parrocchia di Sant'Antonio, 1° libro dei Battesimi, pagina 23, terzo documento sulla pagina dall'alto verso il basso. Ogni documento avrà il suo indirizzo completo nell'Archivio della Chiesa, compatto e facile da capire. Questo codice può essere usato per citare la fonte nel testo: basta copiare e incollare.

Il sesso normalmente non è specificato nei documenti, ma può essere facilmente dedotto dal nome. Un'opzione, già utilizzata e approvata dall'autore, è quella di creare una procedura che scansioni i documenti e cerchi i nomi maschili e femminili procedendo a compilare automaticamente il campo Sesso. Per realizzare questa operazione è necessario avere un dizionario dei nomi maschili e quelli femminili. La creazione della procedura richiede tempo e il dizionario cambierà per ogni contesto, regione e periodo; poiché i nomi cambiano, tuttavia questo piccolo programma potrà essere usato per l’elaborazione dei nuovi documenti e nuove fonti.

Infine, abbiamo la terza tabella, "Dettagli", che sarà più snella per consentire una certa malleabilità; in modo da poter registrare qualsiasi tipo di dato aggiuntivo. Iniziamo con il nostro vecchio amico "codice", in questo caso, "codice_documento", che assocerà i dettagli ai rispettivi documenti di battesimo. I prossimi campi classificano il tipo dell’informazione da includere e dipendono dai criteri scelti dalla squadra di ricerca o dal singolo ricercatore. Creerei i campi "Battezzato a", "Sposato con", "Figlio di", "Qualifica", ecc. tenendo conto di ciò che appare nella fonte, ma in modo minimamente strutturato. Questi campi possono essere raggruppati in altre categorie e analizzati: un approccio più induttivo lo permetterà. Il campo che segue indicherà se chi prende parte al battesimo è legato al padre, alla madre, ai padrini o ai nonni. Il quarto campo servirà per indicare il nome della persona, per creare i collegamenti. Il quinto campo, "informazione", servirà per una dettagliata descrizione del registro. Per esempio:


TABELLA DETTAGLI

CAMPO TIPOLOGIA COMMENTI
Codice_documento* Testo Massimo 12 caratteri
Tipo di informazione Testo Menù a tendina
Quale posizione Testo Menù a tendina
Chi Testo Libero
Informazione Testo Libero
Commenti Testo Libero

* Indica che il campo sarà da mettere in rapporto con un’altra tabella.


A questo punto abbiamo già il modello concettuale del nostro database e tutti gli elementi necessari per costruire il modello logico e fisico. La costruzione di questi due dipenderà dal software scelto, e consisterà in un lavoro meccanico (a fronte delle decisioni prese). Abbiamo una base di dati "individuale", per un singolo utente. Se volessimo generare un sistema di controllo degli utenti, così da dividere compiti e auditing, dovremmo creare un'altra tabella, registrare gli utenti, e creare i campi "utente" e "data di creazione" in ciascuna delle altre tabelle, in modo che registri chi ha fatto cosa e quando. Vale la stessa logica che è stata presentata finora.

Con questa struttura, possiamo fare cose complesse con la nostra fonte; possiamo, ad esempio, selezionare solo quei libri che contengono documenti in cui il padrino era il figlio di un capitano. Con questo intendo dire che salvaguardando le specificità di ogni tipo di informazione nella creazione delle tre tabelle, possiamo comunque fare ricerche incrociate in virtù del fatto che le tre tabelle sono collegate. Rispettiamo la struttura della fonte e abbiamo sempre il modo di recuperare i dati in modo rapido. Se facessimo una sola tabella, avremmo molte difficoltà a salvare questi dati come "padrino era figlio del capitano" e tenderemmo a perdere le informazioni, collocandole in un campo molto specifico o semplicemente ignorandole. La pianificazione ci ha permesso, come abbiamo visto, un ampio utilizzo dei dati. Vedremo successivamente come, applicando il metodo Henry, possiamo integrare la nostra basi di dati con le altre dedicate a battesimi e alle morti.


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


La corrispondenza

Abbiamo visto che la corrispondenza, a differenza dei documenti dei battesimi, è considerata una fonte non strutturata; ciò non impedisce, tuttavia, la costruzione della base di dati per questo tipo di fonte. Non possiamo però forzare una struttura dove essa non esiste: la corrispondenza non ha nemmeno una forma di conservazione standardizzata simile ai libri per i documenti dei battesimi. L'unica cosa che caratterizza questo genere è il suo utilizzo nel corso dei secoli, da tempo immemorabile. Esiste una bibliografia dedicata a questo tipo di fonti, anche se non è così vasta come quella dedicata ai documenti parrocchiali, e sono numerosi gli studi che utilizzano questo tipo di fonti; il trattamento è simile a quello dei libri, compresa la pubblicazione di epistolari.

Nonostante la forma della corrispondenza vari in grande misura, ci sono alcuni dati che compaiono quasi sempre, per esempio "mittente", "destinatario", "data", "luogo del mittente", "luogo del destinatario" e il "testo della lettera". Queste informazioni costituiscono l'intelaiatura della nostra base di dati. Possiamo aggiungere altri campi per un capriccio o per sfruttare al meglio la fonte, per esempio: "persone citate", "luoghi citati" e "soggetti". Sono tre campi che evidenziano l'intervento diretto dello storico, ma senza disturbare la fonte. Possiamo anche aggiungere un campo per includere il periodo che la lettera copre, se si riferisce a cose passate o ad aspettative future, campi per un riepilogo, ritagli e altro per identificare le risorse discorsive utilizzate. In questo modo, la fonte viene scomposta in modo più appropriato, come deve essere. Per esempio:


TABELLA “CORRISPONDENZA”

CAMPO TIPOLOGIA COMMENTI
Mittente Testo Libero
Luogo del mittente Testo Libero
Destinatario Testo Libero
Luogo del destinatario Testo Libero
Data Data o testo AAAA-MM-GG
Testo della lettera Testo Libero
Codice_lettera Testo Libero


Campi opzionali che possono risultare utili:


CAMPO TIPOLOGIE COMMENTI
Persone citate Testo Libero
Luoghi citati Testo Libero
Temi Testo Libero o menù a tendina
Periodo interessato Testo Libero
Riassunto Testo Libero
Riassunto Testo Libero
Ricorrenze discorsive Testo Libero


Ci sarebbe anche un'altra possibilità, quella di creare un campo aggiuntivo per raccogliere dati su altre lettere menzionate nella lettera stessa. Questo sarebbe interessante, perché spesso le lettere sono risposte a quelle precedenti, che a loro volta erano risposte ad altre. Nel testo troviamo spesso "Rispondo alla tua lettera nel giorno..." o simile. Con questo controllo, possiamo vedere il tempo di risposta tra una lettera e l'altra e osservarne la serie, quasi una conversazione tra due persone. Per risolvere questo problema sarebbe sufficiente aggiungere un campo "in risposta alla lettera di". Un campo il cui valore è calcolato automaticamente e che potrebbe contenere la differenza tra le due date; oppure questo calcolo potrebbe essere fatto con un foglio di calcolo e il dato ricavato potrebbe poi essere esportato nella base dati. Tuttavia, la lettera non sempre risponde ad una sola lettera: può darsi che, analizzando la documentazione, troviamo delle missive, risposte lunghe a due-tre lettere precedenti (menzionate esplicitamente nel testo). In questo caso un campo "in risposta alla lettera di..." non è sufficiente: è necessario creare un'altra tabella che contenga tutte le lettere scritte in risposta ad una lettera particolare, le date e i destinatari.


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


Fonti dialogiche

Si prende l'espressione "dialogico" dal testo di Carlo Ginzburg L'Inquisitore come antropologo[3]. Il termine disegna le fonti prodotti da un dialogo, per esempio inquisizioni della Chiesa o interrogatori della polizia. Certo, le due fonti sono frutto di epoche molto diverse, ma Ginzburg ci fa notare come abbiano una struttura simile e costituiscano corpus documentari maggiormente organizzati rispetto alla semplice corrispondenza. Le fonti dialogiche formano serie complete, sia nei luoghi dove vengono prodotte che negli archivi. Ci sono molti studi su questo tipo di fonti, anche se la maggior parte delle opere che le utilizzano non fanno alcuna riflessione sulla loro produzione. La produzione di queste fonti segue un rituale, che inizia con l'instaurazione del processo dell'interrogatorio, che viene trascritto dall'inizio alla fine (con silenzi, forse, ma sempre con un inizio e una fine). È abbastanza comune trovare le affermazioni in serie e, di caso in caso, un elenco di domande poste agli interrogati. Troviamo, in altri termini, due livelli di regolarità: uno della fonte, con il processo, le affermazioni e le liste di domande; l'altro, specifico per ogni insieme, con la logica delle domande, secondo la dinamica del processo, il momento della sua produzione e il caso in questione.

Se vogliamo usare il modello relazionale per rappresentare questo tipo di fonti, abbiamo bisogno di una tabella per il processo con i campi "data di inizio" e "data di fine", oltre a una sintesi del caso, una lista di imputati e testimoni. Certamente saranno necessari dati più basilari, come il luogo dell'indagine e i nomi degli investigatori e dei giudici. In tal caso, sarebbe importante avere informazioni su ciascuna delle istanze attraverso le quali è passata, sapendo che le gerarchie di un sistema sono ricorrenti e secolari. È vero che il nostro caso potrebbe essere stato archiviato nello stesso luogo del processo, in una stazione di polizia locale; il semplice fatto di prendere in considerazione la traiettoria del caso, anche inesistente, ci fa migliorare la nostra riflessione sulla fonte e sul problema storico stesso. L’archiviazione nel luogo del processo era una consuetudine o una decisione arbitraria? Quali procedure erano maggiormente ricorrenti? Queste sono le domande che ci poniamo prima di organizzare il nostro materiale nei campi della tabella di una base di dati.

La prima cosa da scoprire è il possibile diagramma di flusso del processo, il percorso di indagine dall'inizio alla fine. Questo varia a seconda del contesto. Inoltre è necessario sapere se ci sono differenze di flusso tra i casi. Se non ci sono, basta creare una tabella "Processi", in cui possiamo segnare con un valore del campo "sì” o “no" a seconda che il percorso sia concluso. In questo modo, ogni interrogatorio verrebbe registrato in una tabella collegata "Interrogatori", poiché ogni processo può avere n sessioni di interrogatorio, o dialoghi. E poiché anche il numero di domande è sempre n, sarebbe importante creare una tabella "Domande", che avrebbe, oltre al campo "codice", i campi "domanda" e "risposta".

Mi sembra che non ci sia bisogno di ripetere le tabelle con i dati organizzati, come ho fatto nell'esempio dei documenti dei battesimi o per la corrispondenza. A questo punto, il lettore può già elaborare il proprio schema a partire dalle riflessioni iniziali qui esposte. L'importante è non banalizzare concetti complessi o che richiedono di essere elaborate ulteriormente. Il nostro lavoro di storici è già di per sé spesso una semplificazione. Anche il database è una semplificazione e la semplificazione è necessaria per l’organizzazione dei dati. Non c’è bisogno di semplificare ulteriormente, perché abbiamo i strumenti sufficienti per trattare le fonti con la dovuta cura.

Bibliografia

  1. CARVALHO, Joaquim, «Soluzioni informatiche per microstorici», in Quaderni Storici, XXVI, 03/1991, pp. 761-791.
  2. Ibidem
  3. GINZBURG, Carlo, L’inquisitore come antropologo, in R. Pozzi, A. Prosperi, a cura, Studi in onore di Armando Saitta, Pisa, Giardini, 1989, pp. 23-33.



Citazione di questo articolo
Come citare: GIL, Tiago. "Database centrato sulle fonti". In: CLIOMATICA - Portale di Storia Digitale e ricerca. Disponibile in: http://lhs.unb.br/cliomatica/index.php/Database_centrato_sulle_fonti. il giorno: 1 di junho de 2024.






Informare errori in questa pagina