Revisão de 08h51min de 13 de março de 2021 por Diacronie1 (discussão | contribs) (Criou página com '{{head|nome=Tiago|sobrenome=Gil}} {{Bds}} Grandi nomi come Manfred Thaller e Alan Macfarlane hanno preferito lavorare con le basi di dati relativi a fonti omogenee. Entramb...')
(dif) ← Edição anterior | Revisão atual (dif) | Versão posterior → (dif)

Database centrato sulle fonti

De Cliomatica - Digital History


Tempo estimado de leitura deste artigo 22 minutos - por Tiago Gil


PORTAL DE BANCOS DE DADOS

Bancos de dados e sua potencial utilidade na pesquisa em história (texto que apresenta o quanto de teoria e metodologia há por trás das aparentes decisões técnicas de quem cria o banco de dados)

Bancos de dados: um breve histórico do seu uso por historiadores (verbete sobre diversos historiadores que usaram bancos de dados em suas pesquisas, demonstrando algumas dos problemas enfrentados por eles)

Estrutura de dados e Modelos conceituais, lógicos e físicos (Artigos de caráter técnico que apresentam o vocabulário básico de criação de bancos de dados)

Aspectos visuais (Algumas notas sobre como bases visualmente claras podem ser úteis, além de dicas sobre como criar bases visualmente boas)

Bases centradas na fonte (Texto sobre bases de dados criadas com base em uma fonte histórica, como Registros de Batismos, cartas ou Inventários Post-Mortem)

Bases centradas no método (Texto sobre bases de dados criadas com base em um método ou problema de pesquisa, como aquelas focadas em indivíduos, famílias, redes, etc)

Grandi nomi come Manfred Thaller e Alan Macfarlane hanno preferito lavorare con le basi di dati relativi a fonti omogenee. Entrambi hanno adottato come modello di lavoro una sorta di trascrizione strutturata, attraverso la quale il documento è trascritto normalmente, ma alcuni dati (frammenti, parole, numeri e date) venivano etichettati in modo che il computer potesse elaborarli. Questo metodo di lavoro fu adottato anche da Joaquim Carvalho[1], che affermò: «i migliori metodi di inserimento dei dati da fonti storiche sono quelli che conservano la struttura originale delle informazioni». A prescindere dall’approccio adottato, dobbiamo però creare delle tabelle e dei campi per trasformare le nostri fonti in byte. Vediamo alcuni esempi.


Registri battesimali

Cominciamo da una fonte molto tradizionale per l’elaborazione con strumenti informatici: i documenti di battesimo. I documenti più antichi riportanti battesimi sono conservati in alcune città italiane, ma possiamo trovarli in tutta Europa, in Africa e nelle Americhe. Trattando questo tipo di fonte, è opportuno prima informarsi - leggendo articoli e libri - sul loro corretto uso e sulle possibili variazioni nel formato (o l’esistenza di formati del tutto anomali). Una vasta metodologia è stata sviluppata nel tempo per l’analisi delle fonti battesimali, tutti i metodi potrebbero quindi essere utili a diversi stadi della ricerca. Spesso ci si può trovare nella necessità di applicare altri approcci di ricerca, non previsti inizialmente. Quando questo accade, una base di dati pronta per l’uso e per accogliere nuove possibilità sarà molto più utile. Non si può certamente creare una base di dati che preveda ogni variazione, ma certamente si può scomporre i dati dei battesimi a livello tale da poter poi provvedere a una loro ricomposizione in forme diverse.

Osserviamo come sono organizzati i registri battesimali. I registri sono di norma compilati in un libro, forma comune e ufficialmente richiesta dalla Chiesa. Quindi di norma, gli archivi contengono registri battesimali organizzati in libri. Il numero dei registri di battesimo per ogni volume è uguale a n. Non esiste né un numero minimo, né uno massimo. I libri non hanno alcuna struttura interna predefinita: i battesimi sono semplicemente elencati in ordine cronologico, l’uno dopo l'altro. Se i registri provengono da una località sudamericana metà del libro potrebbe contenere battesimi di schiavi, mentre l’altra metà battesimi di persone libere; nelle colonie esisteva infatti la separazione dei registri per la popolazione indigena. Queste differenze non costituiscono una regola, ma sono state trovate occasionalmente, quindi il nostro modello concettuale dovrebbe prenderle in considerazione.

Anche se i documenti sono raccolti all'interno di libri, questi costituiscono una serie. I libri sono i contenitori dei registri e un modo per tenerli organizzati, ma se fosse possibile avere un libro infinito, beh questo libro li conterrebbe tutti. Quindi il concetto del libro è importante, ma non è centrale. L’attenzione invece deve concentrarsi sul registro stesso, che ha una struttura interna relativamente regolare. Il documento di solito inizia con la data, per proseguire con il nome della persona battezzata e la sua legittimità e i nomi delle persone responsabili, per esempio i genitori; ogni tanto sono presenti anche i nomi dei padrini. Il registro si chiude con la firma del prete, e talvolta in coda sono aggiunti anche commenti sui partecipanti, lo status sociale, nazionalità, residenza e anche sul luogo di nascita del battezzato.

Quanto descritto fino adesso ci permette di osservare che incontreremo elementi costanti e attesi; come il nome del prete, dei genitori e dei padrini. Possiamo immaginare altre informazioni come i nomi dei nonni, ma non capita spesso. Ci sono anche contenuti unici, presenti in un singolo registro e del tutto assenti in altri (“il figlio del capitano” per esempio riferisce alla professione del padre). I battesimi si svolgevano per lo più in chiese parrocchiali, ma anche su terreni di proprietà o nelle case private. Allo stesso modo, il bambino può essere battezzato in extremis (battesimo “per imminente pericolo di morte”), ma poi sopravvivere e incontrare il prete per l’unzione più tardi. Pertanto il prete che registra il battesimo potrebbe non essere la stessa persona che ha battezzato.

Possiamo ora iniziare il nostro lavoro. Prendiamo un foglio di carta e annotiamo tutte le nostre osservazioni. A questo punto conosciamo anche la mole di lavoro da affrontare: uno, due o tre libri. Consideriamo che ogni pagina ha, in media, quattro registri e i tre volumi contano 650 pagine. Questi ci permette di stimare il numero totale dei registri: circa 2600. Una volta fatta la stima possiamo pensare alle tabelle necessarie. Ne consigliamo almeno tre: una per registrare i libri, un’altra, più importante, per registrare i battesimi, e una terza per registrare le informazioni accidentali sui partecipanti del battesimo: il loro status sociale, la loro residenza, ecc.


TABELA "LIVROS" ----> TABELA "BATISMOS" ----> TABELA "DETALHES"


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


Creiamo delle tabelle ad hoc, quando i frammenti che identifichiamo nelle nostri fonti hanno rilevanza e specificità sufficiente, tali da meritare uno spazio esclusivo, creato su misura.

Pensiamo ora ai campi della tabella, iniziamo da "LIBRI". Il primo campo obbligatorio è il "codice", che identifica ogni record nella base di dati, e nel caso specifico ogni singolo libro. Alcuni usano l'espressione "Identificatore" o "ID", altri preferiscono "Matricola". Personalmente preferisco chiamarlo "codice", soprattutto perché in esso sarà inserito un codice alfanumerico (parlante) che eventualmente corrisponderà alla fonte. Nel caso dei battesimi, farei "SAnt_bat_001" per identificare il libro di battesimo numero 1 della parrocchia di Sant'Antonio. I programmatori chiamano questo tipo di campo "chiave primaria". Poi vedremo che i documenti del battesimo avranno etichetta simile, costruita dal numero della pagina e il numero del documento nella pagina. Il campo successivo è il nome della parrocchia, un testo; un altro campo è il numero del libro, un numerico, e il successivo campo è testo e descrive l’anno del primo e dell’ultimo battesimo riportato nel libro. Importante avere un campo per il numero totale dei documenti nel libro e uno per il numero di pagine. Farei un campo per il preambolo del libro e un altro per la chiusura. Finirei con un campo “Osservazioni”. Forse è il caso di creare un campo per il nome del volume, perché alcuni libri hanno un titolo. Finora abbiamo:


TABELLA "LIBRI"


CAMPO TIPO COMMENTI
Codice_libro* Testo (chiave primaria) Massimo 12 caratteri
Parrocchia Testo Libero
Numero del libro Numero Massimo 3 caratteri
Data iniziale Data (o testo) AAAA
Data finale Data (o testo) AAAA
Numero totale dei documenti Numero Massimo di 5 caratteri
Numero totale delle pagine Numero Massimo di 4 caratteri
Preambolo Testo Libero
Chiusura Testo Libero
Commenti Testo Libero
  • Indica che il campo sarà da mettere in rapporto con un’altra tabella.

Ora dobbiamo occuparci della tabella “BATTESIMI”, questa richiederà più lavoro. Cominciamo nuovamente con il campo "codice_libro", che riporterà il codice del libro per tutti i documenti al fine di collegare libri e documenti. Per farlo non dovremmo inserire nuovamente le informazioni sul libro per ogni documento, esse saranno ereditate dal “padre”. Questa relazione è talmente importante che molti programmatori la mettono in evidenza nominando i campi "ID" (identificatore) e "ID_genitore" (identificatore del “padre”). Questa è una possibilità, ma preferisco usare la parola "codice" seguita da un'altra che indica ciò che viene codificato. E in questo caso particolare, è importante usare lo stesso nome, perché presto creeremo un altro campo "codice" per un altra relazione; questa volta con la tabella “DETTAGLI”. Il nuovo campo si chiamerà "codice_battesimo". Il campo successivo potrebbe essere "trascrizione" per il testo completo del documento di battesimo, ci aiuterà ad evitare i successivi viaggi in archivio. Vediamo quali altri campi sarebbero necessari:

TABELLA BATTESIMI

CAMPO TIPOLOGIA COMMENTI
Codice_libro* Testo Massimo 12 caratteri
Codice_documento* Testo Massimo 19 caratteri
Trascrizione Testo Libero
Luogo di nascita Testo Libero
Luogo di battesimo Testo Libero
Officiante Testo Menù a tendina
Scrittore Testo Menù a tendina
Data di battesimo Data o Testo Libero
Data di nascita Data o Testo Libero
Nome del battezzato Testo Libero
Sesso Testo Menù a tendina (M, F)
Legittimità Testo Menù a tendina (L, N)
Padre Testo Libero
Madre Testo Libero
Padrino Testo Libero
Madrina Testo Libero
Nonno paterno Testo Libero
Nonna paterna Testo Libero
Nonno materno Testo Libero
Nonna materna Testo Libero
Commenti Testo Libero
  • Indica che il campo sarà da mettere in rapporto con un’altra tabella.


Cominciamo con il campo "Codice_documento" (lungo non più di 19 caratteri), composto dal "codice_libro", dal numero della pagina del libro e numero progressivo del battesimo, per esempio - SAnt_bat_001_023v_3. In questo caso il codice ha significato: Parrocchia di Sant'Antonio, 1° libro dei Battesimi, pagina 23 versetto, 3 documento sulla pagina dall'alto verso il basso. Ogni documento avrà il suo indirizzo completo nell'Archivio della Chiesa, compatto e facile da capire. Questo codice può essere usato per citare la fonte nel testo. Basta copiare e incollare.

Il sesso normalmente non è specificato nei documenti, ma può essere facilmente dedotto dal nome. Un'opzione, già utilizzata e approvata dall'autore, è quella di creare una procedura che scansiona i documenti e cerca i nomi maschili e femminili e compila automaticamente il campo Sesso. Per realizzare questa operazione è necessario avere un dizionario dei nomi maschili e quelli femminili. La creazione del procedura richiede tempo e il dizionario cambierà per ogni contesto, regione e periodo; poiché i nomi cambiano, tuttavia questo piccolo programma potrà essere usato per l’elaborazione dei nuovi documenti e nuove fonti.

Infine, abbiamo la terza tabella, "Dettagli", che sarà più snella per consentire una certa malleabilità; in modo da poter registrare qualsiasi tipo di dato aggiuntivo. Iniziamo con il nostro vecchio amico "codice", in questo caso, "codice_documento", che assocerà i dettagli con i rispettivi documenti di battesimo. I prossimi campi classificano il tipo dell’informazione da includere e dipendono dai criteri scelti dalla squadra di ricerca o dal singolo ricercatore. Creerei i campi "Battezzato in", "Sposato con", "Figlio di", "Qualifica", ecc. tenendo conto di ciò che appare nella fonte, ma in modo minimamente strutturato. Questi campi possono essere raggruppati in altre categorie e analizzate. Un approccio più induttivo lo permette. Il seguente campo indica se il partecipante del battesimo è collegato con il padre, con la madre, con i padrini o con i nonni. Il quarto campo servirà per indicare il nome della persona, per creare i collegamenti. Il quinto campo, "informazione", servirà per una dettagliata descrizione del registro. Per esempio:


TABELLA "DETTAGLI

CAMPO TIPOLOGIA COMMENTI
Codice_documento* Testo Massimo 12 caratteri
Tipo di informazione Testo Menù a tendina
Quale posizione Testo Menù a tendina
Chi Testo Libero
Informazione Testo Libero
Commenti Testo Libero
  • Indica che il campo sarà da mettere in rapporto con un’altra tabella.


A questo punto abbiamo già il modello concettuale del nostro database e tutti gli elementi per costruire il modello logico e fisico. La costruzione di questi due dipenderà dal software scelto, e consisterà in un lavoro meccanico (a fronte delle decisioni prese). Abbiamo una base di dati "individuale", per un singolo utente. Se volessimo generare un sistema di controllo degli utenti, dividere i compiti e auditing, dovremmo creare un'altra tabella, registrare gli utenti, e creare i campi "utente" e "data di creazione" in ciascuna delle altre tabelle, in modo che registri chi ha fatto cosa e quando. Vale la stessa logica presentata finora.

Con questa struttura, possiamo fare cose complesse con la nostra fonte; possiamo, ad esempio, selezionare solo quei libri che contengono documenti in cui il padrino era il figlio di un capitano. Con questo intendo dire che salvaguardando le specificità di ogni tipo di informazione nella creazione delle tre tabelle, possiamo comunque fare ricerche incrociate in virtù del fatto che le tre tabelle sono collegate. Rispettiamo la struttura della fonte e abbiamo sempre il modo di recuperare i dati in modo rapido. Se facessimo una sola tabella, avremmo molte difficoltà a salvare questi dati come "padrino era figlio del capitano" e tenderemmo a perdere le informazioni, collocandole in un campo molto specifico o semplicemente ignorandole. La pianificazione ci ha permesso, come abbiamo visto, un ampio utilizzo dei dati. Più tardi vedremo come, applicando il metodo Henry, possiamo integrare la nostra basi di dati con le altre dedicate a battesimi e alle morti.


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


La corrispondenza

Abbiamo visto che la corrispondenza, a differenza dei documenti di battesimi, è considerata una fonte non strutturata; ma ciò non impedisce la costruzione della base di dati per questo tipo di fonte. Non possiamo però forzare una struttura dove essa non esiste, la corrispondenza non ha nemmeno una forma di conservazione standardizzata simile ai libri per i documenti dei battesimi. L'unica cosa che garantisce la specificità del genere è il suo ampio utilizzo nei secoli, è immemorabile. Esiste una bibliografia dedicata a questo tipo di fonti, anche se non è così vasta come quella dedicata ai documenti parrocchiali, e sono numerosi gli studi che utilizzano questo tipo di fonti; ma sempre con un trattamento simile a quello dei libri, compresa la pubblicazione di serie di corrispondenza.

Nonostante la forma della corrispondenza varia molto, ci sono alcuni dati che compaiono quasi sempre, per esempio "mittente", "destinatario", "data", "luogo del mittente", "luogo del destinatario" e il "testo della lettera". Queste informazioni costruiscono uno scheletro della nostra basi di dati. Possiamo aggiungere altri campi per un capriccio o per sfruttare al meglio la fonte, per esempio: "persone citate", "luoghi citati" e "soggetti". Sono tre campi che evidenziano l'intervento diretto dello storico, ma senza disturbare la fonte. Possiamo anche aggiungere un campo per includere il periodo che la lettera copre, se si riferisce a cose passate o ad aspettative future, campi per un riepilogo, ritagli e altro per identificare le risorse discorsive utilizzate. In questo modo, la fonte viene scomposta in modo più appropriato, come deve essere. Per esempio:


TABELLA “CORRISPONDENZA”

CAMPO TIPOLOGIA COMMENTI
Mittente Testo Libero
Luogo del mittente Testo Libero
Destinatario Testo Libero
Luogo del destinatario Testo Libero
Data Data o testo AAAA-MM-GG
Testo della lettera Testo Libero
Codice_lettera Testo Libero


Campi opzionali che possono risultare utili:


CAMPO TIPOLOGIE COMMENTI
Persone citate Testo Libero
Luoghi citati Testo Libero
Temi Testo Libero o menù a tendina
Periodo interessato Testo Libero
Riassunto Testo Libero
Recortes Testo Libero
Ricorrenze discorsive Testo Libero


Ci sarebbe anche un'altra possibilità, quella di creare un campo aggiuntivo per raccogliere dati su altre lettere menzionate nella lettera stessa. Questo sarebbe interessante, perché spesso le lettere sono risposte a quelle precedenti, che a loro volta erano risposte ad altre. Nel testo troviamo spesso "Rispondo alla tua lettera in giorno..." o simile. Con questo controllo, possiamo vedere il tempo di risposta tra una lettera e l'altra e osservarne la serie, quasi una conversazione tra due persone. Per questo, sarebbe sufficiente aggiungere un campo "in risposta alla lettera di". Un campo il cui valore è calcolato in automatico e potrebbe contenere la differenza tra le due date; o questo calcolo potrebbe essere fatto con un foglio di calcolo e il dato pronto poi esportato nella basa dati. Tuttavia, la lettera non sempre risponde ad una sola lettera; può darsi che, analizzando la documentazione, troviamo delle missive, risposte lunghe a due-tre lettere precedenti (menzionati esplicitamente nel testo). In questo caso un campo "in risposta alla lettera di..." non è sufficiente. È necessario creare un'altra tabella che contenga tutte le lettere scritte in risposta ad una lettera particolare, le date e i destinatari.


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


Fonti dialogiche

Si prende l'espressione "dialogico" dal testo di Carlo Ginzburg L'Inquisitore come antropologo . Il termine disegna le fonti prodotti da un dialogo, per esempio inquisizioni della chiesa o interrogazioni della polizia. Certo, le due fonti sono un frutto di epoche molto diverse, ma Ginzburg ci fa notare che hanno una struttura simile e formano i corpus documentari maggiormente organizzati rispetto alla semplice corrispondenza. Le fonti dialogiche formano serie complete, sia nei luoghi dove vengono prodotte che negli archivi. Ci sono molti studi su questo tipo di fonti, anche se la maggior parte delle opere che le utilizzano non fanno alcuna riflessione sulla loro produzione. La produzione di queste fonti segue un rituale, che inizia con l'instaurazione del processo dell'interrogatorio, che viene trascritto dall'inizio alla fine (con silenzi, forse, ma sempre con un inizio e una fine). E abbastanza comune trovare le affermazioni in serie e, di caso in caso, un elenco di domande poste agli interrogati. Abbiamo cioè due livelli di regolarità: uno della fonte, con il processo, le affermazioni e le liste di domande; l'altro, specifico per ogni insieme, con la logica delle domande, secondo la dinamica del processo, il momento della sua produzione e il caso in questione.

Se vogliamo usare il modello relazionale per rappresentare questo tipo di fonti, abbiamo bisogno di una tabella per il processo con i campi "data di inizio" e "data di fine", oltre a una sintesi del caso, una lista di imputati e testimoni. Certamente, saranno necessari dati più basilari, come il luogo dell'indagine e i nomi degli investigatori e dei giudici. In tal caso, sarebbe importante avere informazioni su ciascuna delle istanze attraverso le quali è passata, sapendo che le gerarchie di un sistema sono ricorrenti e secolari. È vero che il nostro caso potrebbe essere stato archiviato nello stesso posto del processo, in una stazione di polizia locale; il semplice fatto di prendere in considerazione la traiettoria del caso, anche inesistente, ci fa migliorare la nostra riflessione sulla fonte e sul problema storico stesso. L’archiviazione nel luogo del processo era una consuetudine o una decisione arbitraria? Quali procedure erano più ricorrenti? Queste sono le domande che ci poniamo prima di organizzare il nostro materiale nei campi della tabella di una base di dati.

La prima cosa da scoprire è il possibile diagramma di flusso del processo, il percorso di indagine dall'inizio alla fine. Questo varia a seconda del contesto. Inoltre è necessario sapere se ci sono differenze di flusso tra i casi. Se non ci sono, basta creare una tabella "Processi", in cui possiamo segnare con un valore del campo "sì” o “no" a seconda che il percorso sia concluso. In questo modo, ogni interrogatorio verrebbe registrato in una tabella collegata "Interrogatori", poiché ogni processo può avere n sessioni di interrogatorio, o dialoghi. E poiché anche il numero di domande è sempre m, sarebbe importante creare una tabella "Domande", che avrebbe, oltre al campo "codice", i campi "domanda" e "risposta".

Mi sembra che non ci sia bisogno di ripetere le tabelle con i dati organizzati, come ho fatto nell'esempio dei documenti dei battesimi o per la corrispondenza. A questo punto, il lettore può già elaborare il proprio schema a partire dalle riflessioni iniziali qui esposte. L'importante è non banalizzare concetti complessi o da elaborare ulteriormente. Il nostro lavoro di storici è già di per sé spesso una semplificazione. Il database anche è una semplificazione, e la semplificazione è necessaria per l’organizzazione dei dati. Non c’è bisogno di semplificare ulteriormente, perché abbiamo i strumenti sufficienti per trattare le fonti con dovuta cura.


Referências




Citação deste verbete
Autor do verbete: Tiago Gil
Como citar: GIL, Tiago. "Database centrato sulle fonti". In: CLIOMATICA - Portal de História Digital e Pesquisa. Disponível em: http://lhs.unb.br/cliomatica/index.php/Database_centrato_sulle_fonti. Data de acesso: 27 de junho de 2024.






Informar erro nesta página