Bases centradas na fonte

De Cliomatica - Digital History


Tempo estimado de leitura deste artigo 22 minutos - por Tiago Gil


PORTAL DE BANCOS DE DADOS

Bancos de dados e sua potencial utilidade na pesquisa em história (texto que apresenta o quanto de teoria e metodologia há por trás das aparentes decisões técnicas de quem cria o banco de dados)

Bancos de dados: um breve histórico do seu uso por historiadores (verbete sobre diversos historiadores que usaram bancos de dados em suas pesquisas, demonstrando algumas dos problemas enfrentados por eles)

Estrutura de dados e Modelos conceituais, lógicos e físicos (Artigos de caráter técnico que apresentam o vocabulário básico de criação de bancos de dados)

Aspectos visuais (Algumas notas sobre como bases visualmente claras podem ser úteis, além de dicas sobre como criar bases visualmente boas)

Bases centradas na fonte (Texto sobre bases de dados criadas com base em uma fonte histórica, como Registros de Batismos, cartas ou Inventários Post-Mortem)

Bases centradas no método (Texto sobre bases de dados criadas com base em um método ou problema de pesquisa, como aquelas focadas em indivíduos, famílias, redes, etc)

Esse é o tipo preferido de grandes nomes, como Manfred Thaller e Alan Macfarlane. Ambos adotaram como padrão de trabalho uma espécie de transcrição estruturada, através da qual o documento era transcrito normalmente, mas certos fragmentos, palavras, números e datas, eram rotulados para que o computador pudesse processá-los. O mesmo também é defendido por Carvalho, que disse que "os melhores métodos de entrada de dados oriundos de fontes históricas são aqueles que preservam a estrutura original da informação". Usando desse recurso ou não, precisamos criar tabelas e campos para transformar nossos papéis velhos em bytes. Vejamos alguns exemplos.


Registros de batismo

Comecemos com uma fonte bastante tradicional nas aplicações informatizadas: os registros de batismo. Sei que os mais antigos conservados são de algumas cidades italianas e que podemos encontrá-los em toda a Europa, na África e na América. Como vou trabalhar com essa fonte, li vários artigos e livros sobre o uso que fizeram dela e das variações possíveis (ou, pelo, menos as mais comuns) em seu formato. Sei que há vasta metodologia desenvolvida para sua análise e que elas podem se revelar úteis em algum momento da pesquisa, pois minha pergunta inicial pode se revelar insuficiente e demandar outras abordagens não previstas inicialmente. Para tanto, precisarei adequar a pesquisa. Quando isso acontecer, será bom ter preparado a base de maneira a prever algumas possibilidades. Isso não significa criar uma base para tudo, mas desmontar de tal modo que os dados dos batismos possam ser remontados de diversos modos e não apenas da forma originalmente pensada. Vamos pensar na forma como os registros estão dispostos. Sempre serão na forma de livros, não apenas pelo fato de isso ser comum, mas porque há uma demanda oficial através de normativas internas da Igreja, que não vou explorar aqui. Todos os arquivos têm volumes onde ficam registrados os batismos que couberam ali. O número de registros de batismo possível em cada tomo é n. Não há mínimo ou máximo. Eles não têm divisão interna estabelecida. Os batismos geralmente são listados na ordem cronológica, um após o outro. É possível encontrar divisões em alguns casos, como metade do livro para pessoas livres e a outra metade para escravos, em sociedades escravistas. Há, igualmente, separação para indígenas. Mas são especificidades de alguns exemplares e não regras da fonte. Precisamos, contudo, considerar esta possibilidade e saber incluir isso no nosso modelo conceitual. Mesmo que os registros estejam dentro de livros, eles se constituem em uma série. Os livros são o suporte para que a série exista e fique organizada, mas se fosse possível ter um livro infinito, ele teria todos os registros. Assim, o livro é importante, mas não é central. O centro das atenções está no registro propriamente dito que tem uma estrutura interna relativamente regular. É comum que comece com a data, que fale imediatamente o nome do batizando com sua legitimidade, e os responsáveis por ela, seus pais. Pode mencionar os avós, mas, nem sempre, isso ocorre. Ele informa os padrinhos e acaba com a assinatura do padre. É comum que sejam acrescidas observações sobre cada um dos participantes, especialmente sobre o estatuto das pessoas, a residência, a naturalidade e o local do batizado. Observando a descrição acima, sabemos que há elementos constantes e esperados, como o nome do batizando, dos pais e dos padrinhos. Seria igualmente esperada a informação sobre os avós, mas ela não é tão regular. Há ainda conteúdos completamente irregulares, que podem ou não ser mencionados para alguns (e não, para todos) dentro de um mesmo registro. Pode haver duas informações de qualidade diferente ("filho do capitão" nos diz de quem é filho e que o pai é capitão) para um único participante e nenhuma para os demais. Por ter visto muitos registros, sei que é possível que os batizados aconteçam em um lugar diferente da Igreja Matriz, como em uma propriedade agrária ou na casa de alguém. Da mesma maneira, a criança pode ter sido batizada in extremis, por temor de sua morte, mas sobrevivido para ter com o padre e receber os santos óleos posteriormente. O padre pode ser um e a pessoa que batiza, outra, assim como o batismo pode ser dado por um padre e o registro ser feito por outro. Podemos começar nosso trabalho. Tomamos o papel e anotamos todas essas observações. Sabemos também o volume que vamos abordar - se um, dois ou três livros, por exemplo. Contamos que cada página tem, em média, quatro registros e que os três volumes que vamos usar tem, somados, 650 páginas. Isso nos permite estimar a grandeza do número de registros: uns 2600. Tendo isso apontado, podemos seguir em frente. O passo seguinte é pensar sobre quantas tabelas serão necessárias. Pelo que foi dito até aqui, quantas você, leitor, pensaria? Eu diria que, pelos menos, três: uma para registrar os livros, outra, a mais importante, para registrar os batismos, e uma terceira para registrar as informações irregulares sobre os participantes do batismo, sua condição social, seu estatuto, sua residência, etc. Elas merecem, em minha opinião, uma tabela separada e relacionada com a dos batismos. Vejamos:


TABELA "LIVROS" ----> TABELA "BATISMOS" ----> TABELA "DETALHES"


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


Criamos tabelas quando os fragmentos que identificamos em nossos materiais têm relevância e especificidades suficientes para ganhar um espaço exclusivo feito sob medida. Vamos pensar, agora, nos campos de cada uma das tabelas, começando pela de “livros”. O primeiro campo que sempre devemos criar é o “código”, um campo que vai identificar inequivocamente cada registro, nesse caso, cada livro. Alguns usam a expressão “Identificador” ou “ID”. Há quem use “Matrícula”. Eu prefiro chamar de “código”, especialmente pelo fato de que ali será inserido um código alfanumérico que será facilmente identificado como uma fonte. No caso dos batismos, eu faria algo como “SAnt_bat_001” para identificar o livro de batismos número 1 da Paróquia de Santo Antônio. Os programadores chamam esse tipo de campo de “chave primária”. Depois, veremos que os registros de batismos desse mesmo livro terão também esse rótulo, acrescido da página e da ordem do registro dentro dela. O campo seguinte é o nome da paróquia, um campo de texto; o próximo é o número do volume, e o seguinte, um campo de texto para informar o ano inicial e o final do tomo. É também importante fazer um campo para informar o número de registros total desse livro, assim como o de páginas. Eu ainda faria um campo para a abertura do livro (isso é feito, quase sempre, na primeira folha) e outro para seu “fechamento” (fica na última). Acabaria com um campo de observações. Talvez seja o caso de criar um campo para o nome do volume, pois, em algumas vezes são identificados com um título como “Livros dos Pretos da Candelária”. Assim, temos:

TABELA "LIVROS"


CAMPO TIPO OBS
Código_livro* Texto (chave primária) Máximo de 12 caracteres
Paróquia Texto Livre
Número do livro Número Máximo de 3 caracteres
Data inicial Data (ou texto) AAAA
Data final Data (ou texto) AAAA
Total de registros Número Máximo de 5 caracteres
Total de páginas Número Máximo de 4 caracteres
Abertura Texto Livre
Fechamento Texto Livre
Observações Texto Livre
  • Indica que o campo terá um relacionamento com outra tabela.

Agora precisamos dar conta da tabela “Batismos” propriamente dita, que requer mais trabalho. Começamos novamente com o campo “código_livro”, que vai receber o código do livro em todos os registros, de modo a permitir seu relacionamento. É como se carimbássemos o código do livro em cada registro para associá-los. Com isso, não precisamos digitar nenhum dado do livro no registro, que já herdará todos do seu “pai”. Essa filiação é tão marcante que muitos programadores costumam chamar os campos de “ID” (identificador) e “ID_parent” (identificado do pai) para enfatizar isso. Pode ser uma opção. Eu prefiro utilizar a palavra “código”, seguida de outra que indica o que está sendo codificado. E nesse caso particular, é importante usar o mesmo nome, pois logo criaremos outro campo “código” para outro relacionamento que a base terá, agora, com os detalhes relativos aos participantes do batismo. Esse campo será chamado de “código_registro”. O próximo campo pode ser o de “transcrição”, que receberá o texto do batismo na íntegra. É uma alternativa, não é necessário, mas pode ser útil para evitar novas viagens ao arquivo. Eu o usaria pensando no problema apresentado na página 27, quando falei que Martha Hameister encontrou um registro de batismo excepcional. Não é preciso criar um campo para o texto inesperado, mas não vamos perder essa preciosidade. Ele ficará junto com as outras informações seriáveis, mas integralmente transcrito. Vejamos que outros campos seriam necessários:

TABELA BATISMOS

CAMPO TIPO OBS
Código_livro* Texto Máximo 12 carac.
Código_registro* Texto Máximo 19 carac.
Transcrição Texto Livre
Local de nascimento Texto Livre
Local do batizado Texto Livre
Padre celebrante Texto Caixa de escolha
Quem redigiu Texto Caixa de escolha
Data do batismo Data ou Texto Livre
Data do nascimento Data ou Texto Livre
Nome do batizando Texto Livre
Sexo Texto Caixa de escolha (M, F)
Legitimidade Texto Caixa de escolha (L, N)
Pai Texto Livre
Mãe Texto Livre
Padrinho Texto Livre
Madrinha Texto Livre
Avô paterno Texto Livre
Avó paterna Texto Livre
Avô materno Texto Livre
Avó materna Texto Livre
Observações Texto Livre
  • Indica que o campo terá um relacionamento com outra tabela.


Comecemos observando o campo “Código_registro” que deve ter até 19 caracteres para que possa receber o “código_livro” integralmente e ser acrescido de números que indiquem a página e a ordem do batismo na dita mesma. Ficará algo como SAnt_bat_001_023v_3. Nesse caso, vai significar: Paróquia de Santo Antônio, 1º livro de Batismos na página 23 verso, 3o registro na ordem da folha, de cima para baixo. Com isso, cada registro terá seu endereço completo no Arquivo da Igreja, de uma forma compacta e fácil de entender (e de citar, pois pode ser usada como referência nos textos que forem feitos com o registro. Basta copiar e colar). O sexo não é dito, mas pode ser uma informação fácil de se obter, tendo em conta apenas o nome. Uma opção, já usada e aprovada pelo autor, é criar um pequeno aplicativo que faça uma varredura pelos registros para procurar nomes masculinos e femininos e preencher automaticamente o sexo. Para isso, é preciso ter uma lista prévia dos nomes para cada sexo. Dá trabalho e deve ser feita para cada contexto, região e época, pois muda bastante, mas, depois, basta aplicar para qualquer outra fonte ou registro novo. Essa aplicação depende do programa e da habilidade do usuário em criá-la. Não vamos ensinar aqui, pois depende de cada software. Por fim, temos a terceira tabela, “Detalhes” que será muito enxuta para permitir alguma maleabilidade, para que possamos receber qualquer tipo de dado adicional. Começamos com nosso velho amigo “código”, nesse caso, “código_registro”, que associará todos os detalhes com os batismos respectivos. O seguinte é um campo que classifica o tipo de informação que será incluída e que vai depender dos critérios que cada equipe ou pesquisador adotar. Eu criaria opções como “Batizado em”, “Casado com”, “Filho de”, “Qualificativo”, etc, tendo em conta o que aparece na fonte, mas de modo minimamente estruturado. Depois poderemos reagrupar esses rótulos em outras categorias e analisar como quisermos. Uma postura mais indutiva permite isso. O campo seguinte nos diz sobre de qual dos participantes será a informação, se do pai, da mãe, dos padrinhos ou dos avós. O quarto campo será para indicar o nome do referido, para associar o detalhe com a pessoa. O quinto, que chamarei de “informação”, permitirá detalhar de modo descritivo o que está sendo registrado. Vejamos:

TABELA "DETALHES

CAMPO TIPO OBS
Código_registro* Texto Máximo 12 carac.
Tipo de informação Texto Caixa de opções
Qual posição Texto Caixa de opções
Quem Texto Livre
Informação Texto Livre
Observações Texto Livre
  • Indica que o campo terá um relacionamento com outra tabela.


Com isso, já temos o modelo conceitual de nossa base e elementos para construir os modelos lógico e físico. A construção desses dois vai depender do software escolhido, mas será apenas uma tarefa mecânica depois de todas estas decisões. Mas, com isso, temos apenas uma base “individual”, para um único usuário. Se quiséssemos gerar um sistema com controle de usuários, distribuição de tarefas e auditoria, precisaríamos fazer outra tabela, para cadastrar os usuários, e criar os campos “usuário” e “data de criação” em cada uma das outras tabelas, para que registrasse quem fez o que e quando. Vale a mesma lógica apresentada até aqui. Com essa estrutura, podemos fazer coisas muito complexas com essa fonte. Podemos, por exemplo, selecionar apenas os livros que contenham registros nos quais o padrinho era filho de capitão. Com isso quero dizer que resguardando as especificidades de cada tipo de informação ao criar três tabelas, podemos ainda fazer buscas cruzadas considerando que as três tabelas estão relacionadas. Respeitamos a estrutura da fonte e ainda temos como recuperar dados com rapidez e complexidade. Se fizéssemos apenas uma tabela, teríamos muita dificuldade de guardar esses dados como “padrinho era filho de capitão” e tenderíamos a perder a informação, colocando-a em um campo muito específico ou, simplesmente, ignorando-a. O planejamento permitiu, como vimos, um uso amplo dos dados . Mais adiante, veremos como essa base poderia se integrar com outras, de batismo e de óbitos, para a aplicação do método Henry.


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


Correspondências

Vimos que as correspondências podem ser vistas como um tipo de fonte sem estrutura, diferente dos batismos. Isso não quer dizer que não possamos fazer bases delas. O que não podemos é forçar uma estruturação onde não há. As correspondências sequer têm uma forma padronizada de preservação, como os livros, no caso dos batismos. A única coisa que garante a especificidade do gênero é sua ampla utilização nos últimos séculos, ainda que seja imemorial. Há alguma bibliografia sobre esse tipo de fonte, ainda que não seja tão vasta quanto aquela dedicada aos registros paroquiais e há inúmeros estudos que usam este tipo de fonte, mas sempre dando um tratamento semelhante a livros, inclusive com a publicação de séries de correspondências.

O que é realmente regular ou esperado, previsto são informações como “remetente”, “destinatário”, “data”, “local do remetente”, “local do destinatário” e o “texto da carta”. Com isso faremos nossa base. Poderíamos acrescentar outros campos por capricho, para aproveitar bem mais a fonte: “pessoas citadas”, “locais citados” e “temas”. São três campos que evidenciam a intervenção direta do historiador, mas sem perturbar a fonte. Poderíamos também acrescentar um campo para incluir o período que a carta cobre, se faz referência a coisas passadas ou expectativas futuras, campos para resumo, recortes e outro para identificar recursos discursivos utilizados. Assim, estaríamos desmontando de forma mais adequada a fonte, como devemos fazer. Vejamos:

TABELA “CORRESPONDÊNCIAS”

CAMPO TIPO OBS
Remetente Texto Livre
Local do remetente Texto Livre
Destinatário Texto Livre
Local do destinatário Texto Livre
Data Data ou texto AAAA-MM-DD
Texto da carta Texto Livre
Código_carta Texto Livre


Campos opcionais que podem ser úteis:


CAMPO TIPO OBS
Pessoas citadas Texto Livre
Locais citados Texto Livre
Temas Texto Livre ou caixa de opções
Período abarcado Texto Livre
Resumo Texto Livre
Recortes Texto Livre
Recursos discursivos Texto Livre


Haveria, ainda, outra possibilidade, a de criar um campo adicional para recolher dados sobre outras cartas mencionadas na própria carta. Isso seria interessante, porque, muitas vezes, as cartas são respostas a outras anteriores, que por sua vez foram respostas de outras mais e isso é freqüentemente mencionado (“Respondo por esta a sua do dia...” ou fórmulas semelhantes). Com esse controle, podemos ver o tempo de resposta entre uma carta e outra e observar uma série delas, quase uma conversa, entre duas pessoas. Para isso, bastaria o campo “em resposta à carta de” e, talvez, um campo de cálculo que medisse a diferença entre as duas datas, ainda que possa ser feito em uma planilha, uma vez exportados esses dados, o que já facilitaria a preparação de um gráfico. Contudo, nem sempre, a carta responde a apenas uma original. Pode ser o caso de, analisando a documentação, percebermos que há missivas que respondem a duas ou três anteriores, que são claramente mencionadas. Nesse caso, não basta um campo de "em resposta à carta de...". É preciso criar outra tabela que contenha aquele campo e as datas das originais e da atual.


Achou algum erro? Não entendeu o conteúdo? fale com a gente!


Fontes dialógicas

Tomei a expressão "dialógicas" do texto “O inquisidor como antropólogo”, de Carlo Ginzburg. Serve para designar as fontes que foram produzidas a partir de um diálogo, como interrogatórios da igreja ou da polícia. É claro que são frutos de épocas muito diferentes, mas o que faz Ginzburg aproximá-las é que elas têm uma estrutura semelhante e tendem a formar corpi documentais mais organizados do que as correspondências e formar séries completas, tanto nos locais onde são produzidas quanto nos Arquivos. Há muitos estudos sobre esse tipo de fonte, ainda que a maioria dos trabalhos que as utilizem não faça nenhuma reflexão sobre sua produção. A produção dessas fontes segue um ritual semelhante, com a instauração do processo, que é transcrito do início ao fim (com ausências, talvez, mas com um início e um final). É regular também o fato de haver depoimentos em série e, para cada caso particular, uma lista de perguntas que foram feitas aos interrogados. Ou seja, temos duas camadas de regularidades: uma própria da fonte, com o processo, os depoimentos e as listas de perguntas; outra, própria de cada conjunto, com a lógica própria das perguntas, de acordo com a dinâmica do processo, com o momento de sua produção e com o caso em questão. Precisamos, então, de uma tabela para o processo na qual haverá campos como “data inicial” e “data final”, além de uma súmula do caso, de uma lista de acusados e de testemunhas. É certo que dados mais básicos serão necessários, como o local do inquérito e os nomes dos investigadores e dos juízes. Nesse caso, seria importante ter informações sobre cada uma das instâncias pelas quais passou, sabendo que é recorrente que haja hierarquias na Justiça desde longo tempo. É bem verdade que nosso processo pode ter sido arquivado na origem, numa delegacia de interior, mas o simples fato de pensarmos que poderia ter tido uma longa trajetória, mas que não teve já nos faz aprimorar nossa reflexão sobre a fonte e o problema histórico em si. Era normal ser arquivado ou foi uma decisão arbitrária? Quais os trâmites mais recorrentes? São questões que colocamos diante da demanda por organizar nosso material em caixinhas (campos) de uma tabela. A primeira coisa a descobrir é o fluxograma possível do processo, o caminho do inquérito do início ao final. Isso varia de acordo com o contexto. É preciso também saber se há diferenças entre essas instâncias, no que toca ao processamento dos casos. Se não houver, basta uma tabela “Processos” na qual podemos marcar com um campo “sim ou não” todo o caminho possível de um caso. Isso resolveria. Deste modo, cada interrogatório seria colocado em uma tabela relacionada chamada “interrogatórios”, uma vez que cada processo pode ter n sessões de perguntas, ou diálogos, para manter o vocabulário. E como o número de perguntas também é sempre n, seria importante criar uma tabela “Perguntas”, que teria, além do campo “código”, os campos “pergunta” e “resposta”. Parece-me não ser preciso repetir as tabelas com os dados organizados, como fiz com o exemplo dos batismos e das cartas. Nesse momento, o leitor já pode bolar o próprio esquema a partir das reflexões iniciais aqui apontadas. O importante é não simplificar aquilo que merece desdobramentos. Nosso trabalho de historiador já é uma simplificação. Colocar em bases de dados, também, mas é uma simplificação que organiza. Não precisamos simplificar mais nem temos motivo para isso, porquanto temos ferramentas que nos permitem tratar as fontes com cuidado.


Referências




Citação deste verbete
Autor do verbete: Tiago Gil
Como citar: GIL, Tiago. "Bases centradas na fonte". In: CLIOMATICA - Portal de História Digital e Pesquisa. Disponível em: http://lhs.unb.br/cliomatica/index.php/Bases_centradas_na_fonte. Data de acesso: 1 de junho de 2024.






Informar erro nesta página