Revisão de 15h49min de 8 de abril de 2021 por Lana.Sato (discussão | contribs)

Linguistica Computazionale

De Cliomatica - Digital History
Tempo di lettura 3 minuti - per Mazzarino


La linguistica computazionale è una disciplina il cui obiettivo è quello di “sviluppare modelli computazionali della lingua, cioè modelli del funzionamento del linguaggio naturale che possano essere tradotti in programmi eseguibili dal calcolatore e che consentano a quest’ultimo di acquisire le competenze necessarie per comunicare direttamente nella nostra lingua” [1] . La linguistica computazionale, dunque, è descrivibile come una crasi tra l’ambito umanistico e l’ambito informatico, crasi che si declina in due prospettive: da un lato, infatti, ci si domanda cosa il computer possa fare per lo studio del linguaggio naturale, dall’altro che cosa la lingua possa dare al computer.

Analizzando la prima prospettiva, possiamo affermare che il computer aiuta lo studioso a trovare una risposta alle domande classiche della linguistica teorica, cioè come funziona il linguaggio, come viene appreso, come cambia, ecc. utilizzando, tuttavia, metodi innovativi basati su modelli matematico-statistici e tecnologie informatiche; considerando, invece, il secondo punto di vista, possiamo dire che la linguistica computazionale “promette di espandere enormemente le capacità del computer, rendendolo capace di comprendere la struttura e il contenuto dei nostri testi e di interagire col mondo esterno con la naturalezza e l’immediatezza del linguaggio naturale” [2] . La linguistica computazionale, perciò, è un ambito di ricerca interdisciplinare che dialoga sia con materie afferenti all’universo dell’informatica e dell’ingegneria delle lingue sia con materie di stampo umanistico come la linguistica, di cui è figlia diretta, le scienze cognitive, la psicologia e la filosofia.

I corpora

Un corpus è una collezione di dati linguistici ecologici, presi come campione di una determinata lingua, costruita secondo regole ben precise che determinano il suo contenuto e le sue applicazioni. Un corpus deve essere, dunque, un campione rappresentativo della popolazione linguistica scelta per l’analisi, cioè deve tracciare una mappa di tutte le varietà linguistiche della lingua di riferimento. Per rendere un corpus rappresentativo si usano tecniche di bilanciamento che, attraverso l’utilizzo di dati statistici estratti dalla popolazione, permettono di creare un modello in scala il più simile possibile alla lingua che si vuole rappresentare. I corpora sono organizzati secondo specifici criteri:


Bibliografia e sitografia

  1. Lenci A., Montemagni S., Pirrelli V., 2005, p. 11
  2. Ibidem, p. 12



Citazione di questo articolo
Come citare: MAZZARINO, . "Linguistica Computazionale". In: CLIOMATICA - Portale di Storia Digitale e ricerca. Disponibile in: http://lhs.unb.br/cliomatica/index.php/Linguistica_Computazionale. il giorno: 1/07/2024.






Informare errori in questa pagina