Revisão de 05h28min de 2 de abril de 2021 por Lana.Sato (discussão | contribs)

Statistica

De Cliomatica - Digital History
Tempo di lettura 32 minuti - per Celeste DiPasquale


Analisi statistica

Cosa è la statistica?

Con il termine statistica si intende una scienza, strumentale ad altre, concernente la determinazione dei metodi scientifici da seguire per raccogliere, elaborare e valutare i dati riguardanti l’essenza di particolari fenomeni collettivi (o fenomeni di massa) [1] .

La statistica nasce come attività descrittiva di certi fenomeni sociali e, in particolare, come attività amministrativa dello Stato: infatti il termine "statistica" deriva dal termine "stato", anche se poi ha ampliato il suo campo di applicazione fino a diventare una “scienza del collettivo” [2] , comprendendo cioè tutte le situazioni in cui siano implicati fenomeni collettivi.

Sono considerati fenomeni collettivi quei fenomeni che non posso essere conosciuti con una sola osservazione, ma che, al contrario, possono essere analizzati, descritti e interpretati mediante la sintesi di un elevato numero di osservazioni che riguardano fenomeni più semplici (fenomeni individuali) [3] .

Esempio: il fenomeno della natalità, può essere analizzato solo osservando, contando e raffrontando le singole nascite.

Possiamo, in realtà, distinguere due tipologie di fenomeni collettivi:

  • fenomeni collettivi composti da casi singoli (es. natalità)
  • fenomeni che pur riferendosi a un singolo evento sono considerati collettivi poiché per essere conosciuti e analizzati è necessaria la ripetizione dell’osservazione del fenomeno singolo e la sintesi numerica che si può ottenere dall’insieme di tali osservazioni (esempio: lunghezza di un segmento o massa di un corpo che possono essere determinate solo mediante una serie di misurazioni successive eseguite con lo stesso strumento e dallo stesso ricercatore). [4]

Questa distinzione è importante perché da essa possiamo dedurre una prima differenza tra le scienze sociali (come la storia/storiografia), che si avvalgono della statistica per lo studio di fenomeni collettivi del primo tipo, mentre le scienze sperimentali (come la fisica, la chimica, la biologia ecc.) ricorrono alla statistica per la conoscenza di fenomeni collettivi del secondo tipo.

Nel caso della storia è interessante notare come essa si sia sempre occupata della collettività e, quindi, l’oggetto di studio è lo stesso della statistica, ma che la storia condotta senza questo ausilio si appoggia a una analisi esclusivamente di tipo qualitativo.


Analisi qualitativa e quantitativa

Quando analizziamo i fenomeni siamo abituati ad utilizzare metodi quantitativi per i fenomeni naturali e metodi qualitativi per i fenomeni sociali, instaurando in questo modo una consolidata gerarchia tra questi due tipi di analisi, che attribuisce alla prima una sorta di naturale superiorità verso la seconda.

Nel caso delle scienze naturali l’analisi qualitativa sembra essere priva di dignità scientifica e, talvolta, è vista anche come una volgarizzazione di ciò che dovrebbe essere enunciato in modo formalizzato con dati quantitativi; nelle scienze “umane”, viceversa, l’analisi quantitativa è spesso vista come una riduzione della varietà del reale a pochi parametri misurabili.

Il quantitativo e qualitativo, in realtà, non devono essere visti come due scenari diversi ma approcci diversi allo stesso scenario che possono essere applicati alla stessa ricerca.

Il dialogo tra quantitativo e qualitativo risulta essere più presente di quanto pensiamo in primo luogo poiché i fenomeni qualitativi hanno spesso una manifestazione quantitativa:

Esempio: “Si vive meglio in una grande città” → questa affermazione che potrebbe essere posta in un sondaggio per una ricerca di tipo sociale esprime un concetto qualitativo che però ha bisogno di una complementare chiarezza quantitativa. Le città si misurano anche in numeri (strade, case, persone, edifici, automobili, semafori ecc.), ma il numero non corrisponde alla qualità e, di conseguenza, le grandi città o le piccole città sono diversi tipi di città non solo a livello di variazione numerica. Tra una città di 100.000 abitanti e una di 150.000 non vediamo molte differenze come invece emergono tra città con 50.000 e 500.000 o 5.000.000 abitanti. Le diverse metriche della città producono anche diversi tipi di comportamento o aspettativa di comportamento.

Questo dialogo appare vivo e indispensabile nella statistica e lo è ancora di più nel caso della storia in quanto da un lato la conoscenza della “qualità” di un fenomeno consente di usare correttamente i dati statistici e dall’altro i dati statistici permettono di comprendere meglio la realtà osservata.

Non si tratta, dunque, di trovare una gerarchia tra quale sia l’approccio migliore, ma di coglierne la complementarità e far dialogare questi due approcci.

Vi è, tuttavia, un ampio dibattito accademico sull’uso dei metodi quantitativi per le scienze sociali e, in particolare, per la storia.

La storiografia che si avvale della statistica, come metodo di indagine, è detta storia quantitativa.


Cosa è la storia quantitativa?

Il termine storia quantitativa (quantitative history) viene utilizzato per indicare la corrente storiografica basata su una metodologia che prevede l’utilizzo sistematico di fonti quantitative che forniscono allo storico una quantità notevole di dati tale da poter essere analizzata mediante procedure matematiche, statistiche e informatiche [5].

Inizialmente l’utilizzo di metodi quantitativi per la descrizione di avvenimenti storici e, quindi, la storia quantitativa si è rivolto soprattutto all'analisi di fenomeni economici e soprattutto come strumento di ausilio per rafforzarne l’autorevolezza, ma è negli anni ’50 del secolo scorso che la storia quantitativa tradizionale subì un rinnovamento ad opera della scuola statunitense New economic history, che estendeva il metodo quantitativo alla storia del lavoro e della schiavitù, dell’agricoltura e dei trasporti [6].

Questo approccio venne definito nuova storia economica (dal nome della scuola) ma anche cliometria evidenziando, così, la duplice natura della disciplina in quanto il termine risulta essere l’unione del nome della musa della storia, Clio, e del termine greco métron, “misura”.

La cliometria si pone come obiettivo quello di analizzare i processi storici, economici e sociali misurando nel tempo le grandezze economiche e studiando questi fenomeni attraverso le leggi economiche.

Cliometria: metodologia storica che impiega modelli economici nello studio del passato per studiare, in particolare, lo sviluppo economico [7].

Non è un caso che ci troviamo proprio tra la fine degli anni ’50 e l’inizio del decennio successivo quando gli storici sono interessati al problema dello sviluppo e cercano di rispondere alle domande: quali sono le condizioni di crescita economica? Perché le sue diseguaglianze e le sue tensioni? [8]

Un esempio da questo punto di vista è il lavoro di Robert William Fogel, considerato uno dei padri della cliometria, il quale, per poter comprendere quali fossero stati gli effetti della costruzione delle ferrovie sulla crescita economica degli Stati Uniti, creò un modello controfattuale che ipotizzava uno sviluppo su grande scala alternativo a quello ferroviario della rete dei canali sul territorio americano e dimostrando, mediante l’analisi quantitativa, come la rete ferroviaria fosse più efficiente rispetto a quella dei canali [9].

La metodologia cliometrica è stato oggetto, però, di critiche sia da parte di storici ed economisti.

Le critiche rivolte alla storia quantitativa si basano, in primo luogo, su una argomentazione di natura metodologica-epistemologica. Di fatto coloro che negano la validità della storia quantitativa affermano che, con l’uso del metodo statistico, viene alterato il tradizionale statuto epistemologico della conoscenza storiografica, che è conoscenza degli aspetti qualitativi della realtà.

In realtà, come abbiamo detto sin da subito, l’oggetto di indagine della storia quantitativa risulta essere lo stesso della storia “qualitativa”, in quanto entrambi si occupano dei fenomeni collettivi come, per esempio, gruppi e i comportamenti sociali, le istituzioni politico-amministrative, le attività economiche o anche civili e religiose; ciò che cambia è il modo in cui vengono osservati in quanto nella storia quantitativa i fenomeni collettivi non sono più visti come estensione intuitiva di eventi singoli, ma come somma di una molteplicità di eventi resi omogenei dalle caratteristiche in comune.


Perché è difficile applicare i metodi quantitativi a fenomeni storici?

Le critiche sono legate, spesso, alla natura metodologica e alla tipologia di fonti utilizzate in quanto, da un lato, molte fonti non sono state prodotte per essere correttamente utilizzate dagli strumenti statistici e, da altra parte, le fonti storiche sono spesso incomplete e ambivalenti.

Secondo lo storico polacco Wilton Kula si hanno fondamentalmente tre tipi di fonti per la storia quantitativa:

  • fonti di tipo seriale → raccolte con intento statistico (es. censimenti);
  • fonti di tipo istituzionale relative a fenomeni di massa → documenti predisposti dalle amministrazioni pubbliche (ma anche private) per scopi specifici (es. elenchi di leva), ma resi non del tutto attendibili da fenomeni come, per esempio, la retinenza;
  • fonti relative a fenomeni individuali che si presentano su scala di massa → come, per esempio, i registri parrocchiali che contengono annotazioni su battesimi, morti, matrimoni e che sono stati resi obbligatori dopo il concilio di Trento (1563), ma che sono tutt'altro che sistematici e presentano difficoltà di lettura [10]

Una classificazione differente delle fonti della storia quantitativa è stata, invece, fornita da François Furet il quale distingue le fonti non sulla base della natura e l’origine della fonte stessa, bensì sulla specificità della prospettiva con cui gli storici si propongono di ricavarne dati e informazioni [11]; egli ritiene che una documentazione statistica possa essere utilizzata in “modo sostitutivo”, cioè lo storico non la usa per avere informazioni dirette sugli argomenti che hanno costituito l’oggetto della rilevazione ma per conoscere fenomeni diversi:

Esempio: uso dei registri parrocchiali non per un'indagine sulla natalità ma per comprendere il benessere di una società o l’evoluzione dei costumi sessuali.

Questa idea di Furet risulta interessante in quanto egli in questo modo evidenzia come anche nel caso della storia quantitativa sia fondamentale che lo storico possieda una buona autonomia di giudizio nel valutare la rilevanza delle fonti e nell’interpretarle alla luce degli obiettivi di ricerca.

L’uso di metodi quantitativi non significa che lo storico debba abbandonare del tutto una analisi di tipo tradizionale come, per esempio, accertarsi lo stato di conservazione archivistica e ricondurre le fonti al contesto politico-storico in cui furono prodotte:

Esempio: calcolare la durata media della vita in epoche storiche passate → il dato potrebbe essere non rappresentativo dell’intera popolazione, poiché le informazioni da noi disponibili riguardano solo alcuni settori della popolazione (ceti privilegiati).

Un altro importante problema legato all’applicazione dei metodi statistici alle fonti storiche consiste nel fatto che la conoscenza del passato è sempre una conoscenza parziale, in quanto il più delle volte i dati disponibili fanno parte di un insieme più ampio di dati che è andato perduto e, quindi, i dati spesso non sono idonei ad essere utilizzati come campione, poiché sono prodotti di una selezione casuale di cui, spesso, non si conoscono i criteri della selezione (per la definizione di campione vedi Concetti base di statistica).


Concetti base di statistica

La statistica, spesso, fa paura agli storici sia per i dubbi teorici e metodologici, ma anche per la paura della matematica, poiché si pensa che per fare statistica sia necessario fare calcoli complicati. Questo però non è vero, in quanto le decisioni più importanti riguardano la conoscenza da parte dello storico delle fonti e dei limiti della quantificazione e questo non richiede matematica ma consapevolezza del metodo e conoscenza storica.

La matematica necessaria per i possibili calcoli nella storia è, di fatti, molto semplice in quanto la statistica usa sì i numeri, ma a differenza della matematica non cerca di creare modelli, tesi e astrazioni, ma sfrutta le regole di base e di calcolo per tradurre i fenomeni reali in dati numerici che possano essere facilmente analizzati [12].


Nozioni elementari di matematica

Il primo passo è conoscere le quattro operazioni che, generalmente, ci vengono insegnate dai primi anni scolastici e, quindi, fanno parte del bagaglio comune; ciò che invece è più importante menzionare è la notazione utilizzata:

  • Per la somma si usa:
NO: a1 + a2 + a3…
SI \(\sum_{i=1}^{n}\ {a_i}\) (si legge sommatoria su \(\ {a_i}\) per i che va da 1 a n)
I numeri sotto e sopra il sigma si riferiscono a un insieme di dati che stiamo guardando. Il numero in basso è il primo del set mentre quello in alto è l’ultimo. La a è la variabile che siamo aggiungendo.
  • Per la moltiplicazione si usa:
∏(produttoria)

Il valore assoluto di un numero relativo è il numero stesso privato del segno e viene indicato con due barrette verticali: |-5| = 5

La funzione matematica viene indicata con l’uguaglianza y= f(x) e si ha quando esiste una relazione tra una grandezza y e un’altra grandezza x cioè a ogni valore di x corrisponde un determinato valore di y:

Esempio: y= 5+2x quindi se x= 0 y=5

y è la variabile dipendente e x la variabile indipendente


Nozioni fondamentali di statistica

Popolazione e campionamento:

  • Popolazione = insieme di tutte le manifestazioni relative ad un certo fenomeno (= universo)

Di un universo non è possibile avere una conoscenza esaustiva sia perché il numero degli elementi che lo compongono è infinito ma anche nel caso in cui il numero degli elementi è finito ma non analizzabile [13] .

  • Campione è un sottoinsieme della popolazione = una collezione di elementi che appartengono ad un più ampio aggregato (popolazione) [14].
Il campione deve essere rappresentativo della popolazione da cui è stato estratto.

L’adeguatezza del campione dipende da diversi fattori:

  • dimensione: il campione deve essere sufficientemente grande in funzione della variabilità del carattere in studio e dell’inferenza che si vuole fare → se il carattere ha bassa variabilità anche un campione piccolo potrebbe essere rappresentativo, mentre se la variabilità è elevata un campione piccolo rischia di escludere una porzione consistente della variazione esistenza;
  • randomizzazione: gli elementi che entrano a far parte del campione vengono scelti in maniera casuale.
[15] Figura 1- La prima fase di un’analisi consiste nell’estrazione di un campione dalla popolazione di cui vogliamo conoscere i parametri (come la media μ o la varianza σ2). Il campione viene descritto mediante statistiche (indicate con lettere latine) e a partire da queste si farà inferenza ai corrispondenti parametri che caratterizzano la popolazione.
Esistono diversi modi per definire un campione e molte discipline definiscono quale sarebbe il modo migliore per farlo. Per esempio, nell’econometria la selezione casuale dei casi è stata vista per decenni come la modalità più appropriata per quel tipo di studio.
Nella storia c’è il problema che, il più delle volte, le fonti che abbiamo sono già parte di un tutto ben più ampio e, quindi, la popolazione su cui deve operare lo storico è già un campione, un “aggregato casuale” [16] , poiché limitato a ciò che è stato registrato casualmente nel materiale documentario.

Ogni unità statistica è portatrice di caratteristiche:

  • variabili (detti anche caratteri) = caratteristiche di ogni unità statistica [17]

Esempio: studenti di un determinato corso di studi saranno caratterizzati da determinate caratteristiche come per esempio luogo di nascita, età, sesso, colore di capelli, stato civile, professione, percorso di studi ecc.

Il ricercatore deve, dunque, determinare quali sono i caratteri che interessano ai fini della indagine e li deve rilevare cioè deve scegliere tra i caratteri, potenzialmente infiniti, quelli che gli servono.

Ogni variabile in corrispondenza di una osservazione assume un determinato valore:

  • modalità: uno dei possibili valori che può assumere una variabile (nel caso di variabili quantitative si usa il termine valore).

Esempio: se la variabile è il sesso la modalità potrebbe essere “femmina”.

La tradizione statistica italiana distingue:

  • variabile qualitative o categoriche = danno luogo a risposte qualitative designate con nomi, parole ecc. (es. sesso: “maschio” o “femmina”) [18] Le variabili qualitative si distinguono a loro volta:
    • ordinati (o ordinabili) = è possibile instituire un ordine naturale o convenzionale tra le modalità [19] (es. ceto sociale → il “ceto medio” si colloca sotto l’alta borghesia ma sopra la classe operaia)
    • sconnessi [20]= non è possibile stabilire un legame o graduatoria fra i valori della variabile (per es. sesso → non esiste una gerarchia tra “maschio” e “femmina”)
  • variabili quantitative o numeriche = danno luogo a risposte quantitative a domande come “quanto siete alti” “quanti prodotti ha venduto nel primo mese del 2021 la ditta X?” Ci sono due tipi di variabili quantitative:
    • discrete = producono risposte numeriche che derivano da un processo di conteggio e, quindi, costituite da numeri interi (es. la variabile “numero di figli” e il valore dovrà essere un numero intero quindi 3 figli ma non è possibile avere 2,7 figli)
    • continue = generano risposte che derivano da un processo di misurazione (es. “altezza” che può assumere un qualunque valore nel continuo e così valore di “altezza” potrà essere 165 cm, 164,8 o 164,79)
[21]


Le distribuzioni statistiche

I dati corrispondenti alle modalità con cui un carattere si manifesta in un collettivo costituiscono:

  • distribuzione unitaria = rappresenta come il carattere si distribuisce fra le diverse unità della popolazione

riunendo le modalità uguali otteniamo le frequenze corrispondenti a ciascuna modalità:

  • distribuzione di frequenza = insieme delle modalità di un carattere cui siano associate le relative frequenze (frequenza = numero di volte con cui compaiono le stesse modalità del carattere considerato)
  • se alle modalità di un carattere sono associate non le frequenze, ma le intensità (intensità = somma di tutti i valori assunti dalle modalità uguali) parliamo di distribuzione di intensità.

Distribuzione di frequenza e distribuzione di intensità sono dette distribuzioni statistiche perché formate da dati statistici.

Una distribuzione è definita semplice se si riferisce a una sola variabile ed è rappresentabile con una semplice tabella mentre è doppia, tripla ecc. se si riferisce a due, tre ecc. caratteri.

Nel caso di una variabile qualitativa per costruire una distribuzione di frequenza è sufficiente contare quante sono le unità osservate che ricadono nelle diverse modalità, mentre più complicato risulta essere per le variabili quantitative.

In ogni caso è importante garantire l’omogeneità dei dati e questo risulta essere valido ancor di più per la ricerca storica poiché lo storico può sì procedere con una classificazione convenzionale ma deve far risaltare le differenze economiche, sociali, politiche ecc [22]. e scegliere gli estremi basandosi sulla sua conoscenza dell’argomento.

La nozione di distribuzione ci permette di definire anche la distinzione che viene operata tra le due principali branche della scienza statistica: statistica descrittiva e statistica inferenziale:

  • statistica descrittiva = lo scopo è raccogliere, presentare e analizzare i dati relativi alla popolazione che costituisce l’oggetto di studio; consiste nella costruzione delle distribuzioni e nella valutazione e descrizione delle caratteristiche essenziali dei fenomeni collettivi (per approfondimento vedi sezione Statistica descrittiva)
  • statistica inferenziale = è l’insieme di procedure che consentono la stima delle caratteristiche di una popolazione sulla base dei dati campionari [23]. L’obiettivo è fare affermazioni relative alla natura teorica delle distribuzioni osservate e se questa natura teorica può essere identificata tenendo sotto controllo la possibilità di errore allora diventa possibile “inferire” da tale conoscenza “predizioni” sul comportamento di sistemi simili.

La storiografia utilizza principalmente le tecniche della statistica descrittiva, ma può avere la necessità di operare solo su una parte delle informazioni disponibili, soprattutto quando si trova dinanzi a fonti sovrabbondanti, e in questo caso potrebbe essere utile procedere per campioni con le tecniche di statistica inferenziale [24].


Statistica Descrittiva

La statistica descrittiva è un insieme di tecniche usate per descrivere le caratteristiche essenziali dei fenomeni collettivi osservati.

La storiografia, generalmente, si avvale di queste tecniche di statistica descrittiva in quanto il suo obiettivo è, il più delle volte, quello di descrivere la realtà che è oggetto della ricerca ma anche confrontarla con altre situazioni diverse dal punto di vista cronologico e geografico [25] per cui l’uso di determinati metodi statistici come gli indicatori di centralità e gli indicatori di variabilità potrebbe essere molto utile.

La statistica descrittiva mette, di fatti, a disposizione il calcolo di indicatori sintetici che riassumono con un singolo valore proprietà statistiche di una popolazione rispetto a una sua variabile con lo scopo di sostituire alla pluralità delle modalità osservate un’unica modalità che le rappresenti tutte.

Vediamo più da vicino questi indici a partire dagli indicatori di centralità.


Indicatori di centralità (misure di centralità)

Le misure di centralità sono le più utilizzate e sono le medie (aritmetica, geometrica e ponderata), la moda e la mediana.

Per media si potrebbe, dunque, intendere una modalità che rappresenti tutte le modalità di una distribuzione e questo risulta essere molto utile in quanto la nostra mente dinanzi a un insieme di osservazioni riguardanti uno stesso fenomeno fa difficoltà a ricavare un’idea complessiva mentre riassumere il contenuto di diverse osservazioni in un’unica modalità ci permette di descrivere meglio il fenomeno e confrontarlo con altri.

Le medie (definite medie ferme) differiscono dalle altre misure di centralità quali moda e mediana (definire medie lasche) per il fatto che le prime sono calcolate su tutti i termini della distribuzione mentre le altre sono determinate solo in base ad alcuni termini [26].

Vediamo le medie ferme:

  • media aritmetica: è il risultato della somma dei valori di tutti gli n termini divisa per il numero dei casi n
InDipasquale3.png

Possiamo utilizzare la media aritmetica, per esempio, per calcolare il numero di nati in media nelle regioni italiane in un determinato anno.

Questo dato potrebbe essere senz’altro indicativo, come abbiamo visto sin da subito, di altri fenomeni come, per esempio, il benessere sociale ma lo storico deve prestare attenzione nell’utilizzare la media aritmetica soprattutto nel caso in cui vi sono fenomeni “anomali”.

Excel MEDIA (n1, n2, …) dove n1, n2, ... sono gli argomenti di cui vogliamo calcolare la media aritmetica

[27] Figura 2: MEDIA dei nati vivi in regioni italiane nel 2019

In questo esempio notiamo come la media aritmetica non sia molto rappresentativa poiché vi sono regioni come la Valle d’Aosta dove il valore attribuito alla variabile è molto basso (811) e regioni come la Lombardia e il Lazio in cui è molto alto (rispettivamente 71 782 e 40 596). Vedremo in seguito come, in casi come questo, sia necessario associare il calcolo della media ad altri indicatori di centralità come la mediana e la moda.

Ci sono alcune situazioni, tuttavia, in cui è importante assegnare una diversa valenza alle osservazioni del carattere osservato e per questo si utilizza:

  • la media aritmetica ponderata = prevede l’attribuzione di un “peso” adeguato ad ogni osservazione cioè un valore che aumenta o diminuisce l’importanza di ogni fenomeno
InDipasquale5.png

La media ponderata viene, dunque, utilizzata quando si vuole attribuire un peso adeguato ai termini su cui si vuole operare.

Per comprendere quanto detto possiamo prendere in considerazione un esempio citato da Rodolfo Benini il quale chiarisce: “se sopra al mercato si sono venduti 100 quintali di grano al prezzo unitario di L.20; poi altri 150 al prezzo di L. 20,70; poi altri 300 al prezzo di L.22, non sarebbe logico concludere che il prezzo medio è \(\frac{20+20,70+22}{3}= 20,90\) perché la partita di grano che fu venduta a L.22 era tre volte più importante di quella che fu venduta a 20 e due volte più di quella che ottenne il prezzo di 20,70” [28].

In questo caso dovremmo ponderare i prezzi con le quantità vendute e quindi \(\frac{20*100+20,70*150+22*300}{100+150+300}= 21,28\)

  • media geometrica = misura il valore che sostituito a tutti i termini della distribuzione ne lascia invariata la funzione prodotto [29] .

La media geometrica è definita solo se tutte le osservazioni sono positive ed è data dalla radice ennesima del prodotto degli n termini:

InDipasquale6.png

La media geometrica viene usata, soprattutto, come media dei rapporti indici o numeri indici (= rapporti statistici che misurano la variazione di un determinato fenomeno nel tempo) e in ambito storiografico la media geometrica viene usata tutte le volte che vogliono avere un indice che sia la media di numeri indici riguardanti fenomeni affini [30]:

Esempio: il numero indice dei prezzi dei cereali che sia costruito come la media degli indici dei prezzi delle varie specie come grano, mais, avena ecc.

Excel: funzione: MEDIA.GEOMETRICA()

Tra i dati vi posso essere anche variabili con valori incongrui rispetto agli altri valori dell’insieme considerato (outliers):

Esempio: variabile “nati vivi” 811 rappresenterà un outlier

In questi casi calcolare la media non sarà sufficiente poiché essa non sarà il valore che riassume al meglio le modalità delle singole unità motivo per cui il calcolo della media viene affiancato a quello di altri indicatori di centralità quali mediana e moda.

  • Mediana = è il valore centrale di un campione di valori ordinati in senso crescente o decrescente; in altre parole, è il valore che bipartisce la graduatoria formata così da precedere un numero di termini più piccoli che è uguale al numero di termini più grandi che lo seguono

Esempio:


Bibliografia e sitografia

  1. C. Iodice, Elementi di statistica, Simone SPA, 2015, p. 7
  2. Voce "statistica" nell’Enciclopedia Treccani, consultata 17 gennaio 2021, https://www.treccani.it/enciclopedia/statistica.
  3. A. Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica, Roma, 1989, pp.39-40
  4. Ibidem
  5. Voce «quantitativa, storia» in Dizionario di Storia della Treccani, consultato 17 gennaio 2021, https://www.treccani.it/enciclopedia/storia-quantitativa_(Dizionario-di-Storia).
  6. Ibidem
  7. Voce «cliometria» nell’Enciclopedia Treccani, consultata 16 gennaio 2021, https://www.treccani.it/enciclopedia/cliometria.
  8. Angelo Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica, Roma, 1989, p. 19
  9. Voce «cliometria» in “Dizionario di Economia e Finanza” Treccani, consultato 17 gennaio 2021, https://www.treccani.it/enciclopedia/cliometria_(Dizionario-di-Economia-e-Finanza).
  10. Cfr. W.Kula, Problemi e metodi di storia economica , Milano 1972, p.290
  11. Angelo Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica , Roma, 1989, p. 30.
  12. Maurizio De Pra, Finalmente ho capito la statistica: I metodi, gli strumenti, le rappresentazioni grafiche, le tecniche, i concetti... spiegati a tutti con la massima chiarezza (Vallardi, 2016).
  13. M. Sari Gorla, Elementi di statistica applicata . Seconda edizione, Milano, 2011, p.3
  14. Ibidem
  15. Ibidem
  16. Angelo Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica, Roma, 1989, pp.41-42
  17. David M. Levine, Timothy C. Krehbiel, e Mark L. Berenson, Statistica, Edizione italiana a cura di Raffaella Piccarreta, Milano, 2006, p.2
  18. 'Ibidem
  19. Angelo Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica, Roma, 1989, p. 55
  20. Ibidem
  21. David M. Levine, Timothy C. Krehbiel, e Mark L. Berenson, Statistica, Edizione italiana a cura di Raffaella Piccarreta, Milano, 2006, pp.9-10
  22. Angelo Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica, Roma, 1989, pp.47-50
  23. M. Sari Gorla, Elementi di statistica applicata. Seconda edizione, Milano, 2011
  24. Angelo Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica, Roma, 1989, pp.52
  25. Ivi, p.144
  26. Ivi pp.151-157
  27. I dati utilizzati sono stati estratti dalla banca dati Statistiche Istat, StatBase: https://www.istat.it/it/dati-analisi-e-prodotti/banche-dati/statbase l'accesso ai principali dati (istat.it) e sono relativi alle nascite (nati vivi) di ogni regione italiana nell’anno 2019.
  28. R. Benini, Principi di statistica metodologica, Torino, 1906, p.98
  29. Francesco Borazzo e Paola Perchinunno, Analisi statistiche con Excel (Pearson Italia S.p.a., 2007).
  30. A. Porro, Storia e statistica. Introduzione ai metodi quantitativi per la ricerca storica, Roma, 1989, p.154



Citazione di questo articolo
Come citare: DIPASQUALE, Celeste . "Statistica". In: CLIOMATICA - Portale di Storia Digitale e ricerca. Disponibile in: http://lhs.unb.br/cliomatica/index.php/Statistica. il giorno: 29/06/2024.






Informare errori in questa pagina