martedì 2 giugno 2009

Rapporto tra terminologia statistica e informatica: per fare un pò di ordine!














Cercherò di spiegare brevemente alcuni termini statistici, usufruendo delle spiegazioni, che ritengo molto chiare, del libro Le forme del conoscere. I dati nella ricerca empirica, Bonanno
editore, 2006 di Simonetta Bisi, professoressa della facoltà di Scienze Statistiche de La Sapienza di Roma.

Campo di osservazione
Ambito della rilevazione definito dal "caso statistico", ossia dalla categoria di enti che hanno lo stesso nome ("nome comune"). Gli enti rientranti nel campo e sottoposti a rilevazione si chiamano unità statistiche. Da esse si distinguono le unità d
i rilevazione, strumenti prescelti per effettuarla nel modo più soddisfacente. Unità statistiche sono, ad esempio, i censiti, unità di rilevazione le famiglie di censimento, le convivenze, gli individui singoli nei casi speciali, o altro.

Unità campionaria
Unità che compone un campione. Conviene distinguere questa denominazione da quella di "unità di campionamento", con la quale si intende una de
lle unità che compongono un aggregato che deve essere sottoposto a campionamento.

Unità di rilevazione
Unità empirica su cui si basa la rilevazione. Non coincide necessariamente né con l’unità che fornisce le informazioni ("unità d’informazione"), né con l’unità statistica cui, in ultima analisi, si è interessati, ogni volta che essa ne raggruppa più d’una
("unità di analisi", "unità di tabulazione"). Nel censimento della popolazione, la famiglia di censimento è una delle unità di rilevazione; se la famiglia è composta di un solo membro, l’unità di rilevazione coincide con l’unità statistica di analisi, altrimenti si hanno tante unità di analisi quanti sono i membri della famiglia, in corrispondenza di una sola unità di informazione (il capofamiglia).

Unità di tabulazione

Unità di cui, in una tabella, si presenta la classificazione secondo un assortimento di modalità di caratteri. Il nucleo familiare, in un censimento demografico, non è l’unità statistica (il censito), né una di quelle di rilevazione, ma una derivazione da una di queste (la famiglia di censimento) attraverso il carattere "relazione col capofamiglia", e costituisce oggetto di classificazione e pubblicazione in tavole specifiche.

Unità sperimentale
Unità sulla quale si effettua un esperimento statistico.

Unità statistica
Unità elementare della popolazione statistica. Può tr
attarsi di una persona fisica (il censito, il dimesso da un istituto di cura), di una persona giuridica (l’impresa), di un’istituzione (un istituto scolastico), di un evento (un matrimonio, una nevicata) etc.

Tabella di contingenza

Sono tabelle usate in statistica per rappresentare e analizzare la relazione tra due variabili.

Con riferimento a due variabili qualitative, è la tabella a due entrate (righe, colonne) nella qualesono classificabili le osservazioni di un aggregato statistico. Nella tabella, l’elemento nij, all’incrocio della riga i e della colonna j, è il numero di unità statistiche che possiedono congiuntamente la modalità i-esima della variabile posta nel senso delle righe e la caratteristica j-esima di quella posta nel senso delle colonne.

Un Database Management System è un sistema software progettato per consentire la creazione e la manipolazione efficiente di database. I DBMS rivestono una funzione di fondamentale importanza in numerosi campi, dalla contabilità, alla gestione delle risorse umane, dalla finanza fino ai contesti tecnici come la gestione di rete o la telefonia. Un tempo, a causa degli ingenti costi di gestione delle ingombranti e complicatissime apparecchiature hardware, questi software erano a disposizione unicamente delle grandi aziende ed istituzioni, mentre il loro utilizzo ha una diffusione capillare in funzione della crescente necessità di creare report statistici aziendali. La gestione di questi sofisticati software è appannaggio di Informatici e Statistici, i quali per complicare la vita a noi studenti, utilizzano denominazioni differenti per indicare le medesime entità, applicando talvolta sfumature di significato che giustifichino la differenza di nome! Retorica studentesca a parte, passiamo ora al vaglio la terminologia statistica ed informatica, o comunque parte di essa.

DBMS tra statistica e informatica:
I Database Management System sono costituiti da tabelle, organizzate in righe e colonne. Le righe nel linguaggio statistico sono definite come entità, mentre per il linguaggio informatico sono record. Le colonne sono invece variabili per gli statistici e campi per gli informatici. La coppia attibuto invece è modalità per i primi e misura per i secondi.
Dall'insieme dei caratteri e delle unità statistiche osservate, detta matrice, è possibile alla tavola di contingenza.

Un esempio di tabella di contingenza è il report aziendale, che serve per valutare lo stato di benessere delle organizzazioni. Esso è composto da: dimensioni (sono i caratteri che si misurano sulle unità statistiche, solitamente non sono più di due) e misura (la parte quantitativa del report).
Il report non è un documento che solo si diffonde all'interno dell'organizzazione, esso deve giungere a tutti gli stakeholders.

Nessun commento:

Posta un commento