|
4. LE PRIME TRE FASI DI UN’INDAGINE STATISTICA; TERMINOLOGIA |
||||
|
PRIMA FASE: vale a dire la scelta del “CARATTERE” che si vuole studiare, e della “POPOLAZIONE” di cui ci si vuole occupare.
Come abbiamo già accennato, a volte interesserebbe una “popolazione” nella sua interezza, ma per motivi di tempi, di costi, di fattibilità se ne prende solo una parte, un “campione” (basti pensare ai sondaggi elettorali …); certo, si porrà poi il problema di valutare in che misura l’indagine fatta sul campione possa essere rappresentativa a riguardo della popolazione intera … di questo si occupa la “statistica inferenziale”.
Si sceglie, per il “carattere”, un insieme di “MODALITÀ”.
Il carattere “sesso” si può manifestare in sole due modalità: Maschio o Femmina, ma sovente c’è invece una certa discrezionalità:
ad esempio, il carattere “soddisfazione dell’utenza rispetto a un certo prodotto” potrebbe essere analizzato
· nelle 3 modalità “Poco soddisfatto/Sufficientemente soddisfatto/Molto soddisfatto”, · oppure nelle 5 modalità: “Per niente/Poco/Sufficientemente/Molto/Moltissimo”, · oppure ancora domandando di esprimere la propria soddisfazione con un voto, che so, da 0 a 10.
Le fasi successive dell’indagine statistica sono finalizzate innanzitutto a stabilire ed annotare in quante, fra le “unità statistiche”, si presenta ciascuna delle “modalità”.
|
||||
|
SECONDA FASE:
Si può effettuare: · con l’osservazione o misurazione diretta (ad es. per il colore degli occhi, o per il peso …, o per rilevare le condizioni di salute di un ammalato al quale sia stato somministrato un dato farmaco, …); · tramite un’intervista; · tramite un questionario, che potrà essere: I) a risposta chiusa; II) a risposta aperta (più laborioso, in questo caso, lo spoglio dei dati, e meno facile l’interpretazione delle risposte …); III) “semistrutturato” (è un “misto” fra le due tipologie precedenti).
|
||||
|
TERZA FASE: LO SPOGLIO DEI DATI
Si conta, per ciascuna delle “modalità” del “carattere”, quante fra le “unità statistiche” presentano quella modalità. Si annotano questi conteggi in una tabella che prenderà il nome di “DISTRIBUZIONE DI FREQUENZA”.
Ad esempio: “Qual è lo sport che pratichi con maggiore divertimento?” (in una popolazione di 480 giovani)
|
||||
|
|
Frequenza assoluta |
Frequenza relativa (appross.) |
Freq. rel. percentuale (appross.) |
|
|
120 |
0,25 |
25 % |
||
|
Pallavolo o Basket |
92 |
0,19 |
19 % |
|
|
Footing, Atletica leggera |
62 |
0,13 |
13 % |
|
|
Nuoto |
57 |
0,12 |
12 % |
|
|
Altro sport |
100 |
0,21 |
21 % |
|
|
Nessuno |
49 |
0,10 |
10 % |
|
|
TOTALE |
480 |
1,00 |
100 % |
|
|
A volte si annota solo la “FREQUENZA ASSOLUTA” di ciascuna modalità, ossia il NUMERO DI UNITÀ STATISTICHE NELLE QUALI QUELLA MODALITÀ SI È PRESENTATA.
Altre volte (come abbiamo fatto nella tabella precedente) si va a calcolare anche la “FREQUENZA RELATIVA” ossia il rapporto, il quoziente, fra la frequenza assoluta e il numero totale di unità statistiche:
La freq. relativa esprime quale parte, quale frazione delle unità statistiche presenta quella determinata modalità. Dire che la frequenza
relativa della modalità “calcio” è stata che
Se la frequenza relativa viene poi moltiplicata per 100, si avrà la “FREQUENZA PERCENTUALE” che ci dice quante unità statistiche su 100 hanno presentato quella modalità:
Nel nostro esempio, il calcio ha come frequenza
percentuale
|
||||
|
GLOSSARIO, SINONIMI (felici e meno felici)
|
||||
|
Ribadiamo che prende il nome di
DISTRIBUZIONE DI FREQUENZA L’INSIEME DELLE COPPIE ORDINATE (MODALITÀ, FREQUENZA ASSOLUTA); |
|
|||
|
in altre parole,
ossia il numero delle unità statistiche che presentano quella modalità.
|
||||
|
Se il carattere è quantitativo, e le sue modalità - espresse in questo caso da valori numerici - sono ripartite per comodità in intervalli, questi intervalli vengono chiamati le “CLASSI DI FREQUENZA”.
Ad esempio, le modalità del carattere quantitativo “estensione S in metri quadrati dell’appartamento in cui si risiede” potrebbero essere riunite, all’atto di compilare la tabella delle coppie (modalità, frequenza), negli intervalli seguenti:
Avremmo allora 7 “classi di frequenza”.
Ovviamente, al momento di scegliere le classi di frequenza dobbiamo fare in modo che
· la loro unione dia tutto l’intervallone delle possibili modalità · e che, prese due qualsiasi di esse, la loro intersezione sia vuota.
|
||||
|
Di una distribuzione di frequenza si dice che è:
· una “SERIE”, se il carattere al quale si riferisce è qualitativo · una “SERIAZIONE”, se il carattere è quantitativo.
|
Questa terminologia si può benissimo ignorare … dimenticala pure … tuttavia, te l’ho citata per avvertirti che consultando un testo o un sito di statistica, ci si deve rassegnare a “digerire” parole che a volte sembrano fatte apposta per complicare inutilmente le cose. |
|||
|
Una distribuzione di frequenza può anche essere chiamata
· “MUTABILE statistica” se il carattere di riferimento è qualitativo · “VARIABILE statistica” se il carattere di riferimento è quantitativo.
Talvolta gli stessi sostantivi “mutabile”, “variabile” vengono impiegati con riferimento al carattere più che alla distribuzione.
|
||||
|
Avrai osservato che, in statistica, sovente si hanno più possibilità diverse per dare nomi ai concetti.
A dire il vero, alcuni termini danno l’impressione di non essere molto “azzeccati”, o di venire impiegati più per mettere in sudditanza psicologica il lettore che per agevolarlo …
In queste lezioni cercheremo sempre di adottare la terminologia a nostro modesto avviso più chiara, informando lo studente sui possibili sinonimi (almeno, su alcuni fra i tanti).
|
||||
|
E’ noto che PER SEPARARE si può utilizzare la virgola, o in alternativa il punto decimale. Noi nel nostro corso scegliamo di norma la prima strada - più diffusa in Italia - ma a volte preferiamo invece la seconda, per motivi vari di opportunità (e un po’ anche per abituare il lettore alla doppia possibilità). In questo capitolo dedicato alla statistica il separatore sarà la virgola, anche perché nel capitolo si invita sovente a servirsi di un foglio elettronico (programma per computer in grado di visualizzare tabelle, effettuare calcoli e tracciare grafici), e in un foglio elettronico (versione italiana) occorre forzatamente fare uso della virgola, in quanto un numero scritto con un punto verrebbe interpretato dal programma come finalizzato a indicare un’ora del giorno.
|
|
Le FASI SUCCESSIVE dell’indagine statistica, di cui andremo ad occuparci nel seguito, consistono q nella RAPPRESENTAZIONE GRAFICA dei risultati q e nella loro ELABORAZIONE STATISTICA.
|
Ma a questo punto ti direi di fermarti per fare qualche facile (e divertente) esercizio.
ESERCIZI sui concetti introduttivi alla Statistica Descrittiva (risposte a pag. 68)
1) Per ognuno dei seguenti fenomeni collettivi, individua una possibile “popolazione”
e uno o più possibili “caratteri”, poi per ciascun carattere uno o più possibili insiemi di modalità:
a) le caratteristiche fisiche delle persone b) il lavoro c) le abitudini di spesa
d) l’appartamento in cui si vive e) la compagnia degli animali domestici
2) Per ciascuno dei seguenti caratteri, stabilisci se è
qualitativo ordinato, qualitativo sconnesso, quantitativo discreto o quantitativo continuo:
a) l’età alla quale una donna ha avuto il primo figlio
b) la squadra di calcio preferita
c) il numero di sere in cui uno studente esce abitualmente di casa in una settimana
d) il peso del proprio zainetto nell’entrare a scuola la mattina
e) il numero di libri presenti nello zainetto di uno studente all’ingresso a scuola
f) il gradimento di un programma televisivo
g) la nazionalità degli ospiti di un albergo
h) il numero di abitanti di un comune
3) Ottimo per un divertente lavoro di gruppo.
a) Trascrivi il questionario sottostante al computer con un word processor
( = programma di elaborazione testi), ad esempio Word o OpenOffice Writer.
b) Stampa. Fotocopia. Distribuisci.
c) Raccogli i questionari compilati.
d) Con un foglio elettronico (es. Excel o OpenOffice Calc) salva gli esiti in un file.
|
Grazie ♥ se vorrai riempire questo questionario, RIGOROSAMENTE ANONIMO!!!
1) La
tua altezza, in centimetri: ………….. 2) Il tuo peso, in kilogrammi (non barare! 3) Il tuo numero di scarpe: ………….. 4) Il numero dei tuoi fratelli (escluso te; devono avere la stessa tua mamma e papà naturali; evidentemente, se non ne hai scrivi 0): ………….. 5) Quanti anni aveva tua mamma quando ha avuto il primo figlio? ………….. 6) A che ora vai a letto, di solito, quando il giorno dopo devi andare a scuola? (è ammessa anche la “1/2
ora”, es. 10 7) Quanto prendi di “paghetta” mensilmente? Euro ………….. 8) Qual è la tua materia preferita? ……….… 9) Qual è la materia che trovi più antipatica? …………. 10) Dai un giudizio sulla tua scuola attuale (crocia la lettera corrispondente alla risposta): Pulizia, servizi igienici, stato dell’edificio: a) Scarsissima b) Scarsa c) Sufficiente d) Buona e) Ottima Preparazione del corpo insegnante: a) Scarsissima b) Scarsa c) Sufficiente d) Buona e) Ottima Capacità degli insegnanti di capire i ragazzi: a) Scarsissima b) Scarsa c) Sufficiente d) Buona e) Ottima 11) Quanti telefonini hai posseduto fino ad ora? ………… 12) A che età hai avuto il primo? ………….. 13) Qual è il massimo numero di cm che hai saltato in alto in palestra? …………. 14) Sei iscritto a Facebook? ………….. 15) Se sì, quanti “amici” hai? (pressappoco!): …………..
Sei maschio o sei femmina? ………….. Anno di nascita: ………….. Classe: …………..
|
4) Compila la “distribuzione di frequenze” (assolute, relative e percentuali) per qualcuna delle voci
dell’indagine statistica condotta attraverso il “Questionario del curiosone”. Esempi:
|
Altezza, in cm |
Frequenza assoluta |
Freq. relativa (appross.) |
Freq. rel. perc. (appross.) |
|
|
1 |
0,033 |
3,3 % |
|
|
3 |
0,1 |
10 % |
|
… |
… |
… |
… |
|
Totale |
30 |
1 |
100 % |
|
Materia più antipatica |
Frequenza assoluta |
Freq. relativa (appross.) |
Freq. rel. perc. (appross.) |
|
matematica |
6 |
0,2 |
20 % |
|
disegno |
5 |
0,17 |
17 % |
|
… |
|
… |
… |
|
Totale |
30 |
1 |
100 % |
5) In un paese di montagna ci sono 40 coppie sposate. Il numero di figli è illustrato dalla seguente tabella.
|
0 |
2 |
1 |
2 |
3 |
1 |
1 |
0 |
2 |
2 |
0 |
0 |
2 |
1 |
2 |
1 |
2 |
1 |
3 |
2 |
|
2 |
1 |
0 |
2 |
2 |
4 |
0 |
1 |
1 |
2 |
1 |
1 |
1 |
3 |
0 |
1 |
0 |
1 |
1 |
1 |
Compila una distribuzione di frequenza, con le frequenze assolute, relative e percentuali.
|
6) E’ stata fatta una indagine di classe: “Sei soddisfatto della scuola scelta?” (molto comodo tracciare un’asticella per ogni risposta, poi barrare con un tratto orizzontale i gruppi di 5!)
Ricostruisci il contenuto delle caselle cancellate. |
|
F. A. |
F. R. |
F. R. % |
|
Moltissimo |
|
|
20% |
|
|
Molto |
|
|
|
|
|
Abbastanza |
|
|
|
|
|
Poco |
|
|
|
|
|
Pochissimo |
|
|
|
7) Si sa che 3 delle 4 possibili modalità di un carattere sono state osservate, su di un universo statistico, con
frequenze relative 0,35; 0,4; 0,2. E’ richiesto di trovare la frequenza percentuale della modalità rimanente.
8) VERO O FALSO?
a) Una volta fissato un carattere, la scelta delle sue modalità è sempre univocamente determinata.
b) Un carattere è qualitativo quando non ha senso pensare a un ordinamento delle sue modalità.
c) La statistica inferenziale ha come obiettivo innanzitutto di particolarizzare ad un sottoinsieme,
le osservazioni generali riguardanti la popolazione.
d) In medicina, quanto più il p-value è alto, tanto più si può esser persuasi che il farmaco sia “buono”.
e) In una indagine sui costi di una notte in albergo a Roma, 80 euro può essere una unità statistica.
9) Inventa e realizza un’indagine, fra i tuoi compagni di classe, sui seguenti fenomeni collettivi:
a) il tempo di permanenza davanti ad un monitor, la dipendenza dalla tecnologia
b) i mezzi di trasporto posseduti in famiglia e quelli abitualmente adoperati
c) educazione e maleducazione d) cibo per lo stomaco e) cibo per la mente
|
SCUOLE, CLASSI, ALUNNI, INSEGNANTI (2007-2008, dati ISTAT) |
10)
a) Quanti stranieri in totale?
b) Fra gli insegnanti, qual è la percentuale di quelli che insegnano alle Primarie?
c) Riempi la casella vuota |
||||
|
|
Asili |
Primarie |
Sec. 1° grado |
Sec. 2° grado |
|
|
Scuole |
24.727 |
18.105 |
7.939 |
6.649 |
|
|
Alunni |
1.655.362 |
2.830.055 |
1.727.339 |
2.740.806 |
|
|
Stranieri per 1000 iscritti |
67,1 |
76,9 |
73,2 |
43,4 |
|
|
Insegnanti |
148.342 |
307.374 |
207.950 |
315.307 |
|
|
Alunni per insegnante |
11,2 |
9,2 |
8,3 |
|
|
11) Le medie dei voti in pagella in una classe alla fine del primo quadrimestre.
Raggruppa i dati in classi di frequenza; compila la distribuzione di frequenza
|
6,75 |
5,75 |
6,25 |
8,13 |
7,75 |
6,75 |
7 |
7,63 |
5,5 |
8,5 |
6,25 |
5,63 |
|
5 |
7,88 |
4,75 |
8,88 |
5,25 |
6,63 |
6,5 |
8 |
7,75 |
7,5 |
6,25 |
5 |
12) Numero di giorni in cui un libro è stato trattenuto in prestito dagli utenti di una biblioteca scolastica.
Raggruppa i dati in classi di frequenza; compila la distribuzione di frequenza
|
7 |
15 |
4 |
10 |
21 |
11 |
9 |
5 |
23 |
28 |
18 |
12 |
15 |
14 |
13 |
22 |
19 |
20 |
7 |
15 |
18 |
12 |
18 |
|
13 |
12 |
9 |
7 |
9 |
15 |
14 |
10 |
5 |
14 |
16 |
18 |
19 |
21 |
22 |
3 |
16 |
19 |
7 |
26 |
15 |
17 |
12 |
13) Per le modalità di quali, fra i seguenti caratteri, è opportuna una ripartizione in “classi di frequenza”?
a) L’ammontare della paghetta settimanale degli adolescenti
b) Il consumo annuale di acqua di una famiglia
c) Il numero di quotidiani acquistati da un individuo negli ultimi 30 giorni
d) La materia più amata dagli studenti
e) Il numero di televisori in una casa
f) Il massimo numero di centimetri realizzati nel salto in alto in palestra
g) Il voto con cui uno studente è stato promosso in Terza Media (dal 6 al 10)
h) Il voto con cui uno studente ha conseguito il diploma di scuola secondaria (da 60 a 100 e lode)
14) Come si potrebbe verificare se è attendibile il detto “Donne al volante, pericolo costante”?
15) Con riferimento al paragrafo “due righe di storia”, inventa una serie di 7 domande
che possano andar bene per una competizione di classe “maschi contro femmine”. Parta poi la gara!
16) Ricerca su Internet il significato dei seguenti termini legati alla statistica:
contingenza, scala mobile, indice di ascolto, share, demografia, exit poll, polizza vita.