14 - TEOREMA DI BAYES (SULLA "PROBABILITÀ DELLE CAUSE")
14.1 - La "probabilità delle cause": formula di Bayes e altre risorse
|
q In un paese scandinavo il 70% delle ragazze ha i capelli Biondi, il 20% li ha Rossi, il 10% Mori. Risulta poi che ha gli occhi Scuri il 10% delle Bionde, il 25% delle Rosse, il 50% delle More.
Se la ragazza con cui ho fatto amicizia tramite Internet mi fa sapere che ha gli occhi Scuri, che probabilità c’è che sia Bionda?
q In un bar ci sono due macchinette mangiasoldi A e B. Effettuando una singola giocata su A si vince con probabilità 1/2 (in altre parole: si vince mediamente 1 volta su 2, o, se preferisci, all'incirca 500 volte su 1000), mentre giocando su B si vince con probabilità 1/4.
Supponiamo di non sapere quale sia la macchinetta
A e quale se ne scegliamo una a caso, giochiamo una sola volta, e vinciamo, che probabilità c'è che la macchinetta scelta sia stata A?
|
Ecco due tipici problemi di “probabilità delle cause”.
Per tali problemi, esistono più tecniche di risoluzione; ad esempio, sono molto belle ed efficaci
quelle che si basano su di una “visione frequentista”, o sull’idea delle “fette di certezza”.
Comunque, in un problema di “probabilità delle cause” la risorsa più utile è senz’altro la formula di Bayes.
|
TEOREMA DI BAYES (sulla "probabilità delle cause")
Supponiamo che in una singola prova possa verificarsi uno e uno solo fra più
possibili eventi (indichiamo con e che, qualora si
verifichi l'evento ci sia una ben determinata
probabilità che si verifichi un dato evento E.
Insomma, gli eventi costituiscono le possibili CAUSE dell’evento E; tali cause sono:
|
|
|
· fra loro INCOMPATIBILI ( = non è possibile che si verifichino
contemporaneamente due eventi
· ed "ESAUSTIVE" ( = nessuna altra causa, al di fuori delle z, può generare l’evento E).
Allora, se si verifica l'evento E, la probabilità che esso
sia stato provocato dalla causa
OSSERVAZIONE MOLTO UTILE PER RICORDARE
Il denominatore si ottiene riscrivendo il numeratore, e poi scrivendo gli altri addendi analoghi, che si ottengono “facendo variare le cause”.
|
|
Dimostrazione (con riferimento alla figura):
|
|
|
Giustificazioni dei passaggi nella dimostrazione:
q nel primo passaggio abbiamo applicato una nota formula ricavata dal Teorema delle Probabilità Composte:
q nel secondo passaggio, un’ovvia relazione insiemistica
q nel terzo passaggio,
· il Teorema delle Probabilità Composte a numeratore
· e il Teorema delle Probabilità Totali per eventi incompatibili a denominatore
q nel quarto passaggio, nuovamente il Teorema delle Probabilità Composte
OSSERVAZIONI
q La dimostrazione data si riferisce a situazioni in cui possiamo porci
in un insieme universo di casi equipossibili,
quindi si adatterebbe perfettamente al 1° dei due esempi da cui abbiamo preso le mosse
(le ragazze scandinave),
in quanto il 2° esempio
(le macchinette mangiasoldi)
è piuttosto una “prova a due fasi”, nella quale i casi non sono equipossibili,
a meno di passare ad una opportuna
“prova modificata, probabilisticamente equivalente a quella di partenza”.
Bene!
Si può tuttavia dimostrare che
il Teorema di Bayes vale anche con riferimento agli “eventi a due fasi”.
Basterà, a tale scopo, semplicemente sostituire, nei passaggi formali della nostra dimostrazione,
il simbolo di con una congiunzione “
” da intendersi come indicante
successione temporale o comunque “accostamento, abbinamento” di eventi;
oppure, si potrà ricorrere ad una opportuna
“prova modificata, probabilisticamente equivalente a quella data”,
analogamente a quanto già fatto nel paragrafo 8.2.
q Si comprende poi facilmente che
la formula del Teorema di Bayes rimane valida anche se
gli eventi non vengono interpretati come
"cause" di E,
ma semplicemente come eventi che possono essere "concomitanti" con E.
|
ESEMPIO
q In una certa facoltà universitaria, è obbligatorio sostenere un esame di Lingua Straniera. Ogni studente può scegliere fra: Inglese, Francese, Spagnolo, Tedesco.
Le statistiche dicono che le probabilità di scelta sono rispettivamente: 0,4 0,3 0,2 0,1
D'altra parte, per la diversa difficoltà dei corsi e severità degli insegnanti, le probabilità di riportare la massima votazione (30 trentesimi) variano da lingua a lingua e sono rispettivamente: 0,1 0,2 0,3 0,9
Supponiamo di sapere che un certo studente ha riportato 30 trentesimi nell'esame di Lingua.
Che probabilità c'è che la materia d'esame sia stata Inglese?
Risoluzione
|