14 - TEOREMA DI BAYES (SULLA "PROBABILITÀ DELLE CAUSE")

 

14.1 - La "probabilità delle cause": formula di Bayes e altre risorse

 

 

q       In un paese scandinavo il 70% delle ragazze ha i capelli Biondi, il 20% li ha Rossi, il 10% Mori.

Risulta poi che ha gli occhi Scuri il 10% delle Bionde, il 25% delle Rosse, il 50% delle More.

 

      Se la ragazza con cui ho fatto amicizia tramite Internet mi fa sapere che ha gli occhi Scuri,

      che probabilità c’è che sia Bionda?

 

q       In un bar ci sono due macchinette mangiasoldi A e B.

Effettuando una singola giocata su A si vince con probabilità 1/2

(in altre parole: si vince mediamente 1 volta su 2, o, se preferisci, all'incirca 500 volte su 1000),

mentre giocando su B si vince con probabilità 1/4.

 

Supponiamo di non sapere quale sia la macchinetta A e quale la B;

se ne scegliamo una a caso, giochiamo una sola volta, e vinciamo,

che probabilità c'è che la macchinetta scelta sia stata A?

 

 

Ecco due tipici problemi di “probabilità delle cause”.

 

Per tali problemi, esistono più tecniche di risoluzione; ad esempio, sono molto belle ed efficaci

quelle che si basano su di una “visione frequentista”, o sull’idea delle “fette di certezza”.

 

Comunque, in un problema di “probabilità delle cause” la risorsa più utile è senz’altro la formula di Bayes.

 

 

TEOREMA DI BAYES (sulla "probabilità delle cause")

 

Supponiamo che in una singola prova possa verificarsi

uno e uno solo fra più possibili eventi  

(indichiamo con  la probabilità che si verifichi  ),

e che, qualora si verifichi l'evento ,

ci sia una ben determinata probabilità  

che si verifichi un dato evento E.

 

Insomma, gli eventi  

costituiscono le possibili CAUSE dell’evento E;

tali cause sono:

 

·       fra loro INCOMPATIBILI

( = non è possibile che si verifichino contemporaneamente due eventi , se  )  

 

·       ed "ESAUSTIVE" ( = nessuna altra causa, al di fuori delle z, può generare l’evento E).

 

Allora, se si verifica l'evento E,

la probabilità che esso sia stato provocato dalla causa  è data dalla formula

 

 

 

OSSERVAZIONE MOLTO UTILE PER RICORDARE LA FORMULA

 

Il denominatore si ottiene riscrivendo il numeratore,

e poi scrivendo gli altri addendi analoghi, che si ottengono “facendo variare le cause”.

 

 

Dimostrazione (con riferimento alla figura):

 

 

Giustificazioni dei passaggi nella dimostrazione:

 

q       nel primo passaggio abbiamo applicato una nota formula ricavata dal Teorema delle Probabilità Composte:

 

q       nel secondo passaggio, un’ovvia relazione insiemistica

 

q       nel terzo passaggio,

 

·         il Teorema delle Probabilità Composte a numeratore

·         e il Teorema delle Probabilità Totali per eventi incompatibili a denominatore

 

q       nel quarto passaggio, nuovamente il Teorema delle Probabilità Composte

 

OSSERVAZIONI

 

q       La dimostrazione data si riferisce a situazioni in cui possiamo porci

in un insieme universo di casi equipossibili,

quindi si adatterebbe perfettamente al 1° dei due esempi da cui abbiamo preso le mosse

(le ragazze scandinave),

in quanto il 2° esempio

(le macchinette mangiasoldi)

è piuttosto una “prova a due fasi”, nella quale i casi non sono equipossibili,

a meno di passare ad una opportuna

“prova modificata, probabilisticamente equivalente a quella di partenza”.

Bene!

Si può tuttavia dimostrare che

il Teorema di Bayes vale anche con riferimento agli “eventi a due fasi”.

Basterà, a tale scopo, semplicemente sostituire, nei passaggi formali della nostra dimostrazione,

il simbolo di  con una congiunzione “  ” da intendersi come indicante

successione temporale o comunque “accostamento, abbinamento” di eventi;

oppure, si potrà ricorrere ad una opportuna

“prova modificata, probabilisticamente equivalente a quella data”,

analogamente a quanto già fatto nel paragrafo 8.2.

 

q       Si comprende poi facilmente che

la formula del Teorema di Bayes rimane valida anche se

gli eventi  non vengono interpretati come "cause" di E,

ma semplicemente come eventi che possono essere "concomitanti" con E.

 

 

 

ESEMPIO

 

q       In una certa facoltà universitaria, è obbligatorio sostenere un esame di Lingua Straniera.

Ogni studente può scegliere fra:

Inglese, Francese, Spagnolo, Tedesco.

 

Le statistiche dicono che le probabilità di scelta sono rispettivamente: 

0,4       0,3       0,2       0,1

 

D'altra parte, per la diversa difficoltà dei corsi e severità degli insegnanti,

le probabilità di riportare la massima votazione (30 trentesimi)

variano da lingua a lingua e sono rispettivamente:

0,1       0,2       0,3       0,9

 

Supponiamo di sapere che un certo studente ha riportato 30 trentesimi nell'esame di Lingua.

 

Che probabilità c'è che la materia d'esame sia stata Inglese?

 

Risoluzione