Avanzado

Falsos Positivos y Falsos Negativos

El test dice "Sí" ... ¿será cierto?

Cuando tienes una prueba (test) que puede indicar "Sí" o "No" (como una prueba médica), debes pensar:

¿Una prueba equivocada?

madre perro piensa erróneamente cuál cachorro robó el hueso

¡Es como si te dijeran que hiciste algo cuando en realidad no lo hiciste!

O que te digan que no lo hiciste cuando realmente sí lo hiciste.

Cada uno de estos errores tiene un nombre especial: "Falso Positivo" y "Falso Negativo":

  Cuando te dicen que lo hiciste Cuando te dicen que no lo hiciste
Realmente lo hiciste ¡Están en lo correcto! "Falso Negativo"
En realidad no lo hiciste "Falso Positivo" ¡Están en lo correcto!

Aquí hay algunos ejemplos de "falsos positivos" y "falsos negativos":


Pero muchas personas no entienden los números verdaderos detrás de "Sí" o "No", como en este ejemplo:

gato

Ejemplo: ¿alergia o no?

Horacio dice que tiene comezón. Hay una prueba de alergia a los gatos, pero esta prueba no siempre es correcta:
Aquí está en una tabla:
  El test dice "Sí" El test dice "No"
Tiene alergia 80% 20% "Falso Negativo"
No tiene alergia 10% "Falso Positivo" 90%

 

Pregunta: Si el 1% de la población tiene alergia y la prueba de Horacio dice "Sí", ¿cuáles son las posibilidades de que Horacio realmente tenga la alergia?

¿Crees que el 75%? ¿O tal vez el 50%?

Una prueba similar se le dio a los médicos y la mayoría dijeron que alrededor del 75% ...
... pero estaban muy equivocados!

(Fuente: "Razonamiento Probabilístico en Medicina Clínica: Problemas y Oportunidades" de David M. Eddy 1982, en el que se basa este ejemplo)

Hay tres formas diferentes de resolver esto:

Usa cualquiera que prefieras. Miremos ahora con detalle cada una:

 

Intenta imaginar a mil personas

Cuando intentes comprender preguntas como esta, imagina un grupo grande (digamos 1000) y juega con los números:


Veamos todo en una tabla:

  1% son alérgicos El test dice "Sí" El test dice "No"
Tiene alergia 10 8 2
No tiene alergia 990 99 891
  1000 107 893

Entonces, 107 personas obtienen un "Sí", pero solo 8 de ellos realmente tienen alergia:

8 / 107 = aproximadamente 7%

Entonces, a pesar de que la prueba de Horacio decía "Sí", apenas es solo un 7% probable que Horacio tenga una alergia a los gatos.

¿Por qué tan pequeña la probabilidad? Bueno, la alergia es tan rara que aquellos que realmente la tienen se ven ampliamente superados por aquellos con un falso positivo.

 

Como un diagrama

Dibujar un diagrama de árbol puede ser de mucha ayuda:

diagrama de árbol, alergia

Antes que nada, verifiquemos que todos los porcentajes suman lo correcto:

0.8% + 0.2% + 9.9% + 89.1% = 100% (¡bien!)

Y las dos respuestas "Sí" se suman 0.8% + 9.9% = 10.7%, pero solo 0.8% son correctas.

0.8/10.7 = 7% (misma respuesta anterior)

 

Teorema de Bayes

Teorema de Bayes tiene una fórmula especial para este tipo de cosas:

P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(no A)P(B|no A)

donde:

Por lo tanto:

P(A|B) significa "La probabilidad de que Horacio realmente tenga la alergia dado que la prueba dice Sí"

P(B|A) significa "La probabilidad de que la prueba indique Sí, dado que Horacio en realidad tiene alergia"

Para ser más claros, cambiemos A por tiene (en realidad tiene alergia) y B por (la prueba dice que sí):

P(tiene|Sí) = P(tiene)P(Sí|tiene) P(tiene)P(Sí|tiene) + P(no tiene)P(Sí|no tiene)

Sustituyamos los valores:

P(tiene|Sí) = 0.01×0.8 0.01×0.8 + 0.99×0.1
= 0.0748...

Que es aproximadamente el 7%

Obtén más información sobre esto en Teorema de Bayes.

Un último ejemplo

Ejemplo extremo: un virus informático

mundo del internet

Un virus informático se propaga por todo el mundo, todos informando a una computadora principal.

Los buenos capturan la computadora principal y descubren que un millón de computadoras han sido infectadas (pero no saben cuáles).

¡Los gobiernos deciden tomar medidas!

Nadie puede usar Internet hasta que su computadora pase la prueba "libre de virus". La prueba es 99% precisa (bastante buena, ¿verdad?) Pero el 1% de las veces dice que tiene el virus cuando no lo tiene (un "falso positivo").

Ahora digamos que hay 1000 millones de usuarios de internet.

Entonces, se prohibió un total de 11 millones, pero solo 1 de esos 11 en realidad tiene el virus.

Entonces, si te bloquearan el internet, ¡solo habría un 9% de posibilidades de que tengas el virus!

Conclusión

Al tratar con falsos positivos y falsos negativos (u otras preguntas de probabilidad difíciles) podemos usar estos métodos:

 

¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este tema! (Nota: están en inglés).

 
Copyright © 2020 DisfrutaLasMatematicas.com
Math is Fun Website