“Señoría, tras hallar la sangre de la acusada en la escena del crimen todo queda más claro”, afirmaba el fiscal mientras sostenía su firme mirada ante la jueza. Poco después y tras un leve carraspeo, declaró: “no hay dudas de su culpabilidad”.
El fiscal, volvió a tomar asiento y repasó los papeles que tenia delante… la probabilidad de hallar el tipo de sangre de la acusada en la escena del crimen, siendo esta la culpable, era de casi un 98%, y no llegaba al 100% porque había una pequeña probabilidad de que la sangre no fuese de la persona que había cometido el crimen.
Pero el fiscal se estaba equivocando en algo… estaba cometiendo la conocida como falacia del fiscal. Pero ¿en que se equivocaba? ¿En que consiste esta falacia?
¿Me dejas que te cuente?
Probabilidad Condicionada
Para poder entender en que se equivocaba el fiscal es importante que conozcamos un concepto básico, la probabilidad condicionada
Es fácil ser consciente de que determinados sucesos cambian el curso de los acontecimientos y, por tanto, la probabilidad de aquello que nos interesa.
Empezando por un ejemplo muy sencillo, la probabilidad de que, al lanzar dos dados de 6 caras, la suma de los resultados sea 3 es de 2/36 (de las 36 posibles formas en las que caerán los dados, 2 de ellas tendrán una suma de 3, 2+1 o 1+2). Sin embargo, si sabemos que en el primero de los dados nos ha salido un 1, la probabilidad aumenta a 1/6 porque ya solo depende de que en el segundo dado nos salga un 2.
Cuando estamos en este tipo de circunstancias hablamos de probabilidad condicionada y lo expresamos como la probabilidad de que suceda un evento A dado que ha sucedido cierto evento B o, en notación matemática P(A | B).
Cabe mencionar que aquello a lo que condicionamos, lo que hemos llamado evento B, no siempre será algo que haya pasado antes si no que puede hacer referencia a determinadas circunstancias que hacen que cambié todo. Por ejemplo, la probabilidad de ingresar en UCI por la COVID-19 cambia según la franja de edad en la que te encuentras y, por tanto, estamos hablando de probabilidades condicionadas a tus circunstancias, no a algo que ya haya pasado.
Una cuestión importante cuando hablamos de probabilidad condicionada es entender que se trata, al fin y al cabo, de una probabilidad para el evento A. y qué quiero decir con esto, pues que nos estamos centrando en la probabilidad del evento A, aunque sea bajo unas condiciones concretas B. Y aquí, el orden de los factores sí altera el resultado, es decir, la probabilidad de que pase A dadas las condiciones B no serán nunca las mismas que la probabilidad del evento B bajo las condiciones A.
A este error es a lo que llamamos en probabilidad la falacia del fiscal y es un error de interpretación mucho más común de lo que pensamos.
Una falacia común
Volviendo al ejemplo de los dos dados, hemos visto que la probabilidad de que sumen 3 bajo la condición de que el primero de ellos había dado 1 era de 1/6. Pero, si condicionamos a que la suma sea 3, sabemos que el primer dado solo ha podido dar como resultado 1 o 2, por tanto, la probabilidad de que haya salido un 1 en esas circunstancias sería de ½, muy distinta de la primera.
Puede parecer obvio en este ejemplo pero, la cuestión es que, confundir estas probabilidades es un error típico, por ejemplo, en la detección de enfermedades.
Después de un positivo
Imaginad que os hacen una prueba para ver si sufrís una determinada enfermedad. Toda prueba de este tipo tiene asociada una probabilidad de dar positivo bajo la condición de sufrir realmente la enfermedad. Este valor, conocido como sensibilidad, suele ser bastante alto. Pongamos que en nuestro ejemplo es de 98%. También tiene una probabilidad de dar negativo cuando no se tiene la enfermedad. Este valor es conocido como especificidad y también suele ser alta. Pongamos que es de un 95% en este caso
Ante estas condiciones, obtener un positivo puede suponer un drama. Puede parecer que la probabilidad de tener la enfermedad es del 0.98, pero… recapitulemos.
En este caso, el evento de interés (A) es “tener la enfermedad” y lo que ya es conocido (B) es “haber dado positivo”. Buscamos entonces la probabilidad P(tener la enfermedad | haber dado positivo).
Sin embargo, la sensibilidad hace referencia a la probabilidad de dar positivo dado que se tiene la enfermedad, esto es: P(haber dado positivo | tener la enfermedad) = 0.98 y, como ya hemos visto, no tiene porque ser la misma que la anterior.
Pero seguro que ahora os ha surgido una pregunta ¿podemos calcular la primera en función de la segunda?
Esto es lo que se denomina el problema de la probabilidad inversa y la respuesta es sí. De hecho, aquí aparece uno de los teoremas que más me gustan y que, como ya sabéis, es el Teorema de Bayes.
A vueltas con el teorema de Bayes
Si enunciamos el Teorema de Bayes en términos del evento de interés A y las condiciones bajo las que se da, B tenemos:
De esta fórmula y su significado y origen hemos tratado en varias ocasiones en este blog, pero volvemos a ella porque siempre es útil.
En el Teorema de Bayes que aparecen dos elementos además de las probabilidades condicionadas. El primero es P(A) que, en el caso de la enfermedad representa la probabilidad de sufrirla (con positivo o sin positivo). Este valor recibe el nombre de incidencia de la enfermedad y si estamos hablando de una enfermedad rara, será muy bajita, pongamos de 0.001. por otra parte, P(B) es la probabilidad de que la prueba sea positiva, sin importar si se está enfermo o no. Esta probabilidad, si bien no la sabemos directamente, se puede calcular como:
P(positivo | enfermedad) * P(enfermedad) + P(positivo | No enfermedad) P(No enfermedad)
Fijaos que lo que hemos hecho es dividir las posibles circunstancias en las que se puede obtener un positivo en dos: tener la enfermedad y no tenerla. Calculamos la probabilidad de positivo en cada una de esas circunstancias y la hemos ponderado por la probabilidad de que dicha circunstancia se dé.
Esta estrategia puede extenderse hasta dividir lo que puede pasar en infinitos eventos y a la suma ponderada de todos ellos se le conoce como Teorema de la Probabilidad total.
Pues bien, vayamos a los números:
- P(enfermedad) = 0.001,
- P(No enfermedad) = 0.999;
- P(positivos | enfermedad) =0.98, la sensibilidad;
- P(positivo | No enfermedad) = 1- especificidad = 1-0.95 = 0.05
Usando entonces el teorema de Bayes, se llega a una probabilidad de sufrir la enfermedad habiendo obtenido un positivo de 0.02. Un valor muy bajo que no tiene nada que ver con la seguridad que en un inicio nos alarmó.
Pues bien, ahora que hemos entendido que es esto de la probabilidad condicionada y la probabilidad inversa, es hora de volver con nuestro fiscal.
Volviendo al juicio
La probabilidad que nuestra fiscal venia manejando era la de haber hallado ese tipo de sangre si la acusada era realmente culpable. Sin embargo, la que le debía interesar realmente, era la de la acusada fuera culpable dada la única prueba disponible: una muestra de sangre tipo 0-.
Hemos visto que, usando el Teorema de Bayes como en el caso de la enfermedad, el fiscal podía dar la vuelta a la probabilidad que sí que tenía: P(tipo de sangre 0- en la escena del crimen | la acusada cometió el crimen) =0.98 para convertirla en la que realmente le interesaba. Solo necesitaba un valor inicial para la probabilidad de culpabilidad (P(A)).
Juguemos con los números.
Supongamos que empezamos por creer que la acusada es inocente y damos una probabilidad muy baja a su culpabilidad, de 0.01, por ejemplo. Ahora solo nos falta el denominador, P(B), que en este caso es P(tipo de sangre 0- en la escena del crimen). Utilizando de nuevo el teorema de la probabilidad total, podemos calcularla como:
P(tipo 0- | la acusada es culpable) P(culpable) + P(tipo 0- | no culpable) *P(no culpable)
Ya sabemos que la primera probabilidad que aparece es la que manejaba el fiscal y tiene un valor de 0.98, la segunda es la de culpable que hemos pre-fijado en 0.01. Después tenemos la probabilidad de haber hallado ese tipo de sangre si no tenemos ni idea de quien cometió el crimen. Asumimos que esa probabilidad es la misma que en la población general, que para el grupo 0- es de 0.07. Por último, tenemos la probabilidad de nos ser culpable que será 1-0.01=0.99.
Combinando todos estos valores y utilizando el Teorema de Bayes nos queda que la probabilidad de que la acusada sea culpable es de 0.12, mucho menor que la probabilidad que manejaba el fiscal. Cabe destacar que, cuanto mas raro sea el tipo de sangre, es decir, más especifica sea la prueba, mayor será la probabilidad de que sea culpable.
No solo un ejemplo
El error que cometía nuestro fiscal y que ya hemos dicho que se conoce como la falacia del fiscal o Prosecutor’s Fallacy, en inglés, no es solo un ejemplo de juguete. Uno de los casos más famosos en los que esta falacia llevó a la cárcel, injustamente, a una persona, fue en el juicio contra Sally Clark. Sally estaba acusada de haber asesinado a sus dos hijos pequeños. Los dos pequeños de la familia Clark habían sufrido muerte súbita, un suceso muy triste pero que se produce de forma natural en los primeros meses de vida de algunos bebés.
Durante el juicio, se incurrió en la falacia del fiscal al considerar lo probable que era que los niños hubiesen muerto si la madre había sido la culpable, pero no la probabilidad de culpabilidad de la madre que se veía considerablemente reducida si se consideraban todas las posibles causas de muerte y, sobre todo, que la muerte súbita podía tener que ver con la genética de los bebes y, por tanto, ser más común entre hermanos.
Así pues, solo me queda decir que no os dejéis llevar por las apariencias, y que siempre penséis con claridad en cual es el evento del que queréis calcular su probabilidad, no vayamos a darle la vuelta.
Gracias por leer hasta aquí!
Hola Anabel utilicé parte de tu material para escribir un artículo de divulgación. Me gustaría enviarte una copia. ¿puedes enviarme uno?
Hola Daniel!
En primer lugar, ¡muchas gracias!
Que necesitas que te envíe, ¿dirección de e-mail?
Buenas tardes, Anabel. Disculpa si comento algo que haya salido en la bitácora o si crees que te invito a una fosa de cocódrilos: ¿Qué piensas que podrían aportar estas ideas a las polémicas sobre PCR abusivas y/o contagio de asintomáticos?
Un saludo y gracias por tu dedicación.
Hola! En primer lugar, gracias por tu comentario y por leerme.
La falacia del fiscal de lo que nos habla es de que cuando nos hacemos una PCR, su sensibilidad no nos dice mucho sobre la probabilidad real de que estemos contagiados. Para ello es importante conocer la incidencia de la enfermedad en ese momento y combinarla con dicha sensibilidad (probabilidad de que de + estando enfermo). En ese sentido, volver a realizar una PCR es una buena opción para asegurar el resultado. Dos PCR positivas aportan una mayor certeza sobre el contagio real que una única. No se si es a esto a lo que te referías.
Un saludo
Anabel
El problema le veo en que mucho aparente debate en redes sobre la efectividad de las PCR -y las medidas tomadas ante un positivo- se ha basado en ideas estadísticas sacadas de contexto y usadas como arma arrojadiza. Los pobrecitos de letras puras conseguimos entender un poco las cosas gracias a bitácoras tan buenas como ésta, pero me temo que por desgracia los hinchas del negacionismo y los hinchas del confinamiento no están interesados en aprovechar este conocimiento que compartís tan generosamente.
Pues tienes mucha razón… supongo que tocará seguir dando la lata a ver si conseguimos llegar a alguien más.
Gracias!