Hoy toca volver a la senda y retomar los conceptos estadísticos, de hecho, continuamos con la Estadística Bayesiana.
En una entrada anterior en la que explicábamos la mecánica general os contaba que, para aplicar el teorema de Bayes dentro de la filosofía Bayesiana, necesitamos principalmente dos elementos, la función de verosimilitud y la distribución a priori o previa. Pues bien, ¿vamos a por la primera?
¿Me dejas que te cuente?
Una historia para situarnos
Era un frío día de invierno, yo trabajaba en mi despacho hasta tarde cuando, de pronto, unos pequeños seres aparecieron en la pantalla de mi ordenador. Gritaban mucho, hablaban todos a la vez y lo hacían en un idioma que no era capaz de comprender.
En ese momento una enorme curiosidad me invadió, quería saber cosas sobre ellos, mil preguntas se agolpaban en mi cabeza, pero era imposible comunicarme con ellos sin conocer su idioma.
Recordé de pronto que mi directora (que antiguamente ocupaba mi despacho) solía guardar un aparato muy especial para situaciones similares, una máquina maravillosa que solo necesitaba que girases una ruedecilla y, al encontrar la posición correcta, se conseguía una traducción perfecta.
Pero ¿cuál era la posición adecuada para el idioma de estos seres? Quizás hablaban más de un idioma, quizás había un montón de ruido para que la traducción fuese buena. Aún así, lo único con lo que yo contaba para poder determinar dicha posición era la caja y las palabras de esos seres.
Con paciencia fui girando la rueda, en algunas posiciones me parecía empezar a entender algo, en otras posiciones no conseguía descifrar absolutamente nada. Decidí que lo mejor sería valorar con una puntuación la calidad de la traducción dependiendo de la posición de la rueda.
Con dicha puntuación conseguí hacerme una idea de qué posiciones eran las mejores para adaptarme a todos los sonidos emitidos por mis pequeños amigos.
Por supuesto, cabe mencionar que todo mi trabajo partía de la base de que la caja estaba correctamente construida y que podía fiarme de la traducción. Si la caja no era valida no podría confiar en que la traducción fuese real, por mucho que pareciese entenderse.
Ahora en lenguaje estadístico
Pero todo el mundo tranquilo, aun no veo visiones y estos pequeños seres nunca vinieron a visitarme, pero lo que sucede al usar la función de verosimilitud es muy similar a la historia que os acabo de contar.
Cuando nos encontramos con unos datos, queremos que nos cuenten algo, tenemos preguntas para ellos, pero necesitamos entenderlos en su idioma.
Lo que hacemos entonces es poner esa caja de traducción que es lo que solemos llamar modelos y tienen, al igual que nuestra máquina, “ruedecillas” que los adecuan a los datos. A estas ruedecillas es a lo que llamamos parámetros y son el objetivo de nuestro análisis.
Por supuesto, podemos tener un modelo muy sencillo con un solo parámetro o modelos súper complejos con un montón de ellos y, entenderlos, es equivalente a entender la “causa” que produjo los datos en primer lugar, el idioma de nuestros amigos en el ejemplo.
En base a los datos observados, cada valor de los parámetros nos dará una puntuación a la que llamamos verosimilitud y, como su propio nombre indica, nos ayuda a entender como de creíbles son dichos valores.
Esta función puede utilizarse de diferentes formas. Una de ellas es la elección directa de un valor para los parámetros. Por supuesto, elegiremos aquel que más creíble sea o, dicho de otra forma, aquel que maximice la verosimilitud. Esto es lo que hacíamos desde el punto de vista de la estadística frecuentista para dar una estimación puntual del parámetro.
Pero, por supuesto, también podemos usar la función de verosimilitud para cada posible valor y así tener una visión más completa del comportamiento de estos. Esto es lo que hacemos en estadística bayesiana.
En la siguiente animación podemos ver como funciona cuando tentemos unos datos que pensamos que pueden distribuirse de forma normal y no sabemos cual sería el verdadero valor para su media.
Concluyendo
En definitiva, en estadística bayesiana la función de verosimilitud resume la información que nos dan los datos sobre cada posible valor del parámetro.
Esta será la función que combinaremos con aquella información sobre los parámetros que ya teníamos antes de recoger los datos y que llamamos información a priori… pero eso para otro día.
Si has llegado hasta aquí, mil gracias por leerme, espero que te haya sido útil. ¡Cualquier comentario o crítica constructiva será bienvenida!
Cómo se pueden aplicar estos conceptos para entender el funcionamiento de los juegos de azar, como el Lotto?