Potencia para descubrir el mundo

El diccionario de la Real Academia de la Lengua Española define potencia, en su primera acepción, como: “Capacidad para ejecutar algo o producir un efecto”. Si tenemos en cuenta que, en ciencia, aquello que queremos ejecutar suele ser la comprobación de que una hipótesis es cierta, tiene sentido hablar de potencia como nuestra capacidad para aceptar dicha hipótesis cuando, efectivamente, es cierta. En particular, la palabra potencia se asocia a la metodología estadística conocida como contraste de hipótesis, y su estudio es un campo complejo que muchas veces se pasa por alto.  Pero ¿qué es la potencia estadística? ¿Cómo puede calcularse?

¿Me dejas que te cuente?

Contrastes de hipótesis

Antes de entender qué es la potencia, es importante que hablemos de la herramienta a la que queremos asignar dicha característica, el contraste de hipótesis. Como ya hemos comentado otras veces en esta casa, un contraste de hipótesis consiste en enfrentar dos ideas. La primera de ellas, que conocemos como hipótesis nula y denotamos por H0, representa el status quo, nada cambia, circulen que no hay nada que demostrar. La segunda, o hipótesis alternativa, HA, contiene lo que, de demostrarse, sería un nuevo descubrimiento. En principio, ambas hipótesis serán complementarias, si una no es cierta, deberá serlo la otra… aunque esto es un tema peliagudo en el que entraremos otro día.    

Antes de continuar, es importante mencionar que, cualquier contraste de hipótesis parte de la base de que una de las dos descripciones del proceso es cierta, pero nuestro limitado conocimiento no nos permite saber cuál y debemos recurrir a los datos para hacernos una idea.

En ese sentido, a la hora de tomar una decisión la estrategia es establecer la compatibilidad de los datos con la hipótesis. Esto es, si mi hipótesis es que todas las rosas son rojas, pero cuando voy a un jardín encuentro rosas amarillas y blancas, pues mis datos no son compatibles con la hipótesis que yo había formulado y me veré obligada a rechazarla. 

En particular, lo que se hace es establecer un valor numérico a partir de los datos, al que damos el nombre de “estadístico”. Si la hipótesis nula fuese cierta, dicho valor debería estar en un rango determinado conocido como región de aceptación. Si no lo está, diremos que nuestros datos son poco compatibles con la hipótesis y la rechazaremos decantándonos entonces por la Hipótesis alternativa y pudiendo decir que hemos realizado un descubrimiento… pero… ¿podemos estar tan seguras? 

Los errores malignos

Lo cierto es que, ya sea que los datos nos hagan decantarnos por una hipótesis o por la otra, en realidad no sabemos cuál es «la verdad» y es posible que nos equivoquemos. 

Imagina que estamos probando la eficacia de un nuevo medicamento. Podría ser que el medicamento no fuese efectivo y, por tanto, la hipótesis nula fuese cierta pero que, al analizar los datos, la decisión (errónea) sea rechazarla. En ese caso diremos que estamos cometiendo un error Tipo I y hablaremos de falso descubrimiento. Si, por el contrario, el medicamento sí funciona, pero resulta los datos no nos permiten rechazar la hipótesis nula, lo que sucederá es que no realizaremos un descubrimiento que sí estaba ahí. A este tipo de error lo llamamos tipo II.  

Con la metodología estadística del contraste de hipótesis, lo cierto es que podemos establecer la probabilidad de cada uno de estos errores que solemos denotar como \alpha para el error tipo I y como \beta para el error tipo II. Y si \beta es la probabilidad de equivocarnos cuando no hacemos un descubrimiento, 1- \beta es la probabilidad de lo contrario, acertar al hacer un descubrimiento y a esta probabilidad es a lo que llamamos potencia de un contraste

Ahora que ya tenemos identificada lo que es la potencia, lo importante es saber como podemos controlarla. La cuestión es que \alpha y \beta están relacionados y es imposible disminuir uno de ellos sin que aumente el otro. Pero, por suerte, contamos con una baza más, bueno, en realidad con un par. 

Los otros elementos de la potencia

Cuando tratamos de aumentar la potencia (disminuir \beta) manteniendo \alpha en un nivel razonable, algo que sí podemos hacer es aumentar el tamaño de la muestra. Pero también podemos redefinir qué sería para nosotros un “descubrimiento”, lo que se conoce como tamaño del efecto. 

Esta última parte es clave en cualquier contraste de hipótesis y es que, cuando decimos que un fármaco funciona, es importante puntualizar a que nos referimos. No es lo mismo que, para decir que el medicamento funciona, busquemos que cure al 80% de los enfermos, que querer decir que funciona si es capaz de curar al 10%. En el primer caso, los datos casi hablaran solos, mientras que en el segundo, nos costará mucho más estar seguros. 

Piénsalo de otra forma, si haces una foto y quieres ser capaz de ver que en ella hay una persona, bastarán unos pocos pixeles, será fácil… pero si lo que quieres es detectar una pequeña piedra del suelo, será necesaria una foto muy nítida y con mucha resolución para conseguir distinguirla y asegurar que es una piedra… y aun así, seguirá siendo posible equivocarse. 

Es importante mencionar aquí que, establecer el tamaño del efecto del que hablamos requiere de cierto conocimiento sobre aquello que estamos estudiando. En particular, poniéndolo en términos estadísticos, será importante tener una idea de la media y la varianza del proceso a estudiar (antes de hacerlo).

Hay, por supuesto, tamaños de efecto pre-establecidos que debemos a una de las personas que más estudió este tema, Jacob Cohen (1923 – 1998). Sin embargo, como todo lo pre-establecido, no tiene por qué ser siempre lo más adecuado. En cualquier caso, al hecho de jugar con los cuatro elementos, tamaño de la muestra, tamaño del efecto, \alpha y \beta se le denomina Análisis de la Potencia.  

Análisis de la potencia, llegando a un consenso

Si pensamos en una investigación cualquiera, la costumbre suele ser fijar la probabilidad de error tipo I, el famoso \alpha=0.05, con un tamaño de muestra predeterminado, y lanzarse al vacío para ver si se rechaza o no la hipótesis nula… en ese caso, lo único que nos queda es calcular la potencia con la que estamos afirmando que hemos descubierto algo. Pero, si queremos hacerlo de manera adecuada, lo razonable es establecer con cuidado los cuatro elementos del análisis de la potencia ANTES de proceder con el experimento o la recogida de datos. 

Por ejemplo, si tenemos un tamaño de muestra fijado, será conveniente que lleguemos a un consenso entre lo que voy a ser capaz de descubrir y con que error seré capaz de hacerlo. 

Si, por el contrario, tenemos claras la potencia, y la probabilidad de error tipo I deseadas y sabemos cuál es el tamaño del efecto que queremos descubrir, solo nos quedará establecer un tamaño de muestra adecuado. 

 Y ahora te preguntarás… ¿y cómo hago yo eso? Pues hay muchas formas de llevar a cabo este tipo de análisis. Desde el análisis puramente “matemático” de las condiciones bajo cada hipótesis, a las calculadoras disponibles online, pasando por hacer simulaciones del proceso. Pero dejadme que antes de terminar os hable de algunas calculadoras. 

Calculadoras del tamaño muestral

Es posible encontrar este tipo de herramientas en formato online como la del MD Anderson center o la del Institut Municipal d’Investigació Mèdica de Barcelona, conocida como GRANMO

Pero también en forma de software para descargar e instalar, este es el caso de G-Power, una herramienta de la Universidad de Düsseldorf, realmente flexible, para realizar este tipo de análisis bajo los contrastes estadísticos más conocidos (test t, ANOVA, Chi cuadrado). 

En todas estas calculadoras los pasos son muy similares, 

  • decidir cual es el tipo de herramienta a utilizar. Dicho de otro modo, qué tipo de datos tengo y qué traducción a la estadística tienen mis hipótesis. 
  • establecer la potencia y la probabilidad de error tipo I deseadas
  • determinar el tamaño del efecto, ya sea mediante una diferencia de medias y su varianza o mediante los tamaños pre-establecidos de Cohen
  • pulsar el botón de calcular para obtener el tamaño de la muestra necesario… y como será muy grande, volver a empezar para jugar con todos los elementos 😜

¡Ahora te toca probar a ti! Gracias por leer hasta aquí y espero que te haya resultado útil

Referencias: 

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.