Fisher y el diseño de experimentos.

Dejadme que os cuente algo sobre un personaje peculiar. Alguien a quien no debemos admirar por su carácter endiablado, ni mucho menos por sus ideas extremistas sobre la aplicación de las leyes biológicas al perfeccionamiento de la especie humana –corriente conocida como eugenesia y muy popular a principios del siglo XX– pero si por la revolución que supusieron sus ideas en el mundo de la Estadística y la genética.

Ronald A. Fisher Durante su visita a la Universidad de Adelaida. Fuente, Facultad de ciencias de la Universidad de Adelaida.

Empecemos por el principio

Ronald Aylmer Fisher nació en Londres el 17 de febrero de 1890 en el seno de una familia numerosa de clase media. Desde pequeño, tuvo grandes problemas de visión que marcaron su vida y, muy probablemente, su carácter. Dicha condición le eximió de unirse al ejército para combatir en la Primera Guerra Mundial, pudiendo haber aumentado su capacidad de abstracción. De hecho, el afirmaba que las ideas se visualizaban en su mente en forma geométrica antes de que las materializase en lápiz y papel. 

Siempre destacó en matemáticas, recibiendo en 1909 una beca para estudiar en Cambridge donde finalizó sus estudios en 1912, con apenas 22 años de edad. Fisher empezó a trabajar entonces como estadístico para la ciudad de Londres combinando este trabajo con la docencia en diversos colegios de educación secundaria. Poco después, en 1917 se casó con su prometida, Ruth E. Guinnes, con la que tuvo dos hijos y seis hijas. 

Entre 1919 y 1933 Fisher trabajó en la empresa Rothamsted Research, una de las instituciones agrícolas más antiguas del mundo (fundada en 1843) dedicada a la experimentación agrícola. El tratamiento de los datos recopilados en la empresa a lo largo de los años y la necesidad de crear nuevos experimentos llevaron a Fisher al desarrollo de potentes herramientas estadísticas que se vieron reflejadas en una gran producción científica en forma de libros y artículos. Especialmente destacables son dos de sus publicaciones: Statistical Methods for Research Workers y The Design of Experiments. 

Fisher y las hipótesis

En concreto,  Statistical Methods for Research Workers fue publicado en 1925. En él se acuña la idea de hipótesis nula y se populariza el uso del p-valor. Según Fisher, la hipótesis nula era aquella establecida por defecto y que había que rebatir a partir de los datos observados. Para ello se servia del  p-valor, una estimación de la probabilidad de observar esos datos si asumimos como cierta la hipótesis de partida. En este contexto Fisher desarrolla también el Análisis de la Varianza (ANOVA). Esta técnica, ue ha llegado prácticamente intacta hasta nuestros días permite contrastar la existencia de diferencias entre tratamientos experimentales.

Estas ideas convierten a Fisher en uno de los padres del contraste estadístico de hipótesis y fueron la base de uno de sus grandes enfrentamientos personales, su enemistad con Eagon Pearson y Jerzy Neyman.  

Fisher y el diseño de experimentos

Años más tarde, en 1935, se publicaba The Design of Experiments. En el   Fisher formaliza la idea de diseño experimental y lo dota de base matemática. En particular, Fisher pone de manifiesto la necesidad de controlar y reducir toda variabilidad ajena a la condición experimental con el fin de poder establecer relaciones de causalidad.  Dentro de  este libro Fisher incluyó su famoso ejemplo: The Lady tasting tea

En versión moderna, imaginad que quedáis a tomar una cerveza con una amiga y esta pide una clara con limón. Al llegar el camarero con la clara vuestra amiga se pone hecha una furia. Alega que el camarero le ha puesto el limón antes que la cerveza y ella ha pedido cerveza con limón y no limón con cerveza. A ti te explota la cabeza… ¿Cómo puede notar la diferencia? De hecho no crees que sea capaz de notarla.

A Fisher le pasó algo similar, pero en esa ocasión su amiga tomaba té con leche. Él decidió diseñar un experimento para comprobar si realmente su amiga era capaz de diferenciar el orden en el que se habían servido los ingredientes. Para ello puso 4 tazas con la leche antes que el té y 4 servidas al contrario. Después le presentó las 8 tazas ordenadas al azar y ella, sabiendo que había 4 de cada tipo, marcó aquellas que pertenecían a cada grupo

La hipótesis nula de Fisher era que su amiga calificaría las tazas al azar. Gracias a la combinatoria, sabía que tenía 70 formas diferentes de hacerlo.  A partir de ahí podía calcular exactamente la probabilidad de haber acertado en 0, 1, 2, 3 o 4 tazas y decidir si esos aciertos eran compatibles o no con su hipótesis de partida.

En concreto, teniendo en cuenta un umbral de 0.05 para el p-valor, la única forma en la que dudaría de que su amiga estuviese clasificando las tazas al azar es si esta clasificaba correctamente todas las tazas. 

A este tipo de prueba se le llamó “prueba exacta de Fisher” ya que las probabilidades se calculan de forma “matemática” y no utilizando distribuciones de probabilidad. 

Otra de sus grandes ideas fue el uso de los diseños en cuadrado latino, inspirados en los trabajos de Leonhard Euler. La idea era dividir los campos en parcelas que se alineaban en filas y columnas. Después se aplicaban los tratamientos de forma que cada uno apareciese una única vez en cada fila y una única vez en cada columna (vamos… algo parecido a hacer un sudoku). 

Diseño en cuadrado latino en la portada del libro The Design of Experiments

Es importante destacar que, en ambos ejemplos, lo más importante es la intuición detrás del diseño. Fisher intentó controlar toda la variabilidad no relacionada con aquello que quería probar. Por ejemplo, en el caso de la cata de té,  utilizó tazas iguales y aleatorizó el orden en que se le ofrecieron. Así Fisher evitaba que la mujer pudiese adivinar por otros medios, a qué grupo pertenecía cada taza. Por otra parte, los diseños en cuadrado latino, aún utilizados hoy en día, permiten despreciar el efecto de la localización de la parcela. Efecto que se promedia entre todas las posibles localizaciones del mismo tratamiento en el campo.   

Una personalidad complicada

Cabe destacar que sus trabajos en el marco agrícola no solo le permitieron hacer avances en Estadística, sino también en las teorías sobre la evolución y la herencia genética. En este campo consiguió dar sentido a las teorías de Charles Darwing, conjugándolas con las ideas de Gregor Mendel, sobre la herencia genética, publicando, en 1930, su libro The Genetical Theory of Natural Selection.

Pero no se puede hablar de Fisher sin referirse un poco a su vida personal. Fisher fue un tipo peculiar. De aspecto y comportamiento descuidado, era de trato difícil, sobre todo si pretendías llevarle la contraria, algo que no resultaba difícil dada la radicalidad de sus ideas, a veces acertadas, otras no tanto. 

Uno de sus grandes enfrentamientos fue con Karl Pearson, otro de los grandes de la Estadística del siglo XX. Karl era el editor de la revista Biometrika, referencia indispensable para la comunidad estadística incluso en la actualidad. Fisher pretendió publicar en ella un trabajo en el que solucionaba un problema con el que Pearson llevaba años lidiando. Pearson decía que la demostración de Fisher era basura y decidió no publicarla a pesar de tratarse de una demostración correcta. Desde entonces su relación fue a peor y, como ya hemos comentado antes, sus trabajos en el área del contraste de hipótesis extendieron  las rencillas a su relación con el hijo de Karl, Eagon Pearson y su colaborador Jerzy Neyman. 

Conocida era también su animadversión por la visión Bayesiana de la estadística, llegando a decir que todos los bayesianos harían bien en seguir a su líder (Thomas Bayes) y solo publicar de manera póstuma, haciendo referencia a que el Teorema de Bayes fue rescatado tras su muerte por uno de sus amigos, Richard Price, y publicado de manera postuma. Sin embargo, sus trabajos están plagados de referencias implícitas y explícitas al teorema de Bayes y entre sus amigos contaba con Harold Jeffreys, reconocido y convencido practicante de la Estadística Bayesiana. Además, Joan G. Fisher, una de sus hijas, se casó con George E. Box, otro reconocido estadístico Bayesiano al que debemos la frase “todos los modelos son erróneos pero algunos son útiles”.  

Otra de las grandes polémicas en la vida de Fisher fue la campaña de defensa hacia las tabacaleras que emprendió de manera pública en 1950, aludiendo a que la relación entre el cáncer de pulmón y el tabaquismo podría no ser una relación causa-efecto, asunto que lo dejó bastante malparado ante la opinión pública. Una opinión que no se veía favorecida por  su defensa de la Eugenesia, que lo llevó incluso a justificar algunas de las prácticas del partido nazi aleman indicando que solo pretendían la mejora genética de la raza. Esta oscura parte de su personalidad ha llevado a que, en la actualidad, el Gonville and Caius College de Cambridge en el que estudió, se esté planteando retirar la vidriera que conmemora su trabajo. 

El final

Sin embargo, es imposible obviar su legado estadístico ya que, como bien dijo Leonard Jimmie Savage, es más fácil señalar las partes de la Estadística a las que no contribuyó que a las que sí lo hizo. De hecho, Fisher recibió numerosos reconocimientos a lo largo de su vida, aceptado como miembro de la Royal Society en 1920 fue nombrado Caballero por la Reina Isabel Segunda en 1952 y recibió la medalla  Darwin–Wallace  en 1958

Hacia el final de su vida, en 1959, Fisher se desplazó a la ciudad de Adelaida en Australia dejando a su mujer y a sus hijas en Inglaterra. Fue invitado por su amigo y colega J.H.Bennet, entonces Catedrático de Genética en la Universidad de Adelaida, para realizar una visita a la división de estadística matemática del CSIRO (Organización de investigación Científica e Industrial de la Commonwealth) y le gustó tanto la ciudad que allí se quedó hasta su muerte por un cáncer colorrectal en 1962 a la edad de 72 años y allí sigue enterrado en la Catedral de San Pedro. 

Referencias

J.H. Bennet se encargó de organizar y editar muchos de los trabajos y la correspondencia, tanto científica como personal de Sir Ronald Fisher. Estos documentos pueden consultarse en la web de la Biblioteca de la Universidad de Adelaida, así como visitarse en las instalaciones de la misma. 

M.A. Gómez-Villegas R.A. Fisher el inicio del análisis multivariante. 

Infante Gil, Said (2007) Ronald Aylmer Fisher y la agronomía, Revista Fitotecnia Mexicana, vol. 30, núm. 3, 2007, pp. 205-213 Sociedad Mexicana de Fitogenética, A.C

Wikipedia

https://www.theguardian.com/education/2020/jun/27/cambridge-gonville-caius-college-eugenicist-window-ronald-fisher

Navegación de entradas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.