¿Por qué es Importante la Investigación?

Si nos preguntasen si es importante la investigación muchos diríamos que sí. Si nos preguntasen que es un Ensayo Clínico Aleatorizado muchos sabríamos dar una definición del mismo. Sin embargo, cuando en la carrera me preguntaba porque era importante la investigación no era capaz de elaborar una repuesta bien definida. Pienso que un factor implicado en ello era mi incapacidad para entender realmente por qué es necesario hacer un estudio para conocer de manera más objetiva y fiable el mundo. Con el siguiente ejemplo voy a intentar explicar algunos conceptos al respecto que espero ayuden al lector a entender el porqué de la pregunta.

El Caso del Tirador de Dados

Juan y Lucia son dos amigos que están pasando una tarde tranquila hablando. En un momento dado, Juan le comenta a Lucia que ha estado practicando tirando dados y que es capaz de hacer que salga muy a menudo el número 3, más de lo que saldría por azar al tirar un dado. Sin embargo, Lucia no le cree, ya que piensa que es algo muy difícil de conseguir y que requiere mucha habilidad, una habilidad que según ella Juan no posee. Lucia está estudiando Fisioterapia y justo esa semana acaban de dar un seminario sobre investigación, de modo que Lucia propone a Juan llevar a cabo un pequeño experimento para comprobar si dice la verdad.

Cada uno de ellos plantea una hipótesis:

  • Hipótesis Nula (H0): Es la propuesta por Lucia, de que Juan no es más capaz que cualquier otra persona de tirar un dado y que salga el número 3.
  • Hipótesis Alternativa (H1): Es la propuesta por Juan, de que es capaz de sacar el número 3 más veces que una persona normal.

Error Tipo I

Lucia sabe que el azar es tendencioso y que, aunque elabore un buen experimento, puede acabar obteniendo un resultado a favor de la afirmación de Juan debido a este. Lucia lo piensa detenidamente y llega a la conclusión de que no aceptará más de un 5% (p<0.05) de probabilidades de que el estudio resulte a favor de Juan a causa del azar. Esto es lo que se conoce como error tipo I (alfa), que es la probabilidad de cometer un falso positivo, es decir, de rechazar la hipótesis nula en base a los resultados del estudio, cuando en verdad ésta es cierta.

Si tenemos un dado común, con 6 caras, la probabilidad de que al tirarlo (por azar) salga el número 3 es de 1/6 (0.166). Lucia ha establecido que solo aceptará un 5% (0.05) de probabilidad de cometer un error tipo I, por tanto, si el experimento consistiera en tirar el dado una sola vez nunca podríamos comprobar quien tiene razón ya que, por azar, la probabilidad mínima de que salga el número 3 es de 0.166.

Podemos establecer que, si tiramos un dado, por azar, existen solamente dos posibles resultados de interés en nuestro experimento: que salga el número 3 o que no salga. Esto es lo que se conoce como un Ensayo de Bernoulli.

En nuestro caso, si tiramos varías veces el mismo dado estaríamos realizando varios Ensayos de Bernoulli independientes entre sí. Son independientes porque, el resultado de haber tirado el dado una vez, no afecta a la probabilidad de resultados de tirar el mismo dado la próxima vez, es decir, si tiro un dado y me sale el número 3, la segunda vez que tire el dado la probabilidad de que salga el número 3 seguirá siendo la misma (0.166) que si en la primera tirada no me hubiera salido el número 3. Esta independencia de sucesos puede parecer en determinados casos contra-intuitiva, por ejemplo:

Estáis apostando con un amigo dinero a cara/cruz lanzando una moneda al aire, han salido 17 caras, ¿apostaríais a cara o a cruz? O un ejemplo más extremo, han salido 300 caras y ninguna cruz. Lo cierto es que en ambos casos la probabilidad de que la siguiente vez que lancemos la moneda salga cara es igual a que salga cruz, un 50%. Sin embargo, existe cierta tendencia a pensar que una racha de muchas caras ha de verse seguida por una cruz, esto es lo que se conoce como la Falacia del Jugador.

Un ejemplo de repetición de Ensayos de Bernoulli que no fuesen independientes entre sí sería el siguiente:

Tenemos una caja con 10 bolas negras y 10 bolas rojas. Metemos la mano sin mirar y por azar solo podemos obtener dos resultados: bola roja o bola negra. Es por tanto un Ensayo de Bernoulli. Sin embargo, cuando metemos la primera vez la mano la probabilidad de sacar una bola roja es del 50%, pero cuando hemos sacado dicha bola, la segunda vez que metemos la mano la probabilidad ha cambiado, ahora es solo del 47,3%. Por tanto, los ensayos son dependientes.

Una serie de n Ensayos de Bernoulli que son independientes entre sí, por azar, sigue lo que se conoce como una distribución de probabilidad Binomial. Imaginemos que tenemos una moneda -cara / cruz- (obviemos el resultado de canto) y la tiramos 10 veces, podríamos obtener cualquiera de los siguientes resultados:

  • 0 cruces / 10 caras.
  • 1 cruz / 9 caras.
  • 2 cruces / 8 caras.
  • 3 cruces / 7 caras.
  • 4 cruces / 6 caras.
  • 5 cruces / 5 caras.
  • 6 cruces / 4 caras.
  • 7 cruces / 3 caras.
  • 8 cruces / 2 caras.
  • 9 cruces / 1 cara.
  • 10 cruces / 0 caras.

La distribución de probabilidad Binomial de dicho experimento sería la siguiente:

grafica ejemplo moneda

Esta gráfica representa la probabilidad de que sucedan cada uno de los eventos citados anteriormente, es decir, la probabilidad de que salgan 0 cruces en 10 tiradas P(X=0), de que salga solo 1 cruz P(X=1)…Lo más probable es que salieran 5 cruces y 5 caras P(X = 5)= 0.2461.

La fórmula para calcular la probabilidad de que ocurra un suceso en un Experimento Binomial es la siguiente:

formula binomial

donde p es la probabilidad del suceso x,  x = {0,1,2,…,n}, y n es el número de Ensayos de Bernoulli realizados. Siendo:

combinaciones formula binomialç

las combinaciones de n en x (n elementos tomados de x en x).

Por ejemplo, la probabilidad de que en 10 lanzamientos de una moneda salgan 5 cruces es:

ejemplo formula binomial

En base a ello, Lucia establece que con solo dos tiradas ya se puede obtener un suceso con una probabilidad menor de 0.05, ya que la probabilidad de que salga el número 3 en las dos tiradas es de 0.0278:

grafica dado 2 veces

Error Tipo II

Lucia y Juan realizan el experimento y el resultado es que sale un número 3 y un número 5. Como la probabilidad de dicho suceso es de 0.277 (p>0.05) Lucia concluye que Juan le ha mentido.

Sin embargo, Juan no está de acuerdo con el procedimiento llevado a cabo para evaluar la veracidad de sus afirmaciones. Juan argumenta que, aunque él tiene buena habilidad para hacer que salga el número 3, esta capacidad no es perfecta y que por tanto, el estudio realizado no es adecuado. Juan dice a Lucia que, en su planteamiento, ha olvidado la probabilidad de la que dota a Juan de poder probar la veracidad de sus afirmaciones, solo ha tenido en cuenta la probabilidad que asume ella de equivocarse con el experimento.

Como ya hemos visto, en un dado común tirado por alguien sin habilidades excepcionales, la probabilidad de que salga el número 3 es de 0.166 y si realizamos dos tiradas, la probabilidad de que salga 2 veces el número 3 es de 0.0278. Si sucede dicho suceso (p=0.0278) Lucia aceptaría en principio que la afirmación de Juan es cierta. Sin embargo, ¿cuál es la probabilidad de que Juan obtenga 2 veces el número 3 en dos tiradas? Juan dice que, según su experiencia, es capaz de hacer que salga el número 3 un 36% de las veces que tira el dado. Usando ese dato y con la fórmula citada anteriormente, obtenemos que la distribución de probabilidad de Juan lanzando un dado es la siguiente:

distribucion 0.36 juan

Esto implica que Juan solo tiene un 13% de posibilidades de sacar 2 veces el número 3 en dos tiradas, es decir, tiene un 13% de posibilidades probar, según los requisitos establecidos por Lucia, que dice la verdad. Juan piensa que esto es injusto, ya que apenas tiene posibilidad de probar que dice la verdad. Juan establece que una buena opción sería dotarle de un 80% de posibilidades de probar la veracidad de sus afirmaciones. En el caso de que solo se tirase el dado 2 veces, para que hubiera un 80% de probabilidad de sacar el número 3 dos veces, Juan debería ser capaz de hacer que salga el número 3 un 90% de las veces que tira un dado. Esta sería la distribución de probabilidad:

binomial 80 beta

Juan ya ha establecido que su capacidad de sacar el número 3 según él es del 36%, no del 90%, por ello argumenta que el experimento realizado no sirve para ver si dice o no la verdad. Dado que Juan establece que quiere un 80% de posibilidades de probar que dice la verdad, esto implica que acepta un 20% de posibilidades de que, aunque diga la verdad, no pueda demostrarlo con los resultados del experimento. Esto es lo que se conoce como error tipo II (beta), que es la probabilidad de cometer un falso negativo, es decir, de no rechazar la hipótesis nula en base a los resultados del estudio, aunque esta no sea cierta.

Tamaño Muestral

Por tanto, en base a la argumentación proporcionada por Juan, él y Lucia deciden repetir el experimento. Realizan cálculos y estiman que necesitarían 30 tiradas para que Juan tuviera un 80% de posibilidades de probar la veracidad de sus afirmaciones Y que Lucia solo asumiera un 5% de probabilidad de equivocarse al aceptar que Juan tiene razón en base a los resultados del mismo (datos obtenidos a partir de la fórmula expuesta anteriormente):

tamaño muestral distribuciones

Es decir, la probabilidad de que, por azar, se obtengan 9 o más veces el número 3 al tirar un dado 30 veces (sumatorio de las probabilidades de obtener 9, 10, 11, …, 30 veces el número 3) es de 0.0495 (p<0.05). Y, según la estimación de Juan de su capacidad de lanzar el dado, la probabilidad de que Juan lanzando un dado común obtenga 9 o más veces el número 3 es de 0.8078.

Esta vez, tras realizar el experimento, Juan es capaz de sacar 11 veces el número 3, que según la distribución de probabilidad de un dado común lanzado por una persona común, solo hay un 0.0065 de probabilidades de que esto haya sucedido por azar (sacar 11 o más veces el número 3). Dado que 0.0065<0.05 (riesgo máximo asumido por Lucia), ambos concluyen en base a los resultados del experimento que Juan decía la verdad.

Controlando el Entorno

Lucia se va a casa reflexionando, aún le parece increíble que Juan tenga esa habilidad excepcional para lanzar el dado y que salga el número 3. Sin embargo, los resultados estadísticos del estudio han sido concluyentes a su favor. Al día siguiente, Lucia está leyendo un libro sobre estadística que le han recomendado y se da cuenta de que ha cometido un fatídico error, asumir que la estadística es lo único que importa a la hora de realizar/interpretar los resultados de un experimento. Inmediatamente llama a Juan y le comenta que le gustaría volver a realizar el experimento, con una pequeña variación. Juan no se muestra muy abierto a la idea. Ese mismo día ambos quedan para realizar el nuevo experimento.

Lucia le explica a Juan que lo que ambos quieren evaluar es si la capacidad de él para lanzar un dado común es superior a la de una persona común, pero que con el experimento que realizaron no se podía responder a esa pregunta, había un factor de confusión que no se había tenido en cuenta. Lucia había asumido que el dado que utilizó Juan era un dado común, sin haberse asegurado de ello. Lucia sabe que sus capacidades para lanzar un dado no difieren de las del resto de cualquier persona común, de modo que plantea realizar el experimento tirando ambos el dado 30 veces y usando los resultados de Lucia como grupo control de la variable dado común. De este modo, comparando los resultados de ambos se podría saber si el resultado del experimento del día anterior se debió a la habilidad de Juan o no.

Realizan el nuevo experimento y obtienen los siguientes resultados:

  • Juan: 10 veces el número 3 (p = 0.0192, de sacar 10 o más veces el número 3).
  • Lucia: 11 veces el número 3 (p = 0.0065, de sacar 11 o más veces el número 3).

Es decir, ambos obtienen valores que se alejan mucho de los esperados al lanzar una persona común un dado común, sin embargo, no hay diferencias entre Juan y Lucia. Por tanto, Lucia concluye que Juan no dice la verdad, su capacidad para lanzar el dado es igual que la de cualquier otra persona, habiéndose debido los resultados del primer experimento a que el dado en cuestión está trucado, aumentando la posibilidad de que salga el número 3 en comparación al resto de números. Juan sonríe y dice a Lucia que tiene razón, es un dado especial que le regaló un amigo.

Conclusiones.

Hay aspectos del mundo que no pueden conocerse sin los regímenes experimentales adecuados, como en el caso de Juan y Lucia. ¿Piensa el lector que habría sido suficiente con “creer” a Juan en base a su experiencia? ¿Habría sido posible conocer si Juan decía la verdad pidiéndole que lanzase un dado un par de veces?

Rotundamente no, del mismo modo que no deberíamos confiar en el “a mí me funciona” a la hora de plantearnos si una técnica o procedimiento es efectivo para un determinado proceso.

Por otro lado, otro aspecto a resaltar de nuestra pequeña historia es que la estadística no lo es todo.

La estadística es solo una parte más del proceso de investigación.

Uno de los factores que pueden producir diferencias entre dos tratamientos distintos es el azar, pero no es el único factor, al igual que en el caso de Juan y Lucia, donde teníamos el factor dado trucado.

Espero que con esta entrada el lector haya podido comprender mejor algunos aspectos de la investigación y la importancia de la misma.

*Las gráficas se han obtenido a través de la siguiente página web: https://www.geogebra.org/m/MsKfK7GU