Estadística bayesiana

26 septiembre, 2012 by in category Técnicas cuantitativas tagged as , with 6 and 0
Home > Noticias > Estadística bayesiana

Abstenerse aquéllos cuyo conocimiento de la estadística sea bajo… bastante me ha costado a mí entender lo que escribía. Recuerdo aquellas clases de estadística en las que, después de haber estado escuchando al profesor durante largo rato, sin entender nada, llegaba el momento en que algo chasqueaba en mi cabeza y se encendía una bombilla, una de aquellas sensaciones en la vida que no son comparables a nada más… guau, ¡entender un problema de matemáticas!

Recuerdo con especial afecto el momento en que logré familiarizarme con las pruebas de significación estadísticas, que te permetían contrastar la hipótesis planteada. Sin duda, su comprensión no sólo te facilitaba la realización de la mayoría de procedimientos estadísticos sino que, al mismo tiempo, provocaba que en tu cabeza se creara cierta imagen idealizada de los matemáticos que estaban construyendo la perspectiva matemática moderna… pero ¿cómo podían tener el cerebro tan grande? Sin embargo, esta idealización desapareció el día en que aparecieron unas sombras vaticinando el florecimiento de la estadística bayesiana (algunos profetas, o gurús de las matemáticas, han advertido que, a partir del 2021, toda la estadística será bayesiana).

Aunque parece que es precisamente ahora cuando ha aparecido la estadística bayesiana, ésta tiene ya muchos años de historia. De hecho, el teorema de Bayes se formuló por primera vez en 1763 por Thomas Bayes. Sin embargo, la consciencia científica sobre las ventajas que puede proporcionar este paradigma estadístico no se sentó hasta muchos años más tarde.



La estadística bayesiana es, básicamente, una respuesta a las tres grandes críticas que se han realizado a la inferencia estadística clásica o frecuentista. Las pruebas de significación dependen del tamaño de la muestra: una muestra reducida probablemente no será estadísticamente significativa; en cambio, una muestra de gran tamaño no tendrá muchos problemas en representar estadísticamente el universo al cual pertenece. De esto se deduce que los resultados obtenidos dependen, más que del propio objeto de estudio, de los recursos económicos disponibles para llevar a cabo el proyecto. La estadística bayesiana, sin embargo, no depende del tamaño muestral, aunque una muestra  más grande nos permitirá valorar mejor la adecuación de las conclusiones a la realidad.

En segundo lugar, también se ha criticado que las pruebas de hipótesis sirven sólo para tomar decisiones dicotómicas (o se refuta la hipótesis nula o la alternativa), en lugar de poner el acento en la credibilidad de la adecuación de la hipótesis provisionalmente aceptada a la realidad empírica. De otro lado, la estadística bayesana tiene un enfoque más rico, no fundamentado en el tener que escoger entre dos hipótesis sino que lo que busca es valorar la credibilidad de éstas.

La tercera de las críticas que ha recibido la estadística clásica reside en el hecho que no contempla el cuerpo de información disponible previo a la adquisición de los datos sobre los que se fundamenta un estudio. Lo único en lo que se centra la estadística clásica es la refutación ya sea de la hipótesis nula o de la hipótesis alternativa basándose en los datos presentes; de este modo, se desprecia toda la infomación, ya sea a nivel teórico o a nivel empírico, que se ha originado en el pasado. La estadística bayesiana, en cambio, no actúa en el vacío:  el conocimiento previo se tiene en cuenta formal y explícitamente.

Este último punto es la base sobre la que se sientan los fundamentos de la estadística bayesiana, y el que explica la gran diferencia que enfrenta la estadística clásica con la bayesiana. Ésta última incorpora las probabilidades sujetivas, es decir, las que emergen de la propia intuición del investigador, de que el resultado de un determinado experimento presente los resultados esperados. Estas probabilidades sujetivas no tienen por qué estar ancladas en razones puramente intuitivas, sino que los resultados obtenidos en experimentos en estudio previos se puede tomar como punto de partida para acercarse al objeto de estudio.

Uno de los ámbitos en los que mejor puede funcionar la estadística bayesiana es en la reducción del tamaño de la muestra necesaria para llevar a cabo un estudio poblacional. Desde una perspectiva estadística clásica, se da por descontado que el tamaño de la muestra se tiene que escoger en base a la regla de la máxima indeterminación (esto es, que hay un total desconocimiento sobre cuáles van a ser las distribuciones de una variable concreta), con lo que la probabilidad que se produzca P o Q va a ser del 50%. No obstante esto, si aplicamos principios bayesianos, veríamos que no sería necesario partir del supuesto P=Q=0,5 (siempre en el caso de tener conocimientos previos sobre una materia), ya que dispondríamos del valor al que se acerca P. Si sabemos que aproximadamente, en una población determinada, hay un 30% de cabezones… ¿por qué partir del supuesto P=Q=0,5, si sabemos que P se acercará a 0,3? La aplicación de esta filosofía permite, pues, reducir el tamaño de la muestra.

Esta diferencia entre los dos paradigmas estadísticos no es puramente matemática, sino que se acerca más a diferentes filosofías de comprensión del mundo. Según una perspectiva clásica, las hipótesis se contrastan de una manera deductiva: a partir de una teoría previa se elaboran hipótesis acerca de cómo se comportarán los datos si dicha teoría es cierta (proceso up-bottom). De esta manera, el no cumplimiento de una hipótesis es una razón suficiente como para poder admitir que la teoría de la que se parte no es cierta, aunque lo que se obtenga sean conclusiones, en un principio, contraintuitivas. Es decir, se deducen los resultados empíricos que se debería esperar en caso que la teoría de la que se parte fuera cierta.

De otro lado, la estadística bayesiana opera de un modo mucho más inductivo y cercano a la manera de razonar de los humanos. A partir de los datos de un determinado estudio se elabora una teoría (proceso bottom-up), que es la base para posteriores desarrollos del mismo campo de estudio. Los descubrimientos aislados que pudieran refutar las hipótesis, y que resultan ser contraintuitivos, no tienen porque llevar necesariamente a la refutación de todo el cuerpo teórico, sino que sirven para actualizar el conocimiento que ya se tenía de una materia. La base de la estadística bayesiana se encuentra en el hecho que el investigador incorpora sus expectativas acerca de como se comporta la realidad a su análisis estadístico.

La gran ventaja de la estadística bayesiana es que no opera en el vacío, que se basa en conocimiento previo y que proporciona un marco de análisis mucho más rico en tanto en cuanto deja mucha más libertad al investigador para que este pueda valorar hasta qué punto es probable que se produzcan determinados resultados en sus experimentos. Sin embargo, estas mismas ventajas también se pueden convertir en críticas: deja a la sujetividad del investigador algo que, como siempre se ha dicho de la ciencia, debería ser objetivo. Además, el rechazo de la estadística bayesiana a las pruebas de significación es un rechazo frontal al falsacionismo de Karl Popper, teoría filosófico-lógica sobre cómo tiene que ser el método científico. Según el falsacionismo, cuando los datos contradicen una teoría, ésta se tiene que dejar de lado.

Así, pues, del mismo hecho se pueden deducir ventajas y desventajas. No es que la estadística bayesiana sea buena o mala por definición, sino que depende de la manera en que ésta se use. Los métodos no puden juzgarse per se, sino por la manera según la que éstos se aplican.

Fotografía: Simon Harriyott

6 Comments

  • Juan Pino
    on 14 febrero, 2014 Responder

    impresionante resumen muchas gracias por hacerlo

  • Juan Manuel
    on 3 agosto, 2014 Responder

    Muy buen trabajo, me gustaría saber cuales son tus citas bibliograficas, y tambien como podria ser citado tu trabajo.

    • Autor
      Xavier Guiteras Vila
      on 4 agosto, 2014 Responder

      Hola Juan Manuel,

      las referencias bibliográficas están directamente linkadas en el texto. Si quieres citar el post… bueno, puedes hacer lo mismo: con un link al mismo post sería suficiente. En el caso que lo cites en formato papel puedes hacer los que se indica en este otro link: http://www.oocities.org/ermoquisbert/cw.htm

      Gracias!

  • Marco
    on 30 noviembre, 2015 Responder

    La explicación es tan clara y concisa que por dicha no me abstuve por mi bajo conocimiento en estadística
    Gracias

  • ANTONIO
    on 21 julio, 2017 Responder

    «Abstenerse aquéllos cuyo conocimiento de la estadística sea bajo…», no puedes iniciar de esta forma.
    Afortunadamente no te hice caso y pude tener acceso y comprensión a un excelente trabajo. Gracias

Add comment

© 2019 Empirica Influentials & Research