TOMA DE DECISIONES: ANÁLISIS DEL ENFOQUE BAYESIANO

Análisis del enfoque Bayesiano

Conceptos generales

A principios del siglo XX, la ausencia de una herramienta que aquilatara cuantitativamente el significado de los hallazgos produjo que las anécdotas clínicas poblaran las revistas médicas. Se hacía necesario, por tanto, usar procedimientos que cuantificaran la evidencia y complementaran los razonamientos verbales, de modo que los protegiera de la subjetividad.

La estadística devino así en un recurso extremadamente útil para los editores de revistas y responsables administrativos. Sin embargo, lo cierto es que, aunque la objetividad es un deseo natural y legítimo, lamentablemente resulta inalcanzable en estado puro. La estadística no puede resolver este conflicto, pues todo proceso inferencial, incluso cuando se lleva adelante con su concurso, tendrá siempre un componente subjetivo. Si bien las técnicas estadísticas suelen ser muy útiles, ocasionalmente pueden defraudar al usuario. En efecto, pueden despertar expectativas que a la postre no se cumplan, especialmente cuando el investigador renuncia a examinar la realidad a través de un pensamiento integral y deja todo en manos del veredicto formal de los procedimientos estadísticos. Los argumentos aportados en este sentido por Berger y Berry [1], si bien tienen cierta complejidad, son sumamente persuasivos.

Los trabajos desarrollados por Fisher en los años 20 y por los matemáticos Neyman y Pearson en la década del 30, dieron lugar a un método actualmente conocido como prueba de significación, que responde al llamado “paradigma frecuentista”. Dicho método engloba un índice para medir la fuerza de la evidencia, el llamado valor p, y un procedimiento de elección entre hipótesis, llamado prueba de hipótesis (PH). Sin embargo, la metodología de las pruebas de hipótesis vive en la actualidad, según algunos especialistas [2][3][4], una crisis de considerable entidad. Desde esa perspectiva, por tanto, resulta atractiva la idea de manejar un nuevo paradigma o de corregir el actual. En este sentido, el enfoque bayesiano se perfila como una alternativa altamente promisoria. Las críticas más reiteradas a la inferencia clásica, dominante en el siglo XX, se basan en que obliga a una decisión dicotómica y en que sus resultados dependen crucialmente de un elemento exógeno a los datos: el tamaño de muestra. A un efecto pequeño observado en un estudio con un tamaño de muestra grande puede corresponder el mismo valor p que a un gran efecto registrado a través de una muestra pequeña. Por otra parte, basta que haya una diferencia mínima, intrascendente (o el más mínimo sesgo), para que dicha diferencia pueda ser declarada estadísticamente significativa, siempre que haya recursos como para tomar una muestra suficientemente grande. Esta problemática se discute e ilustra más adelante.

En la investigación médico-social el componente subjetivo es ineludible, y completamente natural. Se supone que, al aplicar cierto procedimiento estadístico a un conjunto de datos, lo que se procura es que el análisis gane en objetividad; es decir, que los puntos de vista del investigador no puedan modificar sustancialmente las conclusiones. Pero la verdad es que los métodos estadísticos convencionales están lejos de garantizar automáticamente tal desiderátum.

Es bien conocido que la forma de operacionalizar las variables, los puntos de corte que se eligen, el nivel de significación empleado, las escalas de medición adoptadas, las pruebas de significación seleccionadas, si éstas son paramétricas o no, si se aplican penalizaciones para las comparaciones múltiples, son solo algunos ejemplos de la larga lista de instrumentos estadísticos que irremediablemente han de elegirse según un punto de vista que varía entre investigadores. Sin embargo, donde tal carencia de normas uniformes es más acusada es en el punto culminante del proceso: a la hora de realizar inferencias una vez examinados los resultados[5]. Epidat 4: Ayuda de análisis bayesiano http://dxsp.sergas.es soporte.epidat@sergas.es

Un ejemplo inicial

En Benavides y Silva[6] se desarrolla un ejemplo que contribuye a exponer más claramente el modus operandi de la técnica clásica. Se bosqueja a continuación, y se retoma más adelante para ilustrar el enfoque bayesiano. Supóngase que hay motivos teóricos e indicios empíricos nacidos del trabajo de enfermería que sugieren que los pacientes afectados por quemaduras se recuperan más rápidamente cuando el tratamiento combina cierta crema antiséptica con un apósito hidrocoloide que cuando solo se utiliza la crema antiséptica. Se diseña, entonces, un experimento con la esperanza de rechazar la hipótesis nula (H0) que afirma que el tratamiento simple es tan efectivo como el combinado. Imagínese que se tienen 80 pacientes; aleatoriamente se eligen 40 de ellos para ser atendidos con el tratamiento experimental (combinación de crema antiséptica y apósito hidrocoloide) en tanto que a los 40 restantes se les aplica el tratamiento convencional (crema únicamente). Una vez obtenidos los datos (porcentajes de recuperación en el grupo experimental y en el control, pe y pc respectivamente, y su diferencia, d0=pe-pc), se calcula la probabilidad asociada a ese resultado bajo el supuesto de que se cumple H0. Supóngase que el 75% (pe=0,75) de los pacientes a los cuales se les aplicó el tratamiento experimental mejora apreciablemente a los 5 días, mientras que para los pacientes tratados de manera convencional, esta tasa de recuperación fue del 60% (pc=0,60). La Tabla 1 recoge la información relevante de este ejemplo.

Tabla 1. Distribución de una muestra de 80 pacientes según tratamiento asignado y según se recuperan o no.

Se recuperan

Tratamiento Sí No Total

Experimental 30 10 40

Convencional 24 16 40

Total 54 26 80

Según la práctica regular, ahora procede aplicar una prueba estadística; la más usada para valorar la diferencia de porcentajes es la prueba ji-cuadrado. Es fácil constatar que 2(obs)=2,05 y que el correspondiente valor p es igual a 0,15. Puesto que dicho valor no es suficientemente pequeño como para considerar que “hay significación” a ninguno de los niveles habituales (0,05 y 0,01 e, incluso, 0,10) y a pesar de que esta diferencia objetivamente observada es notable, según la práctica al uso, el investigador tiene que concluir (aunque casi con seguridad, y con razón, a regañadientes) que no tiene suficiente evidencia muestral como para afirmar que el tratamiento con crema y apósito sea más efectivo que el tratamiento con crema solamente. Es decir, debe actuar como si no tuviera información adicional alguna para pronunciarse. Con este método, las decisiones se adoptan sin considerar la información externa a las observaciones o al experimento; de ahí que una de las objeciones más connotadas que se hace al método es que no toma en cuenta de manera formal en el modelo de análisis la información anterior a los datos, proveniente de estudios previos o de la experiencia empírica, informalmente acumulada, que siempre se tiene sobre el problema que se examina.

Para ilustrar este asunto, supóngase que el estudio se realizó con n=400 pacientes y arrojó los resultados de la Tabla 2. Epidat 4: Ayuda de análisis bayesiano http://dxsp.sergas.es soporte.epidat@sergas.es

Tabla 2. Distribución de una muestra de 400 pacientes según tratamiento aplicado y según se recuperan o no. Se recuperan Tratamiento Sí No Total Experimental 103 97 200 Convencional 120 80 200 Total 223 177 400 Las estimaciones son pe=0,52 y pc=0,60. Como se ve, los resultados están en clara colisión con las expectativas del investigador. A juzgar por estas tasas, habría que pensar en principio que el apósito podría ser dañino. Al realizar la prueba de hipótesis formal se obtienen 2(obs)=2,93 y p=0,09. En este caso, si el investigador usara umbrales fijos, no podría rechazar la hipótesis H0 al nivel más socorrido (=0,05) pero sí al nivel =0,1. Si acude al recurso más usual (consignar el valor exacto de p), debería declarar algo como lo siguiente: “las tasas observadas difieren significativamente (p=0,09)”. En cualquier variante, el rechazo de la hipótesis de igualdad entre tratamientos debería ser a favor de que el que utiliza solamente crema es más efectivo que el que incluye el apósito.

Esta conclusión, sin embargo, contradice los conocimientos previos, la expectativa racional y la experiencia del investigador, todo lo cual lo colocaría probablemente en un conflicto: ¿matiza verbalmente el resultado hasta hacerle perder de hecho todo valor? ¿se escuda en que no se llegó al umbral mágico de 0,05 y dice simplemente que la diferencia no es significativa? ¿se abstiene de comunicar los resultados y actúa como si no se hubieran producido? A juicio de los críticos del frecuentismo, cualquiera de estas tres variantes sería inconsistente con la “obligación metodológica” que contrajo el investigador al elegir las PH como medio valorativo del procedimiento terapéutico en estudio.

Adviértase que, típicamente, el clínico admite con naturalidad que tiene un criterio a priori

sobre un paciente; realiza exámenes complementarios y actualiza su visión inicial sobre el diagnóstico que corresponde a ese paciente al conjugar las dos cosas (visión inicial e información complementaria) en lo que constituye un proceso de inducción integral. Parece bastante natural la aspiración de que un investigador se conduzca de manera similar; esa es exactamente la forma en que opera la lógica bayesiana.

El pensamiento bayesiano tiene más similitud que el frecuentista con el tipo de situaciones en que se ve el científico habitualmente: lo que tiene son datos (pacientes con ciertos rasgos, medias muestrales, series de datos) y lo que quiere es descubrir qué circunstancias determinaron que los datos fueran esos y no otros (es decir, quiere hacer juicios acerca de las leyes que gobiernan el proceso que produjo los datos que observa). La diferencia esencial entre el pensamiento clásico y el bayesiano radica en que aquel se pronuncia sobre los datos a partir de supuestos; este sobre los supuestos partiendo de los datos.

La necesidad de un enfoque alternativo puede ser fácilmente comprendida: resulta natural que se aspire a contar con un procedimiento inferencial libre de las serias impugnaciones que se hacen a las pruebas de significación.

Para conjurar la orfandad en que quedaría el investigador tras el abandono de las PH, se manejan varias alternativas. Una de ellas, sin duda la más sencilla de todas, es simplemente no usar la prueba de hipótesis y circunscribirse a la construcción de intervalos de confianza (IC). De manera informal, un intervalo de confianza para un parámetro P se define como una pareja de números P1ˆ y P2ˆ entre los cuales se puede “estar confiado” que se halla el Epidat 4: Ayuda de análisis bayesiano http://dxsp.sergas.es soporte.epidat@sergas.es parámetro en cuestión. Si bien los IC se inscriben en la órbita de la misma vertiente frecuentista que las pruebas de hipótesis, se apartan de la interpretación automática de los valores p y constituyen un recurso para aquilatar, justamente, el grado en que el conocimiento de la verdadera diferencia es adecuado. Una ventaja obvia de los intervalos de confianza, sin embargo, es que los resultados se expresan en las mismas unidades en las cuales se hizo la medición y, por tanto, permiten al lector considerar críticamente la relevancia clínica de los resultados.

La otra alternativa es la que se maneja en el presente módulo. Según se fundamenta detalladamente por Silva [7], se trata de una aproximación metodológica exenta de casi todas las críticas que se le hacen a las pruebas de significación y que goza del atractivo de incorporar las evidencias aportadas por experiencias previas dentro del proceso analítico y las contempla, por ende, en las conclusiones. Aunque las bases de este enfoque datan de hace más de dos siglos, solo recientemente se asiste a un uso apreciable del mismo en la investigación biomédica. Una de las razones que explican tal realidad y que a la vez augura un cada vez más prominente futuro, es que algunos de los problemas de cierta complejidad que posee este método exigen el uso de recursos computacionales accesibles sólo muy recientemente para el común de los investigadores. Epidat 4.0 ofrece, precisamente, la solución a algunos problemas con el enfoque bayesiano.

TOMA DE DECISIONES

domingo, 27 de octubre de 2013

ANÁLISIS DEL ENFOQUE BAYESIANO

1 comentario: