Análisis
del enfoque Bayesiano
Conceptos generales
A
principios del siglo XX, la ausencia de una herramienta que aquilatara
cuantitativamente el significado de los hallazgos produjo que las anécdotas
clínicas poblaran las revistas médicas. Se hacía necesario, por tanto, usar
procedimientos que cuantificaran la evidencia y complementaran los
razonamientos verbales, de modo que los protegiera de la subjetividad.
La
estadística devino así en un recurso extremadamente útil para los editores de
revistas y responsables administrativos. Sin embargo, lo cierto es que, aunque
la objetividad es un deseo natural y legítimo, lamentablemente resulta
inalcanzable en estado puro. La estadística no puede resolver este conflicto,
pues todo proceso inferencial, incluso cuando se lleva adelante con su concurso,
tendrá siempre un componente subjetivo. Si bien las técnicas estadísticas
suelen ser muy útiles, ocasionalmente pueden defraudar al usuario. En efecto,
pueden despertar expectativas que a la postre no se cumplan, especialmente
cuando el investigador renuncia a examinar la realidad a través de un
pensamiento integral y deja todo en manos del veredicto formal de los
procedimientos estadísticos. Los argumentos aportados en este sentido por
Berger y Berry [1], si bien tienen cierta complejidad, son sumamente
persuasivos.
Los
trabajos desarrollados por Fisher en los años 20 y por los matemáticos Neyman y
Pearson en la década del 30, dieron lugar a un método actualmente conocido como
prueba de significación, que responde al llamado “paradigma frecuentista”.
Dicho método engloba un índice para medir la fuerza de la evidencia, el llamado
valor p, y un procedimiento de elección entre hipótesis, llamado prueba de
hipótesis (PH). Sin embargo, la metodología de las pruebas de hipótesis vive en
la actualidad, según algunos especialistas [2][3][4], una crisis de
considerable entidad. Desde esa perspectiva, por tanto, resulta atractiva la
idea de manejar un nuevo paradigma o de corregir el actual. En este sentido, el
enfoque bayesiano se perfila como una alternativa altamente promisoria. Las
críticas más reiteradas a la inferencia clásica, dominante en el siglo XX, se
basan en que obliga a una decisión dicotómica y en que sus resultados dependen
crucialmente de un elemento exógeno a los datos: el tamaño de muestra. A un
efecto pequeño observado en un estudio con un tamaño de muestra grande puede
corresponder el mismo valor p que a un gran efecto registrado a través de una
muestra pequeña. Por otra parte, basta que haya una diferencia mínima,
intrascendente (o el más mínimo sesgo), para que dicha diferencia pueda ser
declarada estadísticamente significativa, siempre que haya recursos como para
tomar una muestra suficientemente grande. Esta problemática se discute e
ilustra más adelante.
En
la investigación médico-social el componente subjetivo es ineludible, y
completamente natural. Se supone que, al aplicar cierto procedimiento
estadístico a un conjunto de datos, lo que se procura es que el análisis gane
en objetividad; es decir, que los puntos de vista del investigador no puedan
modificar sustancialmente las conclusiones. Pero la verdad es que los métodos
estadísticos convencionales están lejos de garantizar automáticamente tal
desiderátum.
Es
bien conocido que la forma de operacionalizar las variables, los puntos de corte
que se eligen, el nivel de significación empleado, las escalas de medición
adoptadas, las pruebas de significación seleccionadas, si éstas son
paramétricas o no, si se aplican penalizaciones para las comparaciones
múltiples, son solo algunos ejemplos de la larga lista de instrumentos
estadísticos que irremediablemente han de elegirse según un punto de vista que
varía entre investigadores. Sin embargo, donde tal carencia de normas uniformes
es más acusada es en el punto culminante del proceso: a la hora de realizar
inferencias una vez examinados los resultados[5]. Epidat 4: Ayuda de análisis
bayesiano http://dxsp.sergas.es
soporte.epidat@sergas.es
Un ejemplo inicial
En
Benavides y Silva[6] se desarrolla un ejemplo que contribuye a exponer más claramente
el modus operandi de la técnica clásica. Se bosqueja a continuación, y se
retoma más adelante para ilustrar el enfoque bayesiano. Supóngase que hay
motivos teóricos e indicios empíricos nacidos del trabajo de enfermería que
sugieren que los pacientes afectados por quemaduras se recuperan más
rápidamente cuando el tratamiento combina cierta crema antiséptica con un
apósito hidrocoloide que cuando solo se utiliza la crema antiséptica. Se
diseña, entonces, un experimento con la esperanza de rechazar la hipótesis nula
(H0) que afirma que el tratamiento simple es tan efectivo como el combinado.
Imagínese que se tienen 80 pacientes; aleatoriamente se eligen 40 de ellos para
ser atendidos con el tratamiento experimental (combinación de crema antiséptica
y apósito hidrocoloide) en tanto que a los 40 restantes se les aplica el
tratamiento convencional (crema únicamente). Una vez obtenidos los datos
(porcentajes de recuperación en el grupo experimental y en el control, pe y pc
respectivamente, y su diferencia, d0=pe-pc), se calcula la probabilidad
asociada a ese resultado bajo el supuesto de que se cumple H0. Supóngase que el
75% (pe=0,75) de los pacientes a los cuales se les aplicó el tratamiento
experimental mejora apreciablemente a los 5 días, mientras que para los
pacientes tratados de manera convencional, esta tasa de recuperación fue del
60% (pc=0,60). La Tabla 1 recoge la información relevante de este ejemplo.
Tabla
1. Distribución de una muestra de 80 pacientes según tratamiento asignado y
según se recuperan
o no.
Se recuperan
Tratamiento
Sí No Total
Experimental
30 10 40
Convencional
24 16 40
Total
54 26 80
Según
la práctica regular, ahora procede aplicar una prueba estadística; la más usada
para valorar la diferencia de porcentajes es la prueba ji-cuadrado. Es fácil
constatar que 2(obs)=2,05 y que el correspondiente valor p es igual a 0,15.
Puesto que dicho valor no es suficientemente pequeño como para considerar que
“hay significación” a ninguno de los niveles habituales (0,05 y 0,01 e, incluso,
0,10) y a pesar de que esta diferencia objetivamente observada es notable,
según la práctica al uso, el investigador tiene que concluir (aunque casi con
seguridad, y con razón, a regañadientes) que no tiene suficiente evidencia
muestral como para afirmar que el tratamiento con crema y apósito sea más
efectivo que el tratamiento con crema solamente. Es decir, debe actuar como si
no tuviera información adicional alguna para pronunciarse. Con este método, las
decisiones se adoptan sin considerar la información externa a las observaciones
o al experimento; de ahí que una de las objeciones más connotadas que se hace
al método es que no toma en cuenta de manera formal en el modelo de análisis la
información anterior a los datos, proveniente de estudios previos o de la
experiencia empírica, informalmente acumulada, que siempre se tiene sobre el
problema que se examina.
Para
ilustrar este asunto, supóngase que el estudio se realizó con n=400 pacientes y
arrojó los resultados de la Tabla 2.
Epidat 4: Ayuda de análisis bayesiano
http://dxsp.sergas.es soporte.epidat@sergas.es
Tabla
2. Distribución de una muestra de 400 pacientes según tratamiento aplicado y
según se recuperan o no. Se recuperan
Tratamiento Sí No Total Experimental 103 97 200 Convencional 120 80 200 Total
223 177 400 Las estimaciones son pe=0,52
y pc=0,60. Como se ve, los resultados están en clara colisión con las
expectativas del investigador. A juzgar por estas tasas, habría que pensar en
principio que el apósito podría ser dañino. Al realizar la prueba de hipótesis
formal se obtienen 2(obs)=2,93 y p=0,09. En este caso, si el investigador
usara umbrales fijos, no podría rechazar la hipótesis H0 al nivel más socorrido
(=0,05) pero sí al nivel =0,1. Si acude al recurso más usual (consignar el
valor exacto de p), debería declarar algo como lo siguiente: “las tasas
observadas difieren significativamente (p=0,09)”. En cualquier variante, el
rechazo de la hipótesis de igualdad entre tratamientos debería ser a favor de
que el que utiliza solamente crema es más efectivo que el que incluye el
apósito.
Esta
conclusión, sin embargo, contradice los conocimientos previos, la expectativa
racional y la experiencia del investigador, todo lo cual lo colocaría
probablemente en un conflicto: ¿matiza verbalmente el resultado hasta hacerle
perder de hecho todo valor? ¿se escuda en que no se llegó al umbral mágico de
0,05 y dice simplemente que la diferencia no es significativa? ¿se abstiene de
comunicar los resultados y actúa como si no se hubieran producido? A juicio de
los críticos del frecuentismo, cualquiera de estas tres variantes sería
inconsistente con la “obligación metodológica” que contrajo el investigador al
elegir las PH como medio valorativo del procedimiento terapéutico en estudio.
Adviértase
que, típicamente, el clínico admite con naturalidad que tiene un criterio a
priori
sobre
un paciente; realiza exámenes complementarios y actualiza su visión inicial
sobre el diagnóstico que corresponde a ese paciente al conjugar las dos cosas
(visión inicial e información complementaria) en lo que constituye un proceso
de inducción integral. Parece bastante natural la aspiración de que un
investigador se conduzca de manera similar; esa es exactamente la forma en que
opera la lógica bayesiana.
El
pensamiento bayesiano tiene más similitud que el frecuentista con el tipo de
situaciones en que se ve el científico habitualmente: lo que tiene son datos
(pacientes con ciertos rasgos, medias muestrales, series de datos) y lo que
quiere es descubrir qué circunstancias determinaron que los datos fueran esos y
no otros (es decir, quiere hacer juicios acerca de las leyes que gobiernan el
proceso que produjo los datos que observa). La diferencia esencial entre el
pensamiento clásico y el bayesiano radica en que aquel se pronuncia sobre los
datos a partir de supuestos; este sobre los supuestos partiendo de los datos.
La
necesidad de un enfoque alternativo puede ser fácilmente comprendida: resulta
natural que se aspire a contar con un procedimiento inferencial libre de las
serias impugnaciones que se hacen a las pruebas de significación.
Para
conjurar la orfandad en que quedaría el investigador tras el abandono de las
PH, se manejan varias alternativas. Una de ellas, sin duda la más sencilla de
todas, es simplemente no usar la prueba de hipótesis y circunscribirse a la
construcción de intervalos de confianza (IC). De manera informal, un intervalo
de confianza para un parámetro P se define como una pareja de números P1ˆ y P2ˆ
entre los cuales se puede “estar confiado” que se halla el Epidat 4: Ayuda de
análisis bayesiano http://dxsp.sergas.es
soporte.epidat@sergas.es parámetro en
cuestión. Si bien los IC se inscriben en la órbita de la misma vertiente
frecuentista que las pruebas de hipótesis, se apartan de la interpretación automática
de los valores p y constituyen un recurso para aquilatar, justamente, el grado
en que el conocimiento de la verdadera diferencia es adecuado. Una ventaja
obvia de los intervalos de confianza, sin embargo, es que los resultados se
expresan en las mismas unidades en las cuales se hizo la medición y, por tanto,
permiten al lector considerar críticamente la relevancia clínica de los
resultados.
La
otra alternativa es la que se maneja en el presente módulo. Según se fundamenta
detalladamente por Silva [7], se trata de una aproximación metodológica exenta
de casi todas las críticas que se le hacen a las pruebas de significación y que
goza del atractivo de incorporar las evidencias aportadas por experiencias
previas dentro del proceso analítico y las contempla, por ende, en las
conclusiones. Aunque las bases de este enfoque datan de hace más de dos siglos,
solo recientemente se asiste a un uso apreciable del mismo en la investigación
biomédica. Una de las razones que explican tal realidad y que a la vez augura
un cada vez más prominente futuro, es que algunos de los problemas de cierta
complejidad que posee este método exigen el uso de recursos computacionales
accesibles sólo muy recientemente para el común de los investigadores. Epidat
4.0 ofrece, precisamente, la solución a algunos problemas con el enfoque
bayesiano.
Muchas gracias por la explicación, me servirá para mi clase saludos y felicidades por saber escribir bien y explicar
ResponderEliminar