[Index FAC] [Index CCVC]
Bioingeniería e Informática Médica/Bioengineering- Medical Informatics
Curso: Bioestadística básica para médicos asistenciales

Clase Nº 12: Pruebas para evaluar Evolución

Raúl E. Ortego, Carlos R. Secotaro


Index curso - Clase anterior

 

Proponemos al lector que imagine observar una película en la cual los protagonistas son grupos de cientos o miles de personas. Nos parece que lo más parecido a los estudios evolutivos son las películas "de guerra"; los casos individuales son anecdóticos. En todos los grupos participantes hay testimonios de casos similares; no es la calidad de los fenómenos lo que marca la diferencia.
Las pruebas estadísticas que discutiremos a continuación, son algunas de las maneras con que los expertos realizan comparaciones cuantitativas de sucesos específicos en lapsos predeterminados de observación en grupos humanos.
Estos análisis cuantitativos son quizás la diferencia esencial entre la oferta terapéutica de la medicina "tradicional" y de la medicina "alternativa" para diversas afecciones.
La primera se apoya en la evaluación matemática comparada de algunos eventos prefijados, habitualmente dicotómicos (sí / no), que acontecen en un tiempo y en un conjunto de individuos determinado . Con las conclusiones se propone la conducta médica a pacientes individuales que padezcan la afección estudiada.
Se aconseja al paciente en base a las evidencias (probabilidades calculadas, no certezas) obtenidas comparando cuantitativamente "muestras", en las cuales se presume, que el paciente en cuestión no fue incluido solamente por casualidad.
La medicina "basada en la evidencia" supone la aceptación lisa y llana del "principio de incertidumbre", por lo tanto es imposible predecir el comportamiento individual ("la suerte"). La falta de comprensión del principio por ambas partes (terapeutas y pacientes), conlleva vivenciar como "fracaso" la evolución indeseada. Quizás, algunos litigios por "mala praxis" no sucederían evitando expectativas desmesuradas.
El otro tipo de medicina aconseja al paciente afectado que trate de reproducir alguna(s) circunstancia(s) observada(s) en evoluciones definidas genéricamente como "favorables" pero … no comparadas! . Los que a ella acuden "ya tienen el no … van por el sí", asumen la evolución "desfavorable" como inexorable, por ello es que no se suele registrar como "fracaso" sino como "mala suerte" la ausencia de la respuesta pretendida. No deja de parecernos interesante que a este tipo de oferta terapéutica se la aconseja denostando "conclusiones estadísticas" por genéricas y "no personalizadas", pero se la evalúa naturalmente con el principio de incertidumbre in mente .

 

Confusiones por Heterogeneidad

El ingreso de pacientes a un estudio de evolución a largo plazo es progresivo; mientras se completa el número de pacientes pretendido (tamaño de la muestra) ya suceden eventos registrables. También sucede que la cantidad de pacientes varía a lo largo del período de registro de eventos por diversas causas ajenas a la investigación.
Estas circunstancias son fuente de "confusión" ya que:

  1. La observación temporal es heterogénea : no sólo por serlo el ingreso; algunos egresan por motivos ajenos al estudio y en momentos imprevistos, aleatorios.
  2. El número de pacientes es heterogéneo : consecuencia directa de lo expuesto.
  3. La ocurrencia de los eventos es naturalmente heterogénea : aún para sucesos "duros" y comunes como la muerte, el evento no les sucederá a todos los participantes en un lapso prefijado y heterogéneo como vimos, de observación.
  4. La causa de los eventos suele ser heterogénea : puede obedecer a mecanismos absolutamente diferentes a las variables consideradas. Por ejemplo: En estudio de control de mortalidad post operatoria suceden eventos acaecidos por epidemias o diversas catástrofes individuales o generales.

 

Análisis de Supervivencia : Método de Kaplan – Meier

El método al cual nos referiremos es aplicable a observaciones temporales en la cual el sujeto afectado por el evento de interés, abandona "para siempre" al conjunto original, a "la población expuesta". No es necesario que el suceso sea mortal; podría ser que el participante reciba un tratamiento quirúrgico, o necesite un fármaco, etc.
Aunque el evento fuese transitorio y/o indeleble, el receptor ya no pertenece a la población original que "nunca" había recibido o le había pasado tal cosa en el lapso y en las condiciones preestablecidas de observación. El lector ya puede percibir como influye en la interpretación de los resultados del conjunto las heterogeneidades descriptas.
Una película se "anima" al exponer a cierta velocidad fotografías secuenciales.
Algunos expertos propusieron atenuar la heterogeneidad temporal "inmovilizando" al conjunto en el instante de cada evento (fotografías) para "observarlas" secuencialmente.
Las filmaciones en "blanco y negro" tenían fotos instantáneas que no podrían competir con las actuales, sin embargo, la secuencia permitía apreciar guión e interpretaciones.
El método de Kaplan – Meier procura una actualización instantánea de la proporción residual, de la proporción de participantes "no afectados" ; por ello, cuando el evento es la muerte, el porcentaje remanente expresa la supervivencia.
Comenzaremos por ver la ecuación de actualización que propone el método:

S = Supervivencia
Ri =
Pacientes expuestos en el instante i
Ei =
Número de eventos en el instantes i  

Observe a continuación el resultado al aplicarla cuando sucede el primer evento (Sp=1) en una población expuesta al momento del suceso de 1000 personas. Luego, al cabo de un tiempo, al procesar otro evento con una Supervivencia Previa del 50% (Sp=0,5) siendo la población expuesta en ese momento ¿¡ también !? de 1000 personas.
Repetir el número de personas expuestas en diferentes instantes del estudio evolutivo es una manera de poner en evidencia las consecuencias de la heterogeneidad referida y el modo de obviarla: en cada instante importa el número efectivamente expuesto.
Esta heterogeneidad implica que una línea que recorra la tasa de supervivencia no es paralela con una línea que recorra el número de personas expuestas.

La supervivencia instantánea (Sa) cuando ocurre el primer evento es 99%; el evento con supervivencia previa de 50% , la modifica a 49% ( Sa o supervivencia instantánea).
Esta descripción de los acontecimientos, se manifiesta gráficamente en descensos "escalonados" ya que ocurren períodos variables sin modificaciones (sin eventos).


El método permite estimar un Error Standard (ES) con razonamientos comunes a las distribuciones binomiales. Con el ES se puede establecer una "banda" o rango de supervivencia con un valor superior y uno inferior que correspondan a un IC 95.

 

Evolución Observada vs Evolución Esperada

Las Tablas de Contingencias permiten aplicar el test de 2 (Chi cuadrado)
La siguiente Tabla muestra como sería el registro de mortalidad y supervivencia durante un lapso determinado, de pacientes con una afección específica que han recibido o no (Grupo Control) para la misma un Tratamiento Quirúrgico.

Para las generalizaciones usaremos la siguiente nomenclatura

n: el número total de pacientes.
nm: los muertos
nv: los vivos
n.q: los operados
n.c: los no operados o "controles"


La ecuación de la distribución 2 calcula la diferencia entre lo hallado en cada casillero ( nij ) con lo esperado si el fenómeno fuese azaroso ( eij) ; esta diferencia se relaciona con lo esperado ( eij) para expresar cuantas veces "cabe" ese valor en la diferencia hallada.
En el ejemplo de la mortalidad con tratamiento quirúrgico vs tratamiento médico (control) el valor esperado eijse calcula como vimos en la ecuación 2para cada casillero.


Chi Cuadrado (2) de Pearson

Es la misma prueba estadística X2 de los párrafos previos y de capítulos previos compararando dos proporciones; dónde se verifica, además, que X2=Z2. Recordemos:
También se puede analizar con 2 una diferencia de dos proporciones.
Se estudia la aparición de un suceso x; en una muestra n1 sucede x1 y en una muestra n2 sucede x2. Las proporciones son x1/ n1 y x2 / n2 ; aunque al lector común le cueste creerlo, el experto trabajando con los términos de la misma ecuación 2 calcula que:


Actualmente se calcula 2 llenando los casilleros correspondientes en un software, ya que n1 podría ser el grupo operado; n2 el grupo control y así sucesivamente.
El recorrido "largo" precedente para llegar al 2 de Pearson no ha tenido otra intención que tomar conciencia junto a nuestros lectores de que el tratamiento matemático continúa siendo comparar lo esperado con lo sucedido ( observado).
En las ecuaciones del proceso "largo" se comprende que si lo "observado" y lo "esperado" es similar, la diferencia entre ambos se aproxima a 0 (cero) y 2 también se aproxima a 0 (cero) con lo cual se aceptará la hipótesis nula.
La ecuación compleja con proceso "sencillo", sólo se completan casilleros ( nn y xn), es la misma ; sólo que nos parece más difícil percibir en esta presentación matemática la esencia de la comparación estadística intrínseca de 2.
Por supuesto que las comparaciones pueden ser sobre los muertos, para analizar mortalidad , o con los casilleros de los vivos para analizar supervivencia.

 

Observado vs Esperado por Períodos de Control o "Estratos"

El procedimiento explicado para 2 puede hacerse por etapas o períodos de observación, por ejemplo anuales, hasta completar el lapso programado ( 5, 10 , n años).
En cada ciclo, período o etapa o "estrato" cambia el tamaño de las muestras. Hay que descontar lo que ya pasó. En la tabla de contingencia del ejemplo, el primer año comenzó con 120 pacientes en el grupo Quirúrgico y 120 en el grupo Control; el segundo año comenzará descontando los muertos acaecidos; en esa Tabla: 25 y 15 respectivamente.

 

Otros factores de confusión en observación secuencial

Es emblemática la llamada "Paradoja" de Simpson. Es el caso que una variable ignorada o no considerada (muestras erróneamente interpretadas como independientes) establece en la prueba X2 de Pearson una asociación espuria, inexistente, entre las variables consideradas; en otros términos, una asociación "Positiva Falsa". También puede suceder exactamente lo contrario, que la variable "escondida" desdibuja una asociación existente ("Negativa Falsa").
En un análisis por estratos puede suceder que se pierda la independencia entre los datos; en otras palabras: el dato previo influye sobre el dato posterior. La muestra analizada en cada período (en el "estrato" n ) tiene valores dependientes del período (estrato) previo, pasan a ser datos "apareados" . Sin saberlo, se pierde independencia de las muestras y no se traslada esta circunstancia al tratamiento estadístico.
La estratificación que procura salvar motivos de confusión "per se" puede confundir la interpretación (paradoja de Simpson).
Las pruebas que mencionaremos a continuación proponemos retenerlas como modalidades de 2 para comparar evoluciones de manera secuencial programada y con las cuales se procura "salvar", por lo menos atenuar errores o confusiones.
Previamente nos pareció oportuno recordar algunos conceptos de álgebra elemental.

 

Recordemos Matemática

Con la confianza en que nadie se ofenda recordaremos que: "logaritmo en base a de un número b es un número c tal que a elevado a la c es igual a b".

Los logaritmos más comunes son los logaritmos "decimales" (base=10) y los logaritmos "naturales" con base en un número simbolizado como "e". En los logaritmos decimales se omite la base, se da por supuesta: Log 100=2 porque 102=100.
La transformación logarítmica tiene efectos muy interesantes en los gráficos de funciones en coordenadas cartesianas. Veamos un ejemplo de ello:

 

A lectores con fuerte rechazo a las ecuaciones, les proponemos observar en el gráfico de la izquierda la línea punteada roja, que expresa como "decae" la magnitud "y" cuando aumenta el valor de "x". A la derecha, el mismo fenómeno, expresado con logaritmos.
La aplicación de logaritmos transformó una ecuación exponencial en una ecuación de primer grado (exponente=1) con el consiguiente cambio gráfico: se obtuvo una recta , en este caso con pendiente = log 0,2.
Es comprensible que los expertos aprovechen estas propiedades para sus comparaciones estadísticas. Imagine el lector que "100000" podría ser una población; 20% ("0,2") una Tasa Libre de Eventos, supervivencia por ejemplo, pero también podría ser un OR o un RR; "x" el tiempo en la unidad que desee, y finalmente "y" el resultado del tiempo en las variaciones de esa población expuesta a lo que exprese "0.2".
Las ecuaciones son la manera de "hablar" de gráficos sin dibujarlos.
Insistimos en nuestra sugerencia de procurar "pensar gráficamente". Sugerimos que observe nuevamente ambos gráficos previos. Quizás coincida en que no necesita realizar cálculos complejos, para comprender que es más sencillo comparar evoluciones, con ecuaciones lineales (rectas) que con otro tipo de ecuaciones.
Continuamos con algunas pruebas que "trabajan" al test de 2 para "salvar" confusiones.

 

LOG - RANK TEST (Pruebas de Rango Logarítmico)

2se obtiene por la sumatoria (å) de diferentes períodos o etapas o estratos. Se calcula en cada uno el 2 de Pearson, actualizando el tamaño de la muestra en la etapa o estrato, e incorporando lo acaecido durante la misma. Sumatoria de instantáneas.

El lector seguramente ya percibió que en cada período, para las comparaciones, se consideró el número de sucesos (Eventos +) referido al total expuesto en cada grupo; es decir que se ha trabajado con la prevalencia denominada Riesgo . Al relacionar un grupo con respecto al otro, se considera el Riesgo Relativo (RR).
Podría trabajarse con el modo Odds, en cada muestra la proporción a considerar sería Eventos (+) sobre Eventos (-) en lugar del total expuesto y al relacionar una muestra con la otra se obtendría el Odds Ratio (OR).
El RR (OR) se aproximará a 1 cuando lo acaecido en ambos grupos sea semejante; recordemos que si lo sucedido es similar a lo esperado, el número 2 también se aproxima a 0 (cero) y en consecuencia se acepta la hipótesis nula (son muestras de la misma población). El procedimiento investigado no marcó diferencias.
Queda por resolver si un RR ¹ 1 obtenido es casual (hipótesis nula) o corresponde a la comparación de muestras de poblaciones diferentes (hipótesis alternativa).
Una primer respuesta es el número 2 muy distinto de 0 ( cero ) que dará en las tablas correspondientes una p de hallazgo casual que decidirá cual hipótesis aceptar.
Es habitual expresar los resultados con el Intervalo de Confianza 95 para el RR (IC 95).
El RR ¹ 1 puede ser < 1 ó > 1 ; se aceptará la hipótesis nula ( diferencia casual ) si uno de los límites del IC95 es un RR "opuesto", es decir, si es 1 ó 1 respectivamente.
¿Y la transformación logarítmica? El Log Rank Test plantea algo semejante al ejemplo usado para recordar logaritmos.
En efecto, el log del OR (o del RR) es usado como la pendiente de la recta .
El IC 95 expresado con logaritmos será un par de rectas paralelas , cada OR una pendiente de recta, un OR "superior" y un OR "inferior" al OR original calculado.
La hipótesis nula afirma que en ambos grupos suceden los mismos eventos en la misma proporción, por lo tanto el OR es 1 (igual numerador y denominador).
El logaritmo de 1 es 0 (cero) ya que cualquier número elevado a la "cero" es 1.
La pendiente 0 (cero) significa que los eventos que suceden a lo largo del tiempo son semejantes en ambos grupos, ratifica que son muestras de una misma población.
La hipótesis alternativa plantea que el OR ¹ 1 es una constante porque relaciona dos constantes; afirma que los grupos son muestras de diferentes poblaciones y cada una de ellas tiene su propia tasa (constante) de ocurrencia de eventos.
La regresión logística procura "ver" si hay cambios en el OR a lo largo del tiemp
Si eso ocurre, una primer consideración es que hay factores que se introducen en los cálculos y "confunden" la interpretación. En términos sencillos, que quizás nos criticarán los expertos, dudar, por lo menos dudar, que un procedimiento realizado en un momento motivará "saltos" en la aparición de eventos a lo largo del tiempo.
Para nuestras humildes pretensiones de entender un poco mejor, asumamos que la esencia de las ideas es la misma, no son cambios conceptuales, sino cambios prácticos que permiten, por ejemplo, comparaciones lineales.

 

TEST DE MANTEL – HAENSZEL

Es un modo de procurar que el reconocimiento de la asociación dentro del período (estrato) se haga considerando, teniendo en cuenta, la dependencia que los datos adquieren examinando la muestra original según se va modificando por los sucesos a lo largo de los períodos (a través de los estratos). Trata de evitar la "paradoja de Simpson".
Un test con algo de historia: " Mantel N & Haenszel W . Statistical aspects of the analysis of data from retrospective studies of disease . J. Nat. Cancer Inst. 22:719-48, 1959"
En un artículo de 1981, Nathan Mantel a propósito de comentar que desde 1961 hasta esa fecha, su trabajo había sido citado 815 veces, relata como el investigador junior William Haenszel le presentó sus ideas para aplicar en comparaciones utilizando tablas de contingencia. Al decir del propio Mantel: " This paper was the conception of its junior author, William Haenszel, who had the practical familiarity with the problems of retrospective studies. My experience had been largely in the application of statistics and statistical thinking to laboratory investigations and Haenszel suggested that I augment his own work by any statistical concepts I thought appropriate. Those concepts were, in a way, simple and I was not satisfied to give them only as mathematical formulas. In the end, there was a blending of Haenszel's practical ideas with my own — Haenszel, in his generosity, suggested that the order of authorship be reversed."
Lo novedoso fue modificar un diseño para estudios retrospectivos y en general usado con muestras homogéneas, en uno que consolidase lo que otros expertos ya estaban intentando; es decir aplicarlo a estudios prospectivos, con heterogeneidades diversas.
La esencia del planteo es examinar el OR (RR) en cada estrato para cada grupo, con el clásico 2 : [(observado – esperado)2 dividido lo esperado] pero, sin terminar en ese punto el análisis, proseguir relacionando ese valor 2 calculado con información evolutiva obtenida como si las dos muestras fuesen una sola.
La información evolutiva es ni más ni menos que la Varianza.
En lugar de trabajar matemáticamente solo con las proporciones de los muertos, se pueden procesar las varianzas de las proporciones de los VIVOS en cada período, se trabaja entonces con Datos de Sobrevida o Supervivencia.
Veamos: pv es la proporción de vivos (sobrevida) pv1 = xv1 / n1 y pv2 = xv2 /n2
Para cada período la Varianza o Desvío Standard cuadrático será:

Luego se sumarán las Varianzas de todos los períodos: å V
La compleja fórmula que elaboraron Mantel y Haenszel (MH) podríamos recordarla para nuestras lecturas de trabajos científicos que implican evolución y para los diálogos con los expertos en estadística que nos asesoran, como la å de los 2 de los diversos estratos, relacionados con la å de las Varianzas calculadas en cada estrato:

La Hipótesis nula afirma que el OR (RR) es 1 (uno), que sucede en ambas muestras lo mismo a lo largo del tiempo; un 2 cercano a 0 (cero) sustentará la hipótesis nula.
Un OR (RR) ¹ 1 se expresará incorporando la "banda", el rango (usando logaritmos) del IC 95 de manera de darle significado según algún límite del OR sea o no ó de 1.

 

Index curso - Clase anterior

 

 

Tope

FORMULARIO DESACTIVADO A PARTIR DEL
1ero. de Diciembre de 2005

Preguntas, aportes y comentarios serán respondidos por el relator
o por expertos en el tema a través de la lista de Bioingeniería e Informática Médica
Llene los campos del formulario y oprima el botón "Enviar"


 

Dr. Diego Esandi
Co-Presidente
Comité Científico
Correo electrónico
Dra. Silvia Nanfara
Co-Presidente
Comité Científico
Correo electrónico
Prof. Dr. Armando Pacher
Presidente
Comité Técnico/Organizador
Correo electrónico

 

©1994-2005 CETIFAC - Bioingeniería UNER
Webmaster Actualización: 30-nov-05