Indice Anterior Siguiente
Rev Cubana Angiol y Cir Vasc 2001;2(2):117-22

Formato PDF

Instituto Nacional de Angiología y Cirugía Vascular

Temas de actualización

Diseño de ensayos de intervención comunitaria

Dr. Armando H. Seuc Jo1 y Dra. Emma Domínguez Alonso2

Resumen

En el marco de las actividades investigativas del Instituto Nacional de Angiología y Cirugía Vascular dirigidas a la promoción de salud y desarrollo en la comunidad del Cerro, se discuten en este trabajo algunas opciones de diseño para la aleatorización de unidades a los distintos grupos de estudio en ensayos de intervención comunitaria: el diseño totalmente aleatorizado, el estratificado y el pareado. Se ilustra el cálculo de los tamaños de muestra requeridos, para cuando las unidades de aleatorización son conglomerados de sujetos, por ejemplo viviendas, escuelas, centros de trabajo, hospitales, consultorios del médico de la familia, etc. Se pone de manifiesto la conveniencia de estimar la correlación de las unidades intraconglomerados con el propósito de hacer una estimación adecuada de los tamaños de muestra que se requieren para lograr una potencia satisfactoria, en los ensayos de intervención comunitaria.

DeCS: ENSAYOS CONTROLADOS ALEATORIOS/métodos; MUESTREO ESTRATIFICADO; EPIDEMIOLOGIA Y BIOESTADISTICA; DESARROLLO DE LA COMUNIDAD.

En los ensayos en general, en particular en los de intervenciones comunitarias, pueden utilizarse tres diseños básicos para la asignación de las unidades a los grupos de estudio:1

A diferencia de lo que ocurre en la mayoría de los ensayos clínicos, en las intervenciones comunitarias frecuentemente la unidad de aleatorización difiere de la unidad de análisis, en el sentido de que la unidad de aleatorización es un "conglomerado" de unidades de análisis.2 Por ejemplo, cuando en una intervención comunitaria se comparan dos programas para la reducción de la tasa de obesidad, las unidades que se aleatorizan a los programas pueden ser:3

En cada uno de estos casos las unidades que se aleatorizan son conglomerados de sujetos; estos son usualmente las unidades de análisis (sobre las cuales se medirá la eventual reducción de la obesidad, y a partir de esas mediciones se harán los cálculos correspondientes que permitirán decidir cuál de los programas es más eficaz). En la mayoría de las intervenciones comunitarias la asignación aleatoria de las unidades de análisis (casi siempre los sujetos) no tiene sentido práctico: no se concibe por ejemplo asignar a distintos programas para la reducción del sedentarismo (o a distintos programas para mejorar hábitos dietéticos) a miembros de una misma familia.

En el diseño totalmente aleatorio los conglomerados son asignados a los distintos grupos de intervención de manera totalmente aleatoria, sin que medie ningún tipo de pareo o estratificación de los conglomerados previo a su asignación aleatoria. Su aplicación se recomienda cuando el número de conglomerados en el ensayo es al menos moderado, y/o cuando no hay variables que puedan influir de manera importante en la eficacia de las intervenciones.

De estas dos condiciones, la primera es la más importante, pues si la muestra (de conglomerados) es grande la asignación totalmente aleatoria tenderá a lograr un balance entre los grupos de intervención para cualesquiera variables, en particular para aquellas que pueden influir en la eficacia de las intervenciones.

En el diseño pareado (suponiendo que son dos los programas que se comparan) se forman pares de conglomerados que son "similares" con respecto a variables que pueden influir en la eficacia de las intervenciones. En cada uno de estos pares se asigna al azar a uno de sus miembros para el grupo con el programa "experimental", mientras que el otro miembro queda para el grupo con el programa "control".4

En el diseño estratificado los conglomerados se agrupan en estratos según variables que pueden influir en la eficacia de las intervenciones;5 lo que se busca es que conglomerados en un mismo estrato sean "similares", mientras que conglomerados en estratos distintos sean "no similares". Dentro de cada estrato la asignación de los conglomerados a los grupos de intervención se hace de manera totalmente aleatoria.

El diseño pareado es un caso particular (o "refinamiento") del diseño estratificado en el que cada estrato tiene sólo dos conglomerados. Obsérvese también que la "mecánica" del diseño totalmente aleatorio se emplea tanto en el diseño pareado como en el estratificado; en el diseño pareado dentro de cada par, y en el estratificado dentro de cada estrato.

Tanto el diseño pareado como en el estratificado son generalmente efectivos a la hora de lograr balance entre los grupos de intervención. Es de esperar que el diseño pareado sea más efectivo que el estratificado, pues debe ser posible lograr mayor similitud entre los dos conglomerados de un par, que entre los (más de 2) conglomerados de un estrato; esto, no obstante, depende de cuán exitoso haya sido el proceso (con frecuencia engorroso) de pareo. Si no se ha pareado con respecto a variables que realmente influyen en la eficacia de las intervenciones, entonces el proceso de pareo conduce a una pérdida de eficiencia (como consecuencia de la reducción en los grados de libertad con respecto al diseño totalmente aleatorio).

En general el análisis debe corresponderse con el diseño, pero para los "pragmáticos" (entre los cuales nos incluímos) algún espacio siempre queda para "maniobrar". Teóricamente hablando, los tres diseños antes mencionados se ordenan por eficiencia (de menor a mayor) como sigue:

  1. totalmente aleatorio
  2. estratificado
  3. pareado

Una intervención comunitaria con un diseño estratificado o pareado puede, sin embargo, analizarse como uno con diseño totalmente aleatorio. Ignorar un diseño más eficiente a la hora del análisis no es necesariamente una idiotez; puede justificarse debido a dudas sobre la conveniencia de ese diseño o sobre la calidad con que fue ejecutado, a que se ha perdido la información sobre el pareo o la estratificación correspondiente, a que nos interesa ser (especialmente) conservadores, o a que no queremos complicarnos con el análisis más engorroso que requiere este.

Diseños totalmente aleatorios

Aspecto fundamental en el diseño de estos ensayos de intervención comunitaria es la determinación del tamaño de muestra, es decir, el número total de conglomerados que debe reclutarse para el estudio. Podemos distinguir 2 casos según el tipo de variables que mide la eficacia de las intervenciones: cuantitativa o cualitativa.

Si la variable es cuantitativa la eficacia "a nivel de conglomerado" podrá expresarse en términos de una media, y la comparación de la eficacia entre los k grupos de intervención deberá hacerse obteniendo para cada uno de estos grupos un índice que combine las medias de los conglomerados correspondientes (por ejemplo una media ponderada de las medias de los conglomerados) y comparando estos k índices entre sí. Si k=2 para ello deberá emplearse, por ejemplo, la prueba t-Student para muestras independientes con m 1 + m 2-2 grados de libertad, donde m1 y m 2 son los tamaños de muestra de conglomerados en los dos grupos de intervención que se comparan. Se ha comprobado que para esta situación, si los tamaños de los conglomerados no son muy variables y si los tamaños de las muestras de conglomerados de los 2 grupos que se comparan son similares, la prueba t-Student antes mencionada es perfectamente aplicable.

Es notable el hecho de que aún cuando la variable sea cualitativa, y por tanto los resultados se expresen en términos de proporciones, la prueba t-Student sigue siendo aplicable para comparar las proporciones de sujetos que cumplen determinada condición entre los 2 grupos de estudio en un ensayo de intervención comunitaria.

La determinación del tamaño de muestra para cualquiera de estos casos (datos cuantitativos o cualitativos) consiste entonces en la determinación del número de conglomerados a incluir en la muestra de cada grupo de intervención. Esto se hace prefijando la magnitud del efecto que se quiere detectar (d), el tamaño (promedio) aproximado de los conglomerados que se utilizarán (n), y una estimación del coeficiente de correlación intraconglomerado (p). La magnitud del efecto se define en términos de

d= (µ1-µ-2) / s

donde µ1 y µ2 son las medias (o proporciones) esperadas en los 2 grupos de intervención, y s es la desviación estándar (estimada) de las observaciones (que se supone común para ambos grupos). El coeficiente de correlación intraconglomerado p puede estimarse a partir de la expresión.6

p = (Sb2-Sw2 ) / (Sb2 + noSw2)

donde Sb2 = suma de cuadrados entre conglomerados en el ANOVA (análisis de varianzas)
Sw2 = suma de cuadrado intraconglomerados en el ANOVA
no = [l/(k-1)] (N - Sni2 / N).

El coeficiente de correlación intraconglomerado (o intraclase) p mide el grado de similitud de los sujetos dentro de los conglomerados con respecto a una variable de interés; por ejemplo, los hábitos dietéticos de los miembros de una familia es de esperar que sean similares. En la medida en que mayor sea p menos información aporta al estudio cada conglomerado, es decir, menos potencia (o menos precisión en las estimaciones) aporta al estudio la inclusión de cada conglomerado y por lo tanto mayor número de conglomerados será necesario incluir en la muestra para lograr una potencia (o precisión en las estimaciones) satisfactoria.7-9

En la tabla tomada10 aparecen las potencias que se obtienen para distintas combinaciones de d, p, n, y el número de conglomerados en la muestra de cada grupo (que se denota por m). Los valores de d y p utilizados son al parecer características de las intervenciones comunitarias, donde en general los efectos de las intervenciones son pequeños y la homogeneidad intraconglomerado es generalmente pequeña.

Tabla. Potencia del ensayo para distintos valores de n, d, p y m

 
p=0,005

m

p=0,01 m

n

d
3
6
9
12
3
6
9
12

100

0,20
0,34
0,72
0,90
0,97
0,27
0,60
0,81
0,91
 

0,50

0,96
1,0
1,0
1,0
0,89
1,0
1,0
1,0

300

0,20
0,53
0,93
0,99
1,0
0,37
0,77
0,93
0,98
 

0,50

1,0
1,0
1,0
1,0
0,97
1,0
1,0
1,0

500

0,20
0,60
0,96
1,0
1,0
0,40
0,81
0,95
0,99
 

0,50

1,0
1,0
1,0
1,0
0,98
1,0
1,0
1,0

n: tamaño aproximado de los conglomerados
d: tamaño del efecto esperado del programa experimental vs programa control
p: coeficiente de correlación intraconglomerado
m: número de conglomerado que se asigna a cada grupo de intervención

 

Un ejemplo

En una encuesta sobre aspectos biopsicológicos de la mujer en etapa climatérica11 se estudiaron a 800 mujeres entre 40 y 60 años de edad, de 11 consultorios médicos pertenecientes al Policlínico Plaza del Municipio Plaza, de Ciudad de La Habana. Los tamaños de los conglomerados (número de mujeres en cada uno de los 11 consultorios incluidos en el estudio) fueron: 54, 107, 45, 72, 86, 63, 83, 71, 20, 133 y 66. Como promedio el tamaño de los consultorios fue de 73.

Algunas de las variables que se estudiaron:

Los coeficientes de correlación intraconglomerado fueron 0,014, 0,017 y 0,014 respectivamente.

A la pregunta que se pretende dar respuesta es: ¿qué cantidad de consultorios haría falta incluir aleatorizadamente en cada uno de los grupos de estudio en una futura intervención comunitaria, que tuviera como propósito comparar dos programas para modificar alguna de las tres variables antes mencionadas? En la tabla se observa que para p=0,01 (correlación relativamente alta), d=0,20 (efecto relativamente pequeño), y n=100 (tamaño de conglomerados relativamente pequeños), se requiere asignar a cada programa de intervención al menos 9 consultorios para lograr una potencia de al menos 80 %.

Se concluye que la eventual diseminación de ensayos de intervención comunitaria en el ámbito nacional hace necesario el cálculo sistemático de los coeficientes de correlación intraconglomerado en aquellos estudios en los cuales esto sea posible, con el propósito de permitir una determinación "objetiva" de los tamaños de muestra requeridos para los ensayos de intervención comunitaria a realizarse en el futuro inmediato.

En el ejemplo utilizado en este trabajo, los coeficientes de correlación intraconglomerado estuvieron sistemáticamente alrededor de valores considerados como "altos" por la literatura internacional. Es posible que en nuestro medio, en particular para el conglomerado "consultorio del médico de la familia", este coeficiente tienda a ser mayor, razón por la cual debemos considerar el cálculo de una tabla para valores de p por encima de 0,01.

Summary

Within the framework of the research activities carried out by the National Institute of Angiology and Vascular Surgery to promote health and development in the community of Cerro, some design options, such as the totally randomized design, the stratified design and the matched design, are discussed in this paper for the randomization of units for the different study groups in community intervention trials. The calculation of the sizes of the samples required when the units of randomization are clusters of subjects as, for instance, houses, schools, working centers, hospitals, family physician's offices,etc., is illustrated. The convenience of estimating the intracluster correlation of the units in order to have an adequate estimate of the sizes of the sample necessary to obtain a satisfactory potency in the community intervention trials is explained.

Subject headings: RANDOMIZED CONTROLLED TRIALS/methods; STRATIFIED SAMPLING; EPIDEMIOLOGY AND BIOSTATISTICS; COMMUNITY DEVELOPMENT.

Referencias bibliográficas

  1. Armitage P, Berry G. Statistical methods in medical research. 3ra ed. Oxford: Blackwell Science, 1994:187-94.
  2. Peterson AV, Mann SL, Kealey KA, Marek PM. Experimental design and methods for school-based randomized trials: experience from the Hutchinson Smoking Prevention Project (HSPP). Control Clin Trials 2000;21:144-65.
  3. Mach in D. Commentary: educational initiatives deserve randomised controlled trials. BMJ 1997;314:216.
  4. Klar N, Donner A. The merits of matching in community intervention trials: a cautionary tale. Statist Med 1997;16:1753-64.
  5. Kernan WN, Viscoli CM, Makuch RW, Brass LM, Horwitz RI. Stratified randomization for clinical trials. J Clin Epidemiol 1999;52:19-26.
  6. Snedecor GW, Cochran WG. Statistical methods. 7th ed. Iowa: The Iowa State University, 1980:238-54.
  7. Cochran WG. Sampling techniques. 2nd ed. New York: John Wiley, 1963:242-3.
  8. Bartko JJ. The intraclass correlation coefficient as a measure of reliability. Psychol Rep 1966;19:3-11.
  9. Bartko JJ. General methodology II. Measures of agreement: a single procedure. Statist Med 1994;737-45.
  10. Donner A, Klar N. Statistical considerations in the design and analysis of community intervention trials. J Clin Epidemiol 1996;49:435-9.
  11. Navarro D. Aspectos biopsicológicos de la mujer en etapa climatérica. Rev Cubana Med Gen Integral 1999;10:273-87.

Recibido: 26 de diciembre del 2000. Aprobado: 14 de febrero del 2001.
Dr. Armando H. Seuc Jo. Instituto Nacional de Angiología y Cirugía Vascular. Calzada del Cerro No. 1551, Cerro, Ciudad de La Habana, Cuba.

1 Doctor en Ciencias Matemáticas. Investigador Auxiliar. Instituto Nacional de Angiología y Cirugía Vascular.
2 Especialista de I Grado en Bioestadística. Instituto Nacional de Endocrinología.

Indice Anterior Siguiente