Rev Cubana Cardiol Cir Cardiovasc 2010;16(2):206-13

Sección Metodología de la Investigación

 

Problema científico, población y muestra. Revisión de conceptos y ejemplo

A scientific problem, population and sample. Features review and example

 

 

Dr Cs. Rosa Jiménez Paneque

Ciudad de la Habana. Cuba.

 

 


RESUMEN

La investigación científica es reconocida como la manera más directa y eficiente de obtener conocimientos científicos pero la universalización que alcanza hoy en nuestro país puede producir la falsa impresión de que ya no se trata de una actividad de la más alta complejidad y que ya no persigue obtener conocimiento generalizable. Se trata aquí sobre el planteamiento del problema científico y las definiciones de población y muestra, dos aspectos que son parte vital de la planificación de una investigación y que a menudo resultan confundidos o mal planteados en las diferentes formas de reporte de resultados de una investigación. Se recorre el concepto de problema científico y los elementos que integran su planteamiento: su expresión a través de preguntas e hipótesis; la descripción del marco teórico y práctico donde se inserta y la justificación de la necesidad de encararlo. Se abordan además los conceptos de población y muestra y su relación con el problema científico. Se profundiza en la idea de que la población en una investigación no es más que la delimitación del conjunto de personas en el cual deben ser válidas las conclusiones relativas al problema científico que le da origen y se plantea que la población, más que delimitada por espacio y tiempo, deberá limitarse por las características específicas que definen al ser humano al cual se refiere el problema científico en cuestión. La muestra es la parte de la población que se estudia y brinda la información que permitirá responder a las preguntas y dar fin a la investigación. Se concluye que siempre deberá hacerse una distinción entre la población o dominio sobre el que se hace la pregunta que conforma el problema de investigación y la muestra o grupo de unidades donde se hacen las observaciones. Lo abordado se ilustra con dos ejemplos del área de la Cardiología.

Palabras clave: problema científico, población, muestra.


ABSTRACT

Scientific research is recognized as a more direct and effective way to obtain scientific knowledges but the universality achieved nowadays in our country may to creates the false impression t hat it is not a matter of the higher complexity activity and that its aim isn't a generalized knowledge. Present paper is related to the approach of scientific problem and the definitions of population and sample, two features being vital part of planning of a research and that often are confused or proposed in a wrong manner in the different reporting ways of the research results. The scientific problem feature is covered and the elements integrating its approach: its expression through questions and hypotheses; description of theoretical and practical frame where it is inserted and the need justification to confront it. Also, the population and sample are approached and its relation to the scientific problem. We study in depth the notion that the population, in a research, it is no more that the delimitation of persons group in which the relative conclusions must to be valid in relation to the originating scientific problem and we propose that population more than delimitated by space and time, must to be limited by specific characteristic defining the human being concerning to scientific problem in question. Sample is the part of study population and offers the information allowing to answer to questions and to put an end to research. We conclude that always it is necessary to make a distinction between the population or domain on which we make the question conforming the research problem and the sample or units group where we make the observations. All above mentioned is illustrated with two examples from the Cardiology area.

Key words: scientific problem, population, sample.


 

 

INTRODUCCIÓN

Una de las características más elocuentes y exclusivas del conocimiento científico es su carácter generalizador o, en otras palabras, su capacidad de ser generalizable. Esta característica es la base de otras dos que le imprimen al conocimiento científico su carácter específico y también abarcador: la de ser trascendente y capaz de predecir. De cómo se relacionan estas propiedades del conocimiento científico con la metodología de la investigación, trata el artículo que presentamos.

La investigación científica es la manera más directa y eficiente de obtener conocimientos científicos y está también catalogada como la actividad humana de mayor complejidad. Pero, si bien las primeras personas que contribuyeron a la formación de los conocimientos científicos en la antigüedad eran individuos avezados, privilegiados, quizás, en sus respectivos pueblos de origen, hoy día la investigación científica es una actividad que realizan personas de todos los estratos sociales siempre que puedan acercarse profesionalmente a alguna de las ramas del saber. Sin embargo, el hecho de que cualquier profesional realice y haga estudios que puedan considerarse investigaciones científicas, no cambia las características que debe tener el conocimiento adquirido por vía de la investigación y que deberá formar parte del acervo de conocimientos que conforman la Ciencia.

Lo antes formulado parte de la observación de que la universalización de la investigación en nuestro país y en otros, produce la falsa impresión de que ya no se trata de una actividad de la más alta complejidad y, entre otras cosas, que ya no se obtiene de ésta conocimiento generalizador.

La universalización de la actividad investigativa no es razón, a mi juicio, para que la investigación científica deje de ser lo que es, sino una consecuencia de que cada vez más personas tengan acceso a la información y al conocimiento. Hay que tener en cuenta que la investigación científica, si bien puede estar cerca de la práctica, no es realmente una actividad que pueda considerarse práctica, o sea, no es una actividad que resuelva problemas prácticos de manera directa.

Trataremos aquí, con la brevedad que impone un artículo para una revista, dos aspectos que son parte vital de la planificación de una investigación y que a menudo resultan confundidos o mal planteados en las diferentes formas de reporte de resultados de una investigación: a saber los artículos de revistas científicas, los trabajos de terminación de grados científicos, maestrías o especialidades. Se trata del planteamiento del problema científico y las definiciones de población y muestra.

Sobre el problema científico

Aunque el conocimiento científico y la ciencia tienen un carácter universal y sus preceptos básicos son válidos en todas las esferas, lo que se esboza en lo adelante va dirigido al ámbito de la investigación en el área de las ciencias médicas y, particularmente, al área donde el objeto de investigación es el ser humano.

Toda actividad de investigación debe comenzar por el planteamiento de un problema científico. Tanto es así que la inexistencia de este problema implica la imposibilidad de conducir una verdadera investigación científica. Variadas son las razones que respaldan este enunciado: entre ellas la primera es de carácter meramente ético ¿cómo podría realizarse una actividad de alta complejidad, que implica recursos humanos y materiales, sin que realmente exista un problema que la haga necesaria? Realizar acciones de carácter investigativo sin un problema científico claro que resolver está en contradicción franca con la ética de las relaciones humanas, con la ética médica y con la ética de la investigación médica.

La palabra "problema" tiene varias acepciones en el diccionario de la Real Academia Española,1 la quinta de ellas reza así: "planteamiento de una situación cuya respuesta desconocida debe obtenerse a través de métodos científicos"; y eso es precisamente lo que se reconoce en el lenguaje de la ciencia como problema científico: desconocimiento, laguna, falta de exactitud o precisión en conocimientos alcanzados, aristas imprecisas de aspectos conocidos. Un problema científico es una laguna en el conocimiento científico, en general, y no del conocimiento de una persona o grupo.

La investigación científica es, a su vez, el conjunto de acciones que se realizan para contribuir a resolver un problema científico dado y, por tanto, el planteamiento del problema científico debe ser el primer paso en una investigación. Sin embargo, esto que parece tan sencillo resulta a veces desconocido por muchos de los que realizan labor de investigación científica y también es objeto de innumerables desaciertos.

La dificultad es probable que radique radica en que si bien un problema científico puede tener un carácter general (v.g. no se conoce la causa del cáncer), su planteamiento para una investigación implica varias dificultades. En principio debe reconocerse que una investigación es un conjunto de acciones que tienen un objetivo concreto y, por tanto, principio y fin en un tiempo razonable, pero también ha de reconocerse que una investigación es una actividad que intenta resolver un problema científico determinado 2. De modo que la definición de problema científico expuesta ha de ser objeto de algunas precisiones antes de que pueda servir para realizar las acciones que conducirán a su solución por vía de la investigación. Se ha planteado3 que son tres los elementos que deben abordarse en el planteamiento del problema científico para una investigación: 1) su expresión mediante preguntas e hipótesis; 2) la descripción del marco teórico y práctico donde se inserta y 3) la justificación de la necesidad de encararlo.

Las preguntas e hipótesis han de tener, además, ciertas características para que puedan ser abordadas por una investigación, tres de ellas son imprescindibles: especificidad, contrastabilidad empírica, y fundamento en el propio conocimiento científico existente. La especificidad de la pregunta es la condición que le permite ser abordada por una tarea de investigación dada; contrastabilidad empírica es su capacidad para ser respondida mediante observaciones en la práctica; y el fundamento es la característica que asegura que no se está transitando por un camino falso dentro del propio conocimiento que ya existe. El marco teórico-práctico es precisamente el elemento de la definición del problema científico donde se avala el fundamento y la contrastabilidad empírica de la pregunta. La necesidad del marco teórico es un aspecto que merece consideración. El problema científico, como bien plantea Bunge 4 existe y se forja dentro de un conocimiento ya establecido; no se trata de jurar sobre la biblia, sino de demostrar que, efectivamente, existe la laguna del conocimiento que estamos llamando problema científico. Esta demostración necesita de elementos teóricos y de elementos empíricos. Debe haber una teoría (conocimiento establecido) que sustente la existencia del problema y algún antecedente de estudio realizado antes, que corrobore también la existencia de dudas al respecto.

Por otro lado, la investigación científica no es un hobby, los científicos probablemente tienen hobbies diversos, pero no en su quehacer científico. Lo que quiero decir es que la actividad investigativa siempre se enmarca en un ámbito institucional y, por tanto, debe responder a un problema concreto de la práctica. Quizás esta noción, no bien entendida, es la que origina la confusión, que con frecuencia se observa en trabajos investigativos, entre problema práctico y problema científico. El problema científico, como ya se ha afirmado, es un desconocimiento de la ciencia, pero debe responder a cierto problema de la práctica; no olvidemos que la ciencia está formada sobre todo de conocimientos sobre la realidad, pero estos conocimientos son producto de la actividad humana5. La ciencia es la realidad objetiva plasmada como la concibe y necesita el hombre. Es cierto que existe la llamada "investigación básica"2 cuya definición parece contradecir la afirmación de que toda investigación debe estar relacionada con un problema de la práctica, pero no es realmente así; la investigación básica se realiza como parte de la búsqueda de conocimientos que son necesarios o se vislumbran como tales ¿quién financiaría investigación no destinada a resolver algún problema práctico concreto en algún momento?

En resumen, un problema científico implica: desconocimiento de la ciencia, fundamento teórico, antecedentes empíricos y justificación práctica. Sin estas premisas no hay problema científico abordable por una investigación.

Población y muestra

Por otro lado está el concepto de población y muestra, ¿qué significan realmente y qué relación tienen con el concepto de problema científico que hemos intentado delimitar antes? ¿por qué constituye un binomio de términos imprescindibles en los reportes de investigación? Intentaremos abordar estas preguntas ahora.

El ser humano es único como especie, está formado por tres elementos: biológicos, psíquicos (que no dejan de ser biológicos pero este controvertido tema no forma parte de lo que se quiere tratar en este artículo) y sociales. Sin entrar en detalles, que estarían fuera del alcance de este artículo, la definición antes muy levemente esbozada implica una enorme diversidad dada probablemente por las variaciones de sus tres elementos y la interacción entre ellos.

Parte de la especificidad imprescindible para el problema científico que se estudia en una investigación, se asocia al tipo de ser humano que tiene como objeto. La diversidad de los seres humanos es incompatible con la idea de plantear un problema científico -para abordar en una investigación- que los abarque a todos. De modo que la población (que algunos denominan universo) en una investigación no es más que la delimitación del conjunto de personas en el cual deben ser válidas las conclusiones, o sea, las respuestas al problema científico delimitado para esa investigación. Por otro lado, el problema científico en una investigación, si bien debe ser específico, es un desconocimiento de la ciencia que tiene un carácter general y digamos que universal. Entonces, no puede ser estrecho el dominio donde serán válidas las respuestas. El concepto de población ha de ser amplio y, más que delimitado por espacio y tiempo, deberá limitarse por las características específicas que definen al ser humano al cual se refiere el problema científico en cuestión. La investigación, por su parte, tiene objetivos concretos, principio y fin; no se puede observar toda la población definida por características; la parte de la población que se estudia y que brinda la información que permitirá responder a las preguntas y dar fin a la investigación es, precisamente, la muestra.

En el texto de Halley y Cummings6 se menciona la llamada población objeto (target population) cuya definición coincide con la anterior y llaman población accesible a la que está definida en tiempo y espacio que, en este artículo, estamos llamando muestra. Pudiera ser este el origen del repetido error que se encuentra en otros informes de investigación, tesis y artículos que confunden el concepto de población con el de muestra. No se trata de sumirnos en una discusión bizantina sobre terminología, se trata de tener los conceptos claros. Los autores mencionados antes, hacen una distinción entre la muestra que se intenta obtener (llamada población accesible) y la que realmente obtienen (llamada muestra); se refieren entonces a la población accesible como aquella parte de la población objeto que puede delimitarse en tiempo y espacio y que, por tanto, puede estudiarse de manera directa. No es más que nuestro concepto de muestra. Esta necesidad de definir dos poblaciones: la objeto y la accesible, probablemente se origina en la necesidad de contar con la representatividad. Si se acepta que la población es el dominio donde deberán ser válidas nuestras respuestas, la muestra que se observa, ha de ser un reflejo válido de la población. Este es el concepto de representatividad que resulta insoslayable, pero las muestras reales por muchos motivos pueden perder representatividad y esto origina la necesidad de intentar demostrar que, en efecto, la muestra es representativa de la población, un tema que no es objeto de este trabajo. Si se define la población accesible como la misma población objeto sólo delimitada en tiempo y espacio, la representatividad es más obvia. El concepto de representatividad es resbaloso y también es objeto de errores y malinterpretaciones; si solo el tiempo y el espacio distinguen a la población accesible de la población objeto, y puede comprobarse que estos dos elementos no se relacionan con el problema científico, se puede esperar representatividad. La muestra real, conformada por las observaciones que en realidad pudieron realizarse suele perder representatividad por razones relacionadas con factores, humanos y locales, diversos. Estas pueden ser las razones por las que se describe en este libro un paso intermedio entre población y muestra al que llaman población accesible.

Algunas revistas con prestigio en la comunidad científica de las Ciencias Médicas, como la British Medical Journal o la New England Journal of Medicine, utilizan con frecuencia el término "población de estudio" (study population) para definir la muestra. No he encontrado en la literatura una explicación que convenza para el empleo de esta terminología.

El diccionario medico en inglés de Merriam-Webster7 define en su tercera acepción que la población es "un grupo de personas individuales, objetos o ítems del cual se toman muestras para mediciones estadísticas". El diccionario de lengua inglesa "American Heritage"8 define el término como "el conjunto de individuos, items o datos de los cuales se toma una muestral estadística. También se denomina universo". Son definiciones de diccionarios, algo lejanas quizás del significado de la palabra población en el contexto que nos ocupa pero ninguna de las dos hace pensar que se están refiriendo a la muestra.

En el libro Epidemiología para no iniciados9 (Epidemiology for the Uninitiated), publicado por el grupo de la BMJ, se explica con mayor detalle el asunto que ahora nos ocupa. Bajo el subtítulo: "Todos los hallazgos deben referirse a una población definida" desarrollan los conceptos de población y muestra. Primero definen la llamada población objeto (target population) como aquella "acerca de la cual deben obtenerse las conclusiones" y luego definen la muestra (study sample) que se "selecciona de alguna manera de la población objeto". Pero más adelante introducen el concepto de "población de estudio" (study population); a la que colocan entre la población objeto y la muestra y "de la cual la muestra deberá ser seleccionada de forma aleatoria". Este planteamiento del problema puede originar confusión al mezclar el concepto de muestra al método con que esta debe obtenerse, pero tampoco explica el uso de la frase en artículos de las revistas mencionadas antes. El binomio muestra-población es simplemente una consecuencia de dos postulados: el carácter generalizador del problema científico (en cierto dominio) y la incapacidad de observar todo el dominio. No debe confundirse entonces el concepto de muestra con la manera en que esta deberá obtenerse.

El término "población" puede ser, por demás, ambiguo pues se aplica en la vida diaria a la primera acepción que aparece en el diccionario de la RAE 1: "conjunto de personas que habitan la Tierra o cualquier división geográfica de ella", pero no es esta acepción el objeto de este artículo.

De cualquier manera habrá que hacer una distinción entre la población o dominio sobre el que se hace la pregunta que conforma el problema de investigación y la muestra o grupo de unidades donde se hacen las observaciones y estos son los conceptos que se espera queden aclarados aquí.

Ejemplo

Para ilustrar lo planteado, pongamos por ejemplo el siguiente artículo de la revista New England Journal of Medicine 10 titulado "Long-Term Exposure to Air Pollution and Incidence of Cardiovascular Events in Women" (Exposición prolongada a la polución ambiental e incidencia de eventos cardiovasculares en la mujer). El artículo comienza diciendo: "La exposición a la contaminación ambiental se ha asociado a la muerte y a la hospitalización por causas cardiovasculares. Permanece la incertidumbre sobre la magnitud de estas asociaciones, los mecanismos y los efectos de la exposición prolongada a los contaminantes en comparación con la exposición de corta duración." Se está planteando aquí el problema práctico (la muerte y hospitalización) y el problema científico (área general de incertidumbre). Continúa diciendo "aunque estudios previos sobre aumentos diarios en la exposición a la polución han evaluado eventos fatales y no fatales, los estudios que investigan exposiciones prolongadas -estimando la exposición promedio durante años de seguimiento- han evaluado la mortalidad solo sobre la base de certificados de defunción". Se refieren aquí a estudios anteriores (con la correspondiente referencia bibliográfica) y le imprimen, además, otro punto de incertidumbre, la que ofrece el certificado de defunción como fuente de datos. Más adelante expresan: "En estudios previos del efecto a largo plazo de la polución ambiental sobre la enfermedad cardiovascular, los investigadores han promediado las exposiciones en una ciudad y luego han comparado los efectos sobre la salud entre ciudades. Pero, los gradientes de exposición a contaminantes dentro de las ciudades afectan también el riesgo de muerte por causas cardiovasculares y pueden asociarse a ateroesclerosis subclínica". Esta es otra posibilidad de duda en los resultados obtenidos que respalda el problema científico específico para este estudio. La introducción termina con las siguientes consideraciones que resultan ser los objetivos que tuvo el estudio cuyos resultados presentan: "Evaluamos la exposición prolongada a la polución ambiental y la incidencia de enfermedad cardiovascular en el estudio Women's Health Initiative, un estudio observacional, cohorte prospectiva con revisión de historias clínicas y procedimientos de clasificación diseñados para documentar primeros eventos cardiovasculares específicos. Examinamos también, entre las ciudades y dentro de ellas, cómo los gradientes de exposición a una sustancia particular se asocian con los primeros eventos cardiovasculares". Los objetivos especifican qué parte del problema científico planteado (expresado en aspectos aún inciertos en el estudio de la asociación entre la exposición prolongada a la contaminación ambiental) se abordarán en esta investigación en particular, que son elementos contrastables en este esfuerzo investigativo. En el método comienzan describiendo lo que denominan "sujetos de estudio" (study subjects), describen las características generales de la muestra: "mujeres post menopáusicas entre 50 y 79 años de edad incluidas en el estudio entre 1994 y 1998" y más adelante incluyen otros criterios de inclusión: "restringimos nuestra población de estudio a sujetos sin historia de enfermedad cardiovascular diagnosticada por un médico, incluyendo infarto del miocardio previo, enfermedad congestiva del corazón, revascularización coronaria e ictus". Al terminar el acápite de sujetos de estudio el lector conoce cuál es la población objeto (dada por los criterios de inclusión y exclusión) y cuál la muestra.

Otro ejemplo de definición del problema científico y su relación con el problema práctico se muestra en el Cuadro adjunto.11

Consideraciones finales

Con este artículo queremos enfatizar la importancia de dos elementos fundamentales en la realización de una investigación: el problema científico y la definición de la población y la muestra; se revisan los conceptos y se muestra un ejemplo que permite aclararlos. Sin embargo, no hay duda de que la comprensión cabal de cualquier elemento del método científico en la investigación no es posible de forma aislada, habría que profundizar también en aspectos como la representatividad, el papel de la estadística, el planteamiento de las hipótesis y otros. Esperamos que con estas reflexiones se cumpla nuestro objetivo: inculcar en el lector la idea de que sin problema científico claro y específico no es posible realizar una investigación y que esta ha de tener una población objeto que va más allá de la muestra donde se hicieron las observaciones y que permite la generalización de los resultados y, por tanto, su trascendencia, verdadero objetivo de la investigación científica.


REFERENCIAS BIBLIOGRÁFICAS

1. Diccionario de la Real Academia Española, Vigésima segunda edición. 2001. Disponible en: http://buscon.rae.es/draeI/

2. Jiménez RE. Metodología de la investigación. Elementos básicos para la investigación clínica. La Habana: Editorial de Ciencias Médicas; 1998.

3. Silva LC. La formulación de problemas de investigación en salud. Rev Cub Cardiol Cir Cardiovasc. 1991;5(1):64-71.

4. Bunge M. La investigación científica. La Habana: Editorial de Ciencias Sociales; 1972.

5. Andreiev I. La ciencia y el progreso social. Moscú: Progreso; 1976.

6. Halley SB y Cummings SR. Designing clinical research. An epidemiologic approach. Baltimore: Williams and Wilkins; 1988.

7. Merriam-Webster's Medical Dictionary, 2002 Merriam-Webster, Inc. Disponible en: http://dictionary.reference.com/browse/population

8. The American Heritage Dictionary of the English Language, Fourth Edition, 2009; Houghton Mifflin Company. Disponible en: http://dictionary.reference.com/browse/population

9. Coggon D, Rose G, Barker DJP. Epidemiology for the Uninitiated. 4th ed. London: BMJ Publishing Group; 1997.

10. Miller KA, Siscovick DS, Sheppard L, Shepherd K, Sullivan JH, Anderson GL, and Kaufman JD. Long-Term Exposure to Air Pollution and Incidence of Cardiovascular Events in Women. N Engl J Med. 2007;356:447-58.

11. Magnussen EB, Vatten LJ, Lund-Nilsen TI, Salvesen KA, Davey Smith GD, Romundstad PR. Prepregnancy cardiovascular risk factors as predictors of pre-eclampsia: population based cohort study. BMJ. 2007 Nov 10;335(7627):978. Epub 2007 Nov 1.