Con la aparición del WWW, a principios de los años 90 del pasado
siglo, se produjo un crecimiento vertiginoso del número de usuarios y
recursos de información en Internet. Ante estas circunstancias, se desarrollaron
los llamados motores de búsqueda, un tipo de herramienta imprescindible
para explorar el océano de información existente en la red. Con
el objetivo de comprender e identificar los principales motores de búsqueda
especializados en salud pública y biomedicina, se realizó una
profunda revisión del tema en Internet. Para ello, se emplearon: Google,
Altavista, Yahoo, AOL y otros; algunos metabuscadores como Ixquick y un grupo
de buscadores orientados a temas de salud. También, se consultaron bases
de datos como Medline y Documents in Information Science (DoIS), esta
última especializada en ciencias de la información. La información
recopilada se introdujo en una base de datos creada en Microsoft Access.
De ella, se extrajo una lista de 76 buscadores especializados en el tema objeto
de estudio, con el propósito de crear una fuente de información
y referencia, útil a los profesionales y técnicos de la salud,
especialmente a los trabajadores del Sistema Nacional de Información
de Ciencias Médicas. Ellos complementan la información que ofrecen
grandes bases de datos biomédicas en línea como Medline, Current
Contents, LILACS, Biosis y otras.
Clasificación: Artículo de revisión
Descriptores (DeCS): INTERNET; INFORMATICA MEDICA; BIBLIOGRAFIA DE MEDICINA;
BASES DE DATOS BIBLIOGRAFICAS
Descriptores (DeCI): MOTORES DE BUSQUEDA; INTERNET; RECUPERACION DE LA
INFORMACION; ESTRATEGIAS DE BUSQUEDAS; METABUSCADORES; INDICES; BASES DE DATOS
BIBLIOGRAFICAS
With the WWW, at the beginning of the 90's of the last century, a vertiginous
growth of the number of users and resources of information in Internet took
place. In these circumstances, the search engines were developed, a type of
tool essential to explore the ocean of existing information in the network.
With the purpose of understanding and identifying the main specialized search
engines in public and biomedicine, a deep review of the subject was carried
out in Internet. For it, we used: Google, Altavista, Yahoo, etc.; some metasearchesrs
like Ixcquix and a group of finders oriented to health care subjects. Also,
the data bases Medline and Documents in Information Science were consulted (DoIS),
the last one is specialized in sciences of the information. The compiled information
was introduced in a data base created in Microsoft Access. Of this, a list of
76 finders specialized in the subject was extracted study object in order to
create a source of information and reference, useful to the professionals and
technicians of the health care system, specially to the workers of the National
System of Information of Medical Sciences. They enriched the information offered
by great online biomedical database such as como Medline, Current Contents,
LILACS, Biosis and others.
Classification: Review article
Subject headings (DeCS): INTERNET; MEDICAL INFORMATICS; BIBLIOGRAPHY
OF MEDICINE; DATABASES BIBLIOGRAPHIC
Subject headings (DeCI): SEARCH ENGINES; INTERNET; INFORMATION RETRIEVAL;
SEARCH STRATEGIES; META-SEARCH ENGINES; INDEXES; DATABASES, BIBLIOGRAPHIC
El avance vertiginoso de las tecnologías de la información y
las comunicaciones (TIC), que se inició en el pasado siglo, matiza el
mundo actual y a una sociedad que ha dado en llamarse sociedad de la información
y del conocimiento, era posindustrial, era de la información, era posmodernista,
era digital, entre otras denominaciones. Dicha sociedad, se desarrolla en el
marco de la llamada Revolución Industrial del Siglo XXI, y en
una globalización a escala planetaria, donde una parte importante del
esfuerzo del hombre se ha concentrado en la producción, manejo y uso
de la información.1-3
El surgimiento, desarrollo y expansión de Internet, ha supuesto una
revolución sin precedentes en el mundo de la informática y las
telecomunicaciones. Los inventos del telégrafo, teléfono, radio,
televisión y las computadoras, sentaron las bases para esta integración
de capacidades, nunca antes vivida. Internet ha propiciado la multiplicación
de los canales y vías de acceso a la información y ello, ha devenido
en un factor decisivo, en una nueva etapa del desarrollo humano, al facilitar
que millones de personas obtengan información para distintos fines: aprendizaje,
entretenimiento, actualización, cultura general, etc., desde cualquier
parte del mundo enlazada a la red.3
La salud pública y la biomedicina ocupan un lugar relevante en el ciberespacio.
Una de cada 5 personas que acceden a la gran red de redes, se propone buscar
información sobre salud en el web (Gustafsen D. Promesas y trampas de
la salud en Internet. ¿Nosotros podemos o debemos superar el abismo digital?
Conferencia impartida en el V Congreso Regional de Información en Ciencias
de la Salud. La Habana, 24-27 abril 2001). Se estima además, que diariamente
se incorporan unas 7.3 millones de nuevas páginas.4,5
Asimismo, la mayor parte de los usuarios que acceden a la red consumen el 50%
de su tiempo en línea en la ejecución de búsquedas y cerca
del 90% emplean los buscadores para encontrar la información que necesitan.6,7
En el caso particular de los médicos, el 80% realizan consultas por Internet.
El web, por tanto, abre cada vez más sus puertas a los profesionales
de la salud, pacientes y público en general.8
Internet se ha convertido en una gran biblioteca caótica que duplica
continuamente su tamaño. Según los informes de Nua Internet
Surveys, en septiembre del año 2002, el estimado de usuarios que
se conectaban regularmente a la red para explorar este gran yacimiento, calculado
en aproximadamente 2 exabyte de información electrónica- 1 exabyte
equivale a 1000 millones de gigabyte de información electrónica,
localizada en más de 2 billones de páginas web en todo el planeta,4
era de alrededor de 605.60 millones.9
Según las previsiones actuales con respecto al crecimiento de la red,
se calcula que el número de páginas web, que duplica cada 173
días, para el año 2010, se duplicará cada 73 días.8
Esta cantidad de información, comparable con un gran océano, carece
de normas de control bibliográfico y crece de forma descontrolada. Ello
necesariamente produce preocupación en todo el mundo, en particular,
entre las autoridades sanitarias, que advierten sobre los peligros que implica
la diseminación de publicaciones sin un adecuado control de calidad,
exactitud y validez, semejante a los mecanismos que se utilizan para las publicaciones
impresas (libros, revistas científicas, y otras) o en disco compacto,
CD-ROM.8,10-14 Estas realidades afectan la
calidad y autenticidad de la información existente en Internet y constituyen
un problema de gran envergadura, especialmente cuando se trata del rigor científico
de la información publicada. Muchos autores y asociaciones científicas
han llamado la atención sobre esta problemática. En el campo de
las ciencias biomédicas es particularmente importante, porque pacientes,
médicos, especialistas y otros profesionales de la salud, confluyen en
la red, en la búsqueda de información validada científicamente
que responda a sus necesidades informativas.13-19
En algunas especialidades médicas, los motores de búsqueda generales
como Altavista, Lycos, Google y otros, recogen la información
de la peor calidad.20
El fenómeno de la explosión de información, tratado desde
los primeros años del pasado siglo, ha adquirido nuevas dimensiones al
situarse una gran cantidad de información en las redes de telecomunicaciones,
a un ritmo sin precedentes en la historia humana. El exceso de información
ubicada en el ciberespacio, entraña una dificultad real para su consumo
en tan poco tiempo, y ha originado un serio problema, al que se ha dado en llamar
infoxicación, fenómeno asociado a otros, como el síndrome
de la fatiga informativa, la angustia de la información, el infoestrés
y el estrés tecnológico.14,21,22
El presente trabajo se propone revisar con exhaustividad la información
disponible sobre el tema de los motores de búsqueda en Internet, con
énfasis particular en aquellos orientados a la salud pública y
la biomedicina. Adicionalmente, se compiló una lista de buscadores especializados
en estas temáticas con el propósito de crear una fuente de información
y referencia, útil para todos los profesionales y técnicos de
la salud, especialmente a los trabajadores del Sistema Nacional de Información
de Ciencias Médicas.
Los datos fueron obtenidos mediante investigaciones bibliográficas en los motores Google, Altavista, Yahoo, etcétera; algunos metabuscadores como Ixquick y una serie de buscadores propios del sector de la salud, durante el período abril del 2002 a enero del 2003. También, se consultaron las bases de datos Medline y Documents in Information Science (DoIS), especializada en ciencias de la información. En la estrategia de búsqueda, se utilizaron las palabras "healtlh search engines", "medical search engines" y sus equivalentes en español "buscadores de salud" y "buscadores médicos". La información recopilada se introdujo en una base de datos, creada en Microsoft Access, y con ella se elaboró una lista de 76 motores orientados a la medicina y ciencias afines que se expone en el artículo.
En 1990, Alan Emtage, un estudiante de la Universidad McGill de Montreal,
creó la primera máquina para buscar información en Internet,
y se denominó Archie. Por esta época no existía
el www y la herramienta más generalizada para estos fines en Internet
era el protocolo de transferencia de ficheros, File Transfer Protocol
(FTP). Archie consistía de una base de datos de servidores FTP y un motor
de búsqueda sencillo que buscaba los ficheros de los servidores FTP que
coincidiesen con los términos de la búsqueda realizada por el
usuario. Fue el único medio para la recuperación de información
en la red hasta el año 1993, fecha en que surgió Verónica,
desarrollado por la Universidad de Nevada en los Estados Unidos, concebido como
una herramienta similar a Archie, pero para servidores Gopher,
que para el año 1993 era la aplicación más popular en Internet.
Con la aparición del web en este año, se convirtió rápidamente
en la principal herramienta de Internet.8
La estructura jerárquica de acceso a la información que ofrecía
Gopher y las técnicas documentales de Wais quedaron atrás, cuando
se impuso la flexibilidad del protocolo HTTP y del lenguaje HTML de las páginas
web. En breve, la mayor cantidad de información disponible en Internet,
se volcó hacia el web, y este se convirtió en la herramienta integradora
que es en la actualidad.23,24
La década de los años 90 del pasado siglo fue el escenario donde surgieron y se desarrollaron la mayoría de los actuales motores de búsqueda. Se estima que existen en la red alrededor de 5 300 buscadores, de los cuales 5 000 son internacionales y unos 300 son hispanos;25,26 y entre ellos tiene lugar una gran carrera para posicionarse en el web y ganar la preferencia de los navegantes. Por esto, dichas herramientas se perfeccionan continuamente, poseen una interfaz cada vez más amigable, y se han adaptado a nuevas exigencias, especialmente en el campo de la recuperación de información.
El exceso de información que existe en estos momentos en el mundo constituye
uno de los grandes desafíos en la llamada era de la información.
Ello ha motivado el desarrollo de sistemas o programas que permitan encontrar
información en Internet, en la que existe, también, un volumen
sorprendente de información escondida, denominada Internet profunda o
invisible. Constituyen la Internet invisible o infranet (en inglés deep
web), el conjunto de fuentes y recursos de información sumamente
valiosos, cuyo acceso es únicamente posible mediante algún tipo
de pasarela (gateway) o formulario web, y que por tanto, no pueden recuperarse
y procesarse por los robots de los buscadores; para ellos, por tanto, permanecen
invisibles. Algunos autores han denominado esta información como archipiélagos
de calidad, al constituir recursos aislados, pero publicados con rigurosos procesos
de evaluación y edición.8,14,27
Un navegante en Internet halla regularmente sólo aquello que está
registrado en algún buscador o en un gran motor de búsqueda. Estos
motores o robots sólo pueden ver aquella parte de Internet que es abierta,
es decir, las páginas a las que el robot puede dar una dirección,
pero estos robots no pueden ver aquella información que está detrás
de una base de datos, aquella información a la que se accede mediante
una clave de acceso (password) o aquellas páginas que resultan de una
búsqueda en una base de datos. Entre los recursos de información
invisibles a los buscadores se encuentran: 8,14,27
Según los expertos, el volumen de la información almacenada en
la llamada Internet invisible o profunda, es 500 veces superior a la existente
en la llamada Internet visible. A la primera, como se dijo, la mayoría
de los motores de búsqueda no pueden acceder, pese a que sus recursos
son de gran calidad e interés para los usuarios.27,28
Para tener una idea de la magnitud de la información que existe en Internet,
se cree que si toda la información depositada en las Intranets y si las
páginas web, generadas por las bases de datos estuvieran incluidas, esa
información estuviera conformada por unos 550 billones de documentos
y el 95 % fuera accesible públicamente.7,29
Como un gran iceberg, Internet solo deja ver a los motores de búsqueda
tradicionales una ínfima parte de lo que contiene; los buscadores más
potentes como Lycos, Google, Northern Light y Altavista, solamente
acceden a un 16 % de la información.8,21,29
Al mismo tiempo, algunos trabajos refieren que más de un 5 % de la información
en Internet sea completamente inaccesible, otro sector al que han denominado
agujeros negros, compuesto por información situada en servidores accesibles,
únicamente desde un proveedor, pero inalcanzables para otros.30
Sin embargo, existen algunos buscadores útiles para encontrar recursos en Internet invisible:
Los buscadores, llamados también herramientas de primera generación,8,14 se han convertido en la puerta de acceso a la red para la gran mayoría de los usuarios que buscan información, y generan actualmente el 85 % del tráfico en Internet; pero su funcionamiento dista mucho de ser el más adecuado, debido esencialmente al ruido, las diferentes técnicas para la recuperación de la información y la limitación a los recursos existentes en las bases de datos del motor de búsqueda.8,14 A ello se une, además, el hecho de que los servidores de búsqueda en Internet se basan en la arquitectura cliente-servidor. El servidor se encuentra en una computadora remota a la que se accede como cliente, de modo que la búsqueda se debe adaptar a las normas del servidor que se accede.23,24,31 Para minimizar estas limitaciones, en los últimos años, aparecieron herramientas de segunda generación o agentes inteligentes, 8,14 que se instalan en la computadora cliente y, por ende, el usuario tiene un mayor control sobre su funcionamiento. Estas herramientas son capaces de colaborar, de programarse y de hacer búsquedas off-line. Todo parece indicar que en la recuperación de información en Internet, predominarán ambas tecnologías, es decir, los buscadores o agentes de primera generación, y los agentes inteligentes, o de segunda generación.8
Se denominan buscadores, motores de navegación o motores de búsqueda, aquellos programas o herramientas interactivas que facilitan la búsqueda y recuperación de información en Internet. Los motores de búsqueda ofrecen formularios para introducir los datos mediante una interfaz de fácil comprensión para el usuario, el cual teclea una palabra clave o frase y recupera una lista de recursos que se corresponden con el criterio indicado. Los motores no pueden cubrir todos los recursos disponibles en Internet, pero muchos contienen referencias a millones de recursos. Los resultados, por tanto, variarán de un motor de búsqueda a otro.8,10,12,14,23,24,31,32,33,34,35,36
En la literatura revisada, se encontraron distintas formas de clasificar los
buscadores: índices, robots y metabuscadores; directorios y buscadores;
índices y motores de búsqueda; índices, motores de búsqueda
y portales; temáticos, automáticos y especializados; clasificadores
o buscadores de categorías y buscadores de contenidos o de palabras por
contexto; agentes sectoriales y agentes expertos o de búsqueda avanzada;
y metamotores y metamotores de segunda generación. Estas clasificaciones
se refieren a potentes software creados para localizar información en
la red. La diferencia fundamental radica en su forma de funcionamiento. Una
de las clasificaciones más aceptadas en la literatura es: 32,40
- Directorios temáticos o índices
Los directorios web se compilan por personas (expertos) quienes deciden los sitos de Internet que registran en las bases de datos. Ellos ordenan sus recursos de forma cronológica o geográfica, por temas, categorías o por una combinación de estos, generalmente en forma de árbol jerárquico. Poseen bases de datos más pequeñas, menos actualizadas y más elaboradas, como resultado de la presencia del factor humano. Son fáciles de usar, porque permiten ubicar la búsqueda en un tema predeterminado. Algunos ejemplos pueden ser: Yahoo, Olé y Ozú. El primer directorio que apareció en Internet fue Yahoo, creado en el año 1994, por David Filo y Jerry Yang, dos estudiantes de ingeniería eléctrica de la Universidad de Stanford. Ellos conformaron una colección de páginas web y confeccionaron un software que, con la ayuda de una base de datos, permitía encontrar las páginas y visitarlas.41
- Motores de búsqueda
Poseen bases de datos más amplias y actualizadas. Se compilan por máquinas o robots, e incorporan en sus bases de datos la información que sea capaz de recoger en los sitios de Internet. Su empleo es más difícil, porque se requiere explotar al máximo las opciones de búsqueda, debido a que contienen más información. Algunos ejemplos son: Altavista, Google, Northem Light, FAST, Open Text, etcétera.
- Metabuscadores o buscador de buscadores
En ocasiones, un sitio de búsqueda no satisface plenamente las necesidades de información del usuario. Sin necesidad de explorar de forma individual varios buscadores para encontrar resultados pertinentes, Internet dispone de herramientas que permiten interrogar varias bases de datos simultáneamente desde una única interfaz, a ellos se les denomina metabuscadores, buscadores múltiples, multimotores o megabuscadores.42 El primero en aparecer fue MetaCrawler en 1995, desarrollado por Eric Selburg, estudiante de la Universidad de Washington.8 Los metabuscadores no poseen bases de datos propias. Ellos envían su búsqueda a varios motores, de modo que los resultados obtenidos dependen de lo que sean capaces de devolver estos, si están accesibles en el momento de la búsqueda. Por lo general, son difíciles de utilizar para búsquedas precisas, porque tienen un menor control sobre la búsqueda, y se atienen a las restricciones e interfaces diferentes en cada motor.
Algunos de los metabuscadores más conocidos son:
Una variante de los metabuscadores son los multibuscadores, que presentan en una sola pantalla, las ventanas de diversos buscadores, para que el usuario elija en cuáles desea realizar la búsqueda. En esencia, los multibuscadores son muy parecidos a los metabuscadores con la diferencia de que los primeros no suman todos los resultados. De hecho, copian el cuadro de diálogo y el botón buscar de cada buscador para que desde una sola página el usuario pueda acceder directamente a cualquier buscador. Los multibuscadores envían la palabra clave a distintos buscadores, pero muestran los resultados por separado; son ideales para interactuar con buscadores desconocidos.
Algunos ejemplos pueden ser:
Un motor de búsqueda posee tres componentes fundamentales, independientemente de su clasificación: 8,32-40
a) Robot
Un motor de búsqueda puede tener uno o varios robots. Un robot es un programa que rastrea y recorre la red continuamente para visitar las páginas web, leerlas y analizar sus enlaces con otras páginas. Esta operación se repite periódicamente para detectar cambios, si se eliminaron los archivos, si cambió el URL -Localizador Universal de Recursos (Universal Locator Resources) -, si hubo modificaciones en las páginas, etcétera. Toda la información recopilada se incorpora a una base de datos. Estos programas se denominan de distintas formas: spider (arañas), wanderers (vagabundos), crawler (reptil) o worm (gusano). Los motores de búsquedas suelen llamar de distintas formas a sus robots. Por ejemplo: el de Altavista se denomina Scooter, el de HotBot, Slurp y el de Excite, ArchitextSpinder.8
b) Indice
El índice es una base de datos que contiene una copia completa o parcial de los documentos reunidos por el robot y la información que, por medio de programas especiales, facilita la labor de los mecanismos de búsqueda. Los índices son programas muy parecidos a las bases de datos documentales convencionales. Ellos reciben como entrada, el texto de los documentos reunidos por los robots y producen como salida, un índice, típicamente un índice invertido, muy parecido a los que generan las bases de datos bibliográficas.
c) Mecanismo de búsqueda
El mecanismo de búsqueda es visible al navegante en los buscadores. Los mecanismos pueden diferir de un motor a otro, pero generalmente permiten hacer búsquedas en lenguaje natural o simples, y avanzadas o precisas. A partir de una interfaz que puede tener una o más cajas de diálogo, el usuario indica el texto que desea buscar, con una o varias palabras. Después señala el inicio de la búsqueda, pulsando un botón que suele denominarse: search, go, go to get it, submit, find o sus equivalentes en español, buscar, encontrar, ir y otros. El programa examina millones de páginas web que contiene el índice, buscando aquellas palabras iguales a las solicitadas en la búsqueda, para luego ordenarlas según la relevancia y devolver un resultado al solicitante.
La opción de búsqueda avanzada tiene ventajas evidentes para los navegantes, especialmente para restringir la búsqueda a un idioma, campos específicos, la cantidad de referencias a mostrar por páginas, un rango de fechas determinado, y otros aspectos que pueden variar de un motor a otro. Su utilización requiere de conocimientos más avanzados para la elaboración de las estrategias de búsqueda. Por ello, se considera que acceden a ella los usuarios con más experiencia en la navegación y uso de las herramientas de búsqueda. Si se observa el mecanismo de búsqueda avanzado del buscador Health Web (http://www.healthweb.com) tipo índice o directorio, es posible ver distintas opciones de búsqueda: por título, URL, palabras del título o la descripción de las páginas web, por tipo de recurso, por materias o por términos del vocabulario MESH, lenguaje utilizado por la Biblioteca Médica Nacional de los Estados Unidos (National Library of Medicine, NLM).
La búsqueda de información en el web se ha convertido en una
tarea fundamental para el navegante. Independientemente del motor de búsqueda
elegido, la definición de una estrategia de búsqueda efectiva
es vital para encontrar y recuperar información pertinente en el gran
océano de información que es Internet. Varios autores han abordado
esta problemática y plantean que para encontrar información relevante
se necesita experiencia, técnica, aptitudes, inventiva y buena suerte,
todo ello combinado con la habilidad de definir con precisión lo que
se desea buscar. A la hora de construir la estrategia de búsqueda deben
considerarse los siguientes aspectos:7,8,10,11,32,33,34,35,37,38,40
La estrategia es muy importante en cualquier herramienta de búsqueda de información electrónica, sean los motores de Internet, las grandes bases de datos bibliográficas de medicina como Medline, Current Contents, Biosis, LILACS, etcétera; todo ello se ha convertido en un factor ineludible que incide sobre la pertinencia de los resultados de la búsqueda.
Para conformar correctamente la estrategia de búsqueda en los buscadores de Internet es necesario observar rigurosamente la sintaxis de los llamados operadores lógicos o booleanos. Casi todos los buscadores admiten la utilización de la lógica matemática, unos, mediante listas desplegables en la que se elige el operador lógico que se debe introducir en la caja de diálogo del mecanismo de búsqueda; entre las distintas palabras separadas por espacios, y otros, mediante conjunciones en inglés o español mezcladas en el texto. Generalmente, se admite, también, el uso de paréntesis y comillas para frases completas al construir la estrategia de búsqueda.43-48
a) AND: El operador AND (Y lógico) es el operador de intersección
de dos conjuntos de búsqueda. Equivale a la conjunción "y"
e indica que se recuperarán los documentos que contengan los dos o más
términos. El resultado de este operador entre dos conjuntos, por ejemplo,
contiene sólo aquellos elementos que son comunes a ambos conjuntos o
palabras clave indicadas. El operador AND es uno de los más utilizados
debido a la restricción que añade a la búsqueda, y que
redunda en la pertinencia de los resultados.
Por ejemplo, se desea recuperar documentos donde se asocie la hipertensión con la arritmia.
Estrategia de búsqueda:
hipertensión and arritmia
Los resultados obtenidos serán referencias a páginas o documentos donde se asocien ambos elementos, es decir, donde exista una coocurrencia de las dos palabras en una misma página o documento. Nótese que se encierra entre comillas la expresión infarto del miocardio para que se interprete como una frase. El resultado del operador AND (Y) entre dos conjuntos puede ser nulo, es decir, puede que no existan elementos con la restricción o reducción indicada.
b) OR: El operador lógico OR (O) es el operador para la unión de conjuntos. Se utiliza para ampliar el alcance de la búsqueda e incrementa, por lo general, el número de documentos a recuperar. Al utilizar OR se indica al buscador que se desea recuperar documentos donde aparezca uno, otro o ambos argumentos indicados. El operador OR es especialmente útil para indicar asociaciones de palabras o sinónimos en la estrategia de búsqueda.
Por ejemplo, si se desea recuperar documentos o páginas sobre juegos en el Síndrome de Down, la estrategia puede ser:
juegos and ("síndrome de down" or mongolismo)
En esta expresión de búsqueda, se combinan los operadores lógicos
AND y OR, se encierran entre paréntesis las palabras mongolismo
y, además, entre comillas la expresión síndrome de Down,
para que el buscador la interprete como una frase literal.
Cuando no se indica ningún operador entre las palabras, algunos buscadores lo interpretan como si se hubiera colocado el operador OR.
c) AND NOT o NOT: El operador AND NOT o NOT es el operador de exclusión
de conjuntos. Los resultados del empleo de este operador son registros que contienen
todos los elementos del primer conjunto y no, los del segundo. Este operador
es el único que sólo necesita un argumento y su función
es negar o excluir las palabras clave que se indiquen a continuación.
AND NOT y NOT son muy útiles para minimizar los problemas ocasionados
por la polisemia. Generalmente, se utiliza después de explorar de forma
preliminar los resultados devueltos por el buscador, y así refinar de
la búsqueda los resultados irrelevantes. Hay que tener precaución
con su uso, porque puede representar la pérdida de documentos relevantes;
y revisar la ayuda del buscador para comprobar si utiliza la expresión
AND NOT o la palabra NOT o sus equivalentes en español. (y no, no)
Por ejemplo, si se desea recuperar información sobre antibióticos pero que excluya aquella referente a la penicilina, puede utilizarse la siguiente estrategia de búsqueda:
Antibióticos and not penicilina
En este caso, se recuperarán documentos o páginas sobre antibióticos, pero se excluirán aquellos que se refieren a la penicilina.
d) XOR: Este operador constituye una variante del OR. Indica al buscador que
recupere sólo los documentos que contengan una de las dos o más
palabras clave indicadas, pero que excluya aquellas que contengan las dos a
la vez. El operador XOR no tiene un equivalente claro en español, no
es muy utilizado y no se conocen muchos buscadores que lo usen.37
La combinación de los operadores booleanos, y la utilización
de paréntesis y comillas, permite construir complejas estrategias de
búsqueda. En todos los casos, el operador elegido, debe estar precedido
y antecedido de espacio, es decir, no deben estar unidos a ninguna palabra.
En algunos buscadores se utilizan los signos matemáticos más (+) y menos (-) en sustitución de los operadores lógicos AND (+) y AND NOT o NOT (-). En ambos casos, el signo correspondiente se coloca delante de la palabra clave, sin dejar espacios. Por ejemplo:
asma + hipertensión.
Nótese que al utilizar los operadores AND, OR o AND NOT, es necesario colocar espacios entre el operador y la palabra clave.
Los operadores de proximidad permiten definir la posición de las palabras dentro de las páginas o documentos en la estrategia de búsqueda. Es muy importante revisar la ayuda del buscador elegido o la opción de búsqueda avanzada para conocer si éstos operadores son válidos o los utiliza el motor de búsqueda.
Presencia: El operador de presencia especifica que las palabras deben aparecer en el resultado, es decir, el término debe estar presente. Por lo general, se añade al inicio de la palabra clave el signo de sumar (+) sin espacio, para indicar al buscador que la palabra que sigue se incluirá obligatoriamente en la información recuperada. Por ejemplo:
+estadística.
En este caso, pueden recuperarse páginas o documentos donde aparezca
la palabra bioestadística.
Ausencia: En la estrategia de búsqueda, puede indicarse la ausencia de alguna palabra clave, de forma tal que si estuviera presente, se excluya de la lista de resultados devueltos por el buscador. Por ejemplo:
Hepatitis -alcohólica
El buscador devolverá documentos o páginas web que excluyan la hepatitis alcohólica. El operador de ausencia puede sustituirse por el operador lógico de exclusión NOT o AND NOT.
Truncado: El truncamiento de palabras clave hacia la derecha es, tal vez, el más utilizado y admitido en los buscadores de Internet, pero también es posible al inicio o en el medio de la palabra clave. Generalmente se utiliza para truncar el símbolo de asterisco (*), pero algunos buscadores admiten otros símbolos como ($, # y ?). Es muy importante, como se ha señalado para otros casos, revisar cuidadosamente la ayuda del buscador o la opción de búsqueda avanzada para comprobar el tipo de truncamiento que admite el buscador seleccionado. El truncamiento permite conocer cuáles son las acepciones o formas en que puede presentarse el término o palabra que se trunca. Con él, se recuperan documentos que contengan la palabra clave, pero también aquellas en la que la palabra sea raíz o sufijo. El símbolo más utilizado es el asterisco, el cual reemplaza una serie indeterminada de letras. Por ejemplo:
hipert*.
En este caso, el buscador devolverá referencias a páginas o documentos sobre hipertensión, hipertiroidismo, hipertonía, etcétera.
Frases literales entre comillas: El uso de frases entre comillas indica la intersección de palabras en la búsqueda, que además, aparecen adyacentes. Es muy parecido al AND pero exige que la secuencia de palabras sea idéntica. En el resultado de la búsqueda, la frase aparecerá en el texto recuperado. Se aconseja indicar frases cortas que contengan términos que aparecen con frecuencia en los documentos consultados en el mecanismo de búsqueda. Por ejemplo:
"Sangramiento digestivo alto"
Es posible utilizar el guión para concatenar palabras y obtener resultados similares. Por ejemplo:
Sangramiento-digestivo-alto
La búsqueda de palabras aisladas como hipertensión arterial y esencial puede arrojar resultados excesivos, pero si se encierran entre comillas, el resultado puede disminuir ostensiblemente, porque el buscador rastreará la frase "hipertensión arterial esencial"
Funciones especiales
Algunos buscadores admiten la utilización de comandos o funciones especiales para buscar información, entre los que se encuentran:
anchor:texto
El buscador identificará aquellas páginas que contienen la palabra o expresiones especificadas en el texto de un hipervínculo. Por ejemplo:
anchor: "buscadores de salud"
domain:nombre del dominio.
Cuando se especifica un dominio, se restringe la búsqueda a determinados países o tipo de dominios en Internet (educacionales, comerciales, gubernamentales, militares etcétera). Por ejemplo, si se desea recuperar información sobre sitios del Reino Unido que traten sobre motores de búsqueda, habría que construir la siguiente estrategia de búsqueda:
"search engine" and domain:uk o "search engine"+domain:uk
Para recuperar las páginas que se encuentran en el dominio de la Red Telemática de Salud (Infomed), se definiría la siguiente estrategia de búsqueda:
domain:cu and sld o domain:cu+sld
host:nombre del host.
Localiza páginas ubicadas en un servidor específico o las excluye, en dependencia de las combinaciones que se realicen con los operadores AND (+) y AND NOT o NOT (-). Generalmente, cuando los sitios son muy grandes, los buscadores no los rastrean completamente, sino que se limitan a buscar en sus propias bases de datos en busca de resultados. Esta técnica se utiliza cuando se necesita recuperar información en uno de estos sitios muy grandes y que no tienen un motor de búsqueda interno. Por ejemplo, si se desea recuperar la información que pueda existir sobre asma en el sitio www.sld.cu de Cuba:
host:www.sld.cu+asma.
En este caso, el buscador rastreará el sitio de www.sld.cu completo, para identificar los recursos de información que existen sobre asma.
image:nombre del archivo.
Localiza páginas con imágenes que tengan un nombre de archivo específico. Aquí es útil truncar hacia la derecha con el signo de asterisco (*) si se desea recuperar cualquier archivo de imagen sobre un tema determinado. Por ejemplo, si se desea recuperar archivos de imágenes (jpg, bmp, gif) sobre el corazón:
image:corazon.*
Si se desea recuperar sólo imágenes gif del corazón, entonces se indica al buscador lo siguiente:
image:corazon.gif
link:texto url
Busca las páginas que contienen un vínculo a una página con el texto del URL especificado. Por ejemplo, si se desea encontrar sitios con enlaces a BIREME, entonces se deberá construir la siguiente estrategia de búsqueda:
link:www.bireme.br
text:nombre del texto
Con esta función se localizan las páginas que contienen el texto especificado en cualquier parte de la página excepto una imagen, un vínculo o un URL. Por ejemplo:
text:orinoterapia
title:texto del título
Con esta función, se buscan las páginas en cuyo título, nombre o descripción, esté la palabra o expresión especificada, que se visualiza normalmente en la barra de título del navegador. Por ejemplo, si se desea recuperar páginas que presenten en el título la frase "asma bronquial", puede teclearse:
title:"asma bronquial"
url:nombre de la url
Esta función es útil para encontrar páginas web que presenten en el texto de su dirección URL, la palabra o frase especificada. Por ejemplo, si se desea recuperar URLs en las que aparezca la palabra farmacia:
url:farmacia
Búsqueda por campos
La búsqueda por campos es una de las facilidades principales que poseen las conocidas bases de datos bibliográficas biomédicas, Medline, Current Contents, LILACS y otras. En la opción de búsqueda avanzada de algunos motores de búsqueda existe esta posibilidad, que ayuda considerablemente a encontrar la información deseada en Internet. No todos los buscadores tienen esta opción, por lo que será necesario recurrir a la ayuda del motor y especialmente a la opción de búsqueda avanzada, si existiera.
La mayoría de los autores sugieren que el texto de la estrategia de búsqueda debe escribirse preferentemente en minúscula. Si se escribe todo en mayúscula, el buscador sólo recuperará los documentos o páginas que estén en mayúsculas y viceversa. Algunos buscadores admiten las dos formas de escritura.
La salud pública y la biomedicina constituyen una de las temáticas
con mayor demanda de información en Internet. Sólo en los Estados
Unidos, en el año 2002, cerca de 100 millones de personas navegaron por
Internet en busca de información en el campo de la salud.29,47,48
Los contenidos depositados en la red son, por su volumen, accesibilidad, calidad
y variedad, el recurso de información en más importante en medicina.14
Por ello, la recuperación de información biomédica en la
red, requiere de herramientas de búsqueda eficaces que permitan penetrar
en ese mar de información creciente.
Entre estas herramientas, son muy conocidos y utilizados, los índices
y directorios, que, como tendencia, incluyen una sección de salud, con
información tan importante como la que pueden mostrar los motores especializados
en la temática. A ellos recurren todos los usuarios de la red:, médicos,
investigadores, estudiantes y, especialmente, los pacientes. Sin embargo, la
información confiable y de rigor científico no siempre es fácil
de encontrar. Ante esta realidad, se han desarrollado buscadores especializados,
donde la participación humana es decisiva, para seleccionar, validar
y certificar la información registrada. Estos buscadores incorporan el
criterio de expertos en el análisis de la información, es decir,
añaden un alto valor a los recursos seleccionados y muestran, por regla
general, distintas categorías temáticas para que el navegante
elija aquellas de su interés. Los buscadores médicos funcionan
como todos los buscadores, aunque sus opciones y posibilidades de búsqueda,
en algunos casos, están limitadas.25,26
Al final del presente trabajo, es posible consultar una relación de motores de búsqueda en salud identificados a partir de las búsquedas realizadas en los motores generales de Internet y en los propios buscadores especializados en salud (anexo)25,26,49-69
Con el desarrollo de Internet, aparecieron los motores de búsqueda,
sin los cuales sería prácticamente imposible localizar recursos
de información en la red. No existe un buscador que pueda considerarse
como el mejor. Los buscadores generales perfeccionan los mecanismos de búsqueda
e indización de los documentos, diseñan interfaces más
amigables y mejoran las técnicas de presentación y ordenamiento
de los resultados.1,2,8,14 En los últimos
años, también han proliferado los buscadores especializados, como
alternativa para el acceder a información validada científicamente.
En general, existen elementos comunes en el mecanismo de búsqueda, es
decir, distintas variantes de búsqueda: natural o simple y la avanzada
o precisa, en las que puedan utilizarse los operadores lógicos o booleanos
y otras facilidades, que ayudan considerablemente a definir con mayor exactitud
lo que se desea encontrar.
El nivel de conocimiento del usuario sobre el funcionamiento de los motores
y, especialmente, del uso de los operadores de búsqueda guarda una estrecha
relación con el éxito o el fracaso en la localización de
páginas o recursos adecuados. Las herramientas de búsqueda en
Internet convergen en muchos aspectos, por ejemplo, cuando se combinan la búsqueda
por un directorio y un motor. Se observa actualmente en muchos motores la posibilidad
de predeterminar la búsqueda a tópicos específicos, como
imágenes, web, noticias, MP3, directorio, etcétera. No es habitual
encontrar buscadores que excluyan la posibilidad de realizar una exploración
por medio de un directorio y de un motor de búsqueda a la vez.8,14,37,40,43,44
Google, uno de los buscadores más potentes y populares del web, incorporó
en el año 2002 la opción de búsqueda en un directorio,
en la que se agrupan por idiomas los contenidos en un árbol temático
que el usuario puede elegir de forma predeterminada, buscar y seleccionar lo
que desee, como suele ocurrir en los índices tipo Yahoo.
Se ha generalizado la presentación de los resultados en función
de la relevancia que el buscador asigna a cada página recuperada. Algunos
motores asignan estrellas en orden decreciente para indicar la relevancia, indican
los primeros 10 resultados como los más relevantes, o muestran un porcentaje.
Existen importantes recursos de información sobre salud en Internet,
inaccesibles para los grandes motores como Google, Altavista y otros.
Sin embargo, muchos de los motores especializados en salud que han aparecido
en la red durante los últimos años, se orientan hacia la recuperación
de una parte importante de esta información. Ellos constituyen excelentes
herramientas de búsqueda, cubren un gran abanico de temas biomédicos
y tienen la gran ventaja de que la selección de la información,
registrada en sus bases de datos, se realiza por profesionales de la salud o
la información, y que además, es validada o certificada por instituciones
de reconocido prestigio. Muchos de estos motores presentan características
de índices temáticos y se observa como tendencia, especialmente
en los norteamericanos, la incorporación de vocabularios controlados,
en particular el MeSH de la NLM, para la elaboración de las estrategias
de búsqueda, así como la presencia de una variada tipología
de fuentes y recursos de información biomédica seleccionados por
expertos, como revistas electrónicas, libros, obras de referencia y otros
documentos.
De los 76 motores relacionados, 54 presentan su interfaz únicamente en inglés, 16 en español, 4 en inglés y español, 1 en inglés y francés y 3 en español, inglés y portugués. Resulta interesante, también, que existen metabuscadores y multibuscadores especializados en salud. Algunos ejemplos son:
Hardin Meta Directory of Internet Health Sources
BioResearch
Medical Search Engines
MedBot
No cabe dudas de que la información sobre salud en Internet, de mayor
calidad y valor añadido, es accesible desde los buscadores especializados.4,8,14
Dichas herramientas son muy parecidas a los motores temáticos o índices,
pero como su nombre lo indica, sólo se refieren a un tema concreto. En
realidad no logran profundizar mucho dentro del océano de información
existente en la red, pero reducen considerablemente la recuperación de
documentos irrelevantes, algo muy importante para el usuario final. Ellos facilitan
el acceso a múltiples recursos con información biomédica
y complementan las grandes bases de datos biomédicas en línea
como Medline, Current Contents, LILACS, Biosis y otras. Al mismo tiempo,
no deben olvidarse las secciones de salud en los directorios de los grandes
o pequeños motores de búsqueda, que contienen información
especializada de interés.
Como resultado de las actuales tendencias en el desarrollo de servicios de valor agregado, diversos sitios conocidos sólo como buscadores en el web, han evolucionado hacia una fase superior y diferente: los portales de Internet. Ellos mantienen sus objetivos iniciales de apoyo a la búsqueda de información, pero han ampliado considerablemente sus posibilidades, al contar con servicios cada vez más personalizados y de mayor diversidad, particularmente en el llamado comercio electrónico. Los portales han revolucionado la concepción de los buscadores, de modo que el usuario final encuentra en ellos varias alternativas como: suscribirse a un boletín, un forum o una lista electrónica; realizar una transacción comercial; revisar su correo electrónico; en fin, que constituyen verdaderos escenarios multipropósito. Entre ellos, se encuentran los conocidos motores Yahoo y Altavista.6,35,36
Anexo. Relación de motores de búsqueda en salud
Recibido: 11 de abril del 2003. Aprobado: 24 de abril del 2003
Lic. Reinaldo Rodríguez Camiño. Cátedra de Informática
Médica. Escuela Latinoamericana de Medicina.
Ave. Panamericana Km 3 ½. Santa Fe, Playa. Ciudad de La Habana. CP 19
108.
Correo electrónico: reinaldo@elacm.sld.cu
1
Licenciado en Información Científico-Técnica y Bibliotecología.
Cátedra de Informática Médica. Escuela Latinoamericana
de Medicina.