lunes, 7 de marzo de 2016

Estrategias para recuperar información.



Capítulo 6

Estrategias para recuperar información.






Se trata de un campo dedicado a la adquisición, organización y búsqueda de la información basada en el conocimiento. Con los sistemas de recuperación de información y el contenido en línea, las bibliotecas digitales han cambiado sustancialmente.

Los sistemas de RI, almacenan y difunden información basada en el conocimiento. Hablando de investigación clínica, esta información proporciona conocimiento obtenido en observaciones, el cual es susceptible de aplicarse a pacientes.

El uso de sistemas RI y bibliotecas digitales se ha vuelto ubicuo en la época actual. Internet y la Web tienen un profundo impacto en la publicación de información basada en el conocimiento.

Contenido.

Es conveniente clasificar la información para comprender mejor su estructura y función. La primera categoría consiste en contenido bibliográfico, que consiste en citas o indicadores referentes  a la bibliografía médica. Un segundo tipo más moderno de contenido bibliográfico es el web catalog, que son páginas electrónicas que contienen vínculos a otras páginas y sitios web como HealthFinder o el Open Directory.

Un tipo final consiste en transmisiones RSS, que son resúmenes cortos del contenido en la Web, casi siempre noticias, artículos de revistas, notas de un blog  y otros contenidos.

El segundo tipo de contenido consiste en el contenido de texto completo, consiste en las versiones en línea de libros o publicaciones periódicas.  Los libros de texto electrónicos ofrecen características adicionales a las de la versión impresa.

La tercera categoría consiste en el contenido comentado, que puede dividirse en tipos discretos como: base de datos de imágenes, de datos genómicos, referenciales, medicina basada en evidencias, entre otras.

Las bases de datos de referencias bibliográficas proporcionan vínculos con artículos que citan a otros en toda la bibliografía científica.

La última categoría consiste en acumulados del contenido de las primeras tres categorías, que cubre distintas necesidades de los usuarios.

Indexación.

Es el proceso de asignar metadatos al contenido para facilitar su recuperación. Hay indexación manual y automática.
Los buscadores generales como Google y Microsoft Bing buscan estrategias basadas en palabras y variantes del algoritmo PageRank para su indexación.

Recuperación.

Existen 2 estrategias principales. La primera es la búsqueda de una concordancia exacta, que otorga al usuario el control preciso de los elementos recuperados; la búsqueda por concordancia parcial, intenta devolver al usuario contenido ordenado según la cercanía con su búsqueda.
En la búsqueda por concordancia exacta, el sistema RI proporciona al usuario todos los documentos que concuerden exactamente con los criterios especificados en las estrategias de búsqueda. El primer paso es seleccionar los términos para formar conjuntos, después se combinan con los operadores booleanos.

La búsqueda por concordancia parcial permite ingresar sólo unos cuantos términos y empezar a recuperar documentos. En la concordancia parcial los documentos también pueden usarse por su relevancia para la búsqueda por jerarquización.

PubMed es el sistema de la NLM que explora Medline y otras bases de datos bibliográficos.  Cada vez más buscadores permiten explorar en muchos recursos.

Casi toda la bibliografía médica del mundo está disponible en internet, aunque no toda está disponible para todos, con el conocimiento y las habilidades para buscar este contenido, los médicos pueden volverse más efectivos y eficientes.

No hay comentarios:

Publicar un comentario