Educación Social & Nuevas Tecnologías (NTIC)

CÓMO BUSCAR INFORMACIÓN RELEVANTE EN INTERNET (I)

Posted in buscadores by Juan A. Pérez on 13 abril 2009

Primero fue el lenguaje (“Y en el principio fue el verbo“), después la escritura, después la imprenta y el libro como soporte del conocimiento. Hoy el código dominante es el binario y su soporte es de tipo electrónico. Desde la aparición de la imprenta, el libro ha sido el medio fundamental de divulgación y conservación de la información, del conocimiento y de la cultura. La utilización del formato papel facilita su uso y lectura sin necesidad de equipamientos especiales. Con el advenimiento de las NTIC (código binario, el PC, los satélites, el teléfono móvil, el Asistente Digital Personal o PDA (Personal Digital Assistant), el e-Book o la PDI (Pizarra Digital Interactiva) se plantea la posibilidad de que el papel deje de ser el soporte privilegiado.

.

Buscar, encontrar, analizar y evaluar la información y el conocimiento que podemos encontrar en la WWW representa todo un reto para la sociedad de la información y del conocimiento. Internet se ha convertido en menos de una década en la mayor biblioteca del mundo, es toda una enciclopedia donde encontrar todo tipo de temas, textos, imágenes, videos, audio, animación, artículos, noticias y muchísima información basura. El uso profesional o simplemente eficiente y relevante de la biblioteca virtual de Internet requiere conocimientos y estrategias de búsqueda. La ingente cantidad de información que los buscadores tienen indexados desborda las capacidades de cualquier persona o colectivo de personas: Google, por ejemplo, tiene indexadas 1,000,000,000,000 de URL (páginas Web únicas). Lo que todavía no se sabe con exactitud es el número de páginas no indexadas. Hay mucha información, muchísima. Es necesario conocer las características de la información digital y las metodologías y técnicas de búsqueda adecuadas a las nuevas formas de guardar, clasificar, consultar y recuperar la información.

.

.

Características de los documentos digitales respecto a los analógicos.

.

Siguiendo lo señalado por Lluís Codina, comentemos brevemente las características y diferencias de la información digital respecto a la información analógica:1

.

Características de la información digital.

.

Reusabilidad

La información puede ser actualizada, modificada, copiada, editada y, especialmente, reutilizada.

Interactividad

Se puede establecer un cierto tipo de “comunicación” entre el usuario y los diferentes sistemas informáticos.

Recuperabilidad

Independientemente del volumen de información a consultar su búsqueda es fácil y rápida.

Virtualidad

La información se difunde a gran escala con el mínimo coste económico. La virtualidad permite una utilización “multiusuario” de la información.

Se abaratan los costos de publicación y distribución al poder almacenar grandes cantidades de información en soportes con un mínimo espacio físico.

.

Características de la información analógica.

..


Accesibilidad

Mas allá del soporte físico (ej. libro) no se requiere de ningún dispositivo para la lectura de documentos.

Actualización

La actualización de la información plantea serias dificultades.

Densidad

La densidad de información es proporcional al espacio físico existente. El espacio del soporte digital es inmensamente menor al soporte de papel (páginas versus bytes).

Buscabilidad / Interactividad

La información analógica requiere una lectura secuencial (desde el principio hasta el final) para no perder el significado del contenido del documento.

Durabilidad (Tiempo de vida del soporte)

El papel ha demostrado ser un soporte perdurable a lo largo del tiempo (archivos, bibliotecas).

Autenticidad (del soporte)

El soporte analógico presenta un elevado grado de autenticidad: no puede ser manipulado sin que se note.

Ergonomía

Elevada calidad estética respecto al uso y funcionalidad del soporte.

.

.

Aunque el uso del papel sigue siendo dominante y probablemente no desaparezca, las ediciones electrónicas van en aumento y ganando terreno al papel día a día: páginas Web, e-libros, e-revistas o bases de datos electrónicos. Las características de la información digital están modificando las formas en que se accede al conocimiento, en cómo se aprende o al cómo se enseña. Las NTIC facilitan el manejo de la información, su gestión, su análisis, su almacenamiento o su recuperación. Conocer las características de la información digital facilita el uso profesional de las nuevas herramientas digitales. La reusabilidad, interactividad, densidad, recuperabilidad y virtualidad en su conjunto facilitan nuevos usos educativos, mejoran las formas de transmisión y de adquisición de contenidos que se pueden leer, ver, oír o con los que se puede interactuar. La información digital opera en dimensiones distintas a las del formato de texto e imagen sobre papel.

.

.

Gestión de documentos electrónicos.

.

Indexación.

.

El proceso por el cual se ordenan y clasifican los datos (electrónicos o en papel) se denomina indexación: indexar (1. tr. Hacer índices. 2. tr. Registrar ordenadamente datos e informaciones, para elaborar su índice. Real Academia Española). Los motores de búsqueda, los tesauros o las bases de datos organizan y clasifican la información de diferentes formas. Obtener una búsqueda rápida, efectiva, relevante y pertinente a nuestras demandas de información requiere necesariamente el uso de unos sistemas previos de indexación. La indexación consiste en la previa selección de los conceptos o descriptores clave para su posterior recuperación. Los elementos indexados dependerán del tipo de recurso y suelen ser: el autor, título, editorial, año publicación, dirección URL, enlaces, palabra o conjunto de palabras clave o significativas del título, texto…

.

Cuando realizamos búsquedas en Internet nos enfrentamos a ingentes cantidades de información que se han de filtrar. Este proceso de filtrado rápido es posible porque previamente ha habido un tratamiento documental de la información, se ha indexado. La indexación puede ser automática (realizada por máquinas) o intelectual (interviene un ser humano y se utiliza un modelo que da valor a lo semántico). La indexación automática persigue reflejar la indexación intelectual dándose cada día más relevancia a la Web Semántica (Web 3.0).

.

Decíamos que Google tiene indexadas 1,000,000,000,000 de páginas Web lo que todavía no se sabe con exactitud es el número de páginas no indexadas. Algunos conceptos que hay que tener en cuenta al realizar una búsqueda:

.

  • Ruido. En una búsqueda de información es la no relacionada con lo que buscamos o con muy poca relevancia para nosotros pero que los buscadores nos la presentan como relevante.

  • Silencio. Es el conjunto de documentos que siendo relevantes no nos es proporcionado por el buscador. Es información que estando en la Red no aparece en nuestra búsqueda (no está indexada, no está correctamente indexada o no la buscamos apropiadamente).

  • Basura. Información que no tiene nada que ver con los términos de nuestra búsqueda. Información redundante (repetida), insignificante, sin relevancia. Información falsa o desinformación.

  • Relevancia de la información. Importancia, pertinencia y utilidad que se le asigna a una información:

      a) según el sistema que nos devuelve un resultado.

      b) según la persona que realiza la búsqueda.

.

Parece conveniente conocer los elementos que cada sistema determina como relevantes. Cosa que complica la tarea dado que cada sistema de búsqueda utilizará sus propios métodos de relevancia para la indexación o para las búsquedas. Motivo por el cual es necesario consultar las características de “búsqueda” y “búsqueda avanzada” de cada buscador.

.

¿Cómo definir relevante, útil o pertinente una información o un conocimiento? Difícil y conflictivo debate determinar qué es o no es relevante. Cada sistema de búsqueda tiene su propio método, sus algoritmos o sus formulas matemáticas (secretas o no). No hay ningún estándar de relevancia de la información. En última instancia es quien realiza la búsqueda quien define los resultados obtenidos como relevantes, pertinentes, útiles o no. Esto conlleva, por una parte, ciertos riesgos de relativización de la relevancia de la información y, por otra, una mayor democratización respecto de lo que se puede considerar relevante o no.

.

Dado el nuevo paradigma que plantea la posibilidad de producir conocimientos por parte de los usuarios de la Red parece obvio reflexionar sobre cuestiones como dónde está la relevancia de una información (en la fuente o en el contenido). Otro tema sobre el que habrá que reflexionar es sobre la información basura y los riesgos de convertir la Red en un basurero semejante a la televisión actual.

.

.

1 CCodina Bonilla, Ll. (2001).Las propiedades de la información digital. Revista: “El profesional de la información”, Nº 12; Vol.10.
Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.