Educación Social & Nuevas Tecnologías (NTIC)

CÓMO BUSCAR INFORMACIÓN: SISTEMAS DE BÚSQUEDA (III).

Posted in buscadores, General by Juan A. Pérez on 10 diciembre 2009

.

Sistemas de búsqueda: herramientas para navegar, buscar y encontrar información en la Red.

.

Buscar información en la Red puede resultar complicado tanto por la cantidad de información existente como por la forma de su indexado o por no estar indexada. La navegación a través del hipertexto ha creado la necesidad de utilizar herramientas que nos ayuden en los procesos de búsqueda. Hay dos formas de buscar información en Internet: la primera, con navegadores y, la segunda, utilizando un buscador o una base de datos. El uso de buscadores y bases de datos es imprescindible para poder buscar y encontrar información de nuestro interés entre la ingente cantidad de información que hay en Internet. Sólo podemos prescindir de los buscadores si conocemos de antemano la URL del sitio específico a consultar. Los buscadores se han convertido en herramientas básicas en la búsqueda de información en formato electrónico. De hecho, los buscadores se han convertido en el punto de partida para la realización de búsquedas de información y para la simple navegación.

.

.

Antecedentes.


A principios de los 90 aparece la necesidad de contar con herramientas que ayuden a buscar y encontrar información y documentos en Internet. Aparecen los primeros índices temáticos con colecciones de páginas. Una breve historia de los buscadores la podemos ver en el siguiente recuadro:


1990

Archie. Buscador de archivos alojados en servidores FPT públicos.

1991

Paul Lindner y Mark P. McCahill de la Universidad de Minnesota crean Gopher: el primer motor de búsqueda que incorporaba el hipertexto.

1992

Aparece, Veronica, de la Universidad de Minnesota: herramienta de búsqueda para Gopher.

1993

Wandex (el primer buscador desarrolado por Mattew Gray en el MIT. Aliweb.

1994

Elnet Galaxy. JumpStation. Yahoo (índice). WebCrawler (primer motor de búsqueda de texto completo). InfoSeek. Lycos. RBSE.

1995

MetaCrawler. Exite. LookSmart. Altavista.

1996

Hotbot-Inktomi. Ask Jeeves. Backrub-Google.

1997

Norther Light

1998

Google. MSN Search. ODP-DMOZ

1999

AllTheweb. Baidu.

2000

Teoma.

2004

Yahoo (buscador)

2005

Windows Live.

.

Los orígenes de los buscadores de información en Internet  suelen remontarse al año 1994: aparece Elnet Galaxy, JumpStation, Yahoo (índice), WebCrawler (primer motor de búsqueda de texto completo), InfoSeek, Lycos o RBSE. Aunque anteriormente habían existido algunos buscadores como Archie (1990), Gopher (1991), Veronica (1992) o Wandex y Aliweb (1993). Google aparece en 1996.

.

.

Funcionamiento.

.

Un motor de búsqueda o buscador (search services) es un sistema informático que busca la información almacenada en servidores Web y BdD indexando (clasificando) archivos (direcciones, contenidos, datos) en su propia Base de Datos. Los buscadores localizan la información comparando las coincidencias entre la información que busca el usuario y la que existe en su base de datos. El proceso que realizan los sistemas de búsqueda se puede resumir en tres fases:

.

  • Recopilación y análisis de datos (indexar y clasificar).
  • Búsqueda.
  • Recuperación.

.

Fuente: López Franco, José Manuel. Funcionamiento de un buscador. [En línea: http://trevinca.ei.uvigo.es/~txapi/espanol/proyecto/superior/memoria/node207.html]. [Fecha de consulta: 1 de octubre de 2009].

.

.

Los buscadores nos presentan un cuadro de diálogo en el cual podemos realizar dos tipos de búsqueda:

  • Búsqueda simple: se realiza a partir de una o varias palabras clave.
  • Búsqueda avanzada: se realiza combinando la palabra o palabras clave con los operadores lógicos de interrogación propios de cada sistema.

.

.

Es habitual que los buscadores y algunas bases de datos presenten la posibilidad de realizar las búsquedas tanto a partir de palabras clave como utilizando índices temáticos o tesauros (browsing services). La mayoría de buscadores tienen prestaciones similares aunque las técnicas de búsquedas y el uso y la sintaxis de los operadores lógicos pueda variar de unos a otros. También suelen complementar sus prestaciones con otros servicios como noticias, imágenes, videos, grupos, etc. Si bien, la mayoría de buscadores presentan ciertas similitudes las diferencias señaladas hacen necesaria la consulta de opciones en los apartados correspondientes como Búsqueda Avanzada, Ayuda o Preguntas Más Frecuentes.

.

En relación a la búsqueda de información por Internet conviene resaltar la importancia de los Metaelementos del lenguaje HTML, siglas de HyperText Markup Language (Lenguaje de Marcas de Hipertexto). Este lenguaje de programación permite la clasificación y recuperación de documentos atendiendo a diferentes atributos. Algunos de estos elementos que nos proporciona el lenguaje HTML pueden ser las siguientes etiquetas (o tags) META:

.

  • <META name=»Author» content=»Juan A. Pérez»>. El atributo “name” expresa el tipo de metainformación y el atributo “content” indica el contenido de la misma.
  • <META name=“description” content=“Buscar información en Internet” (descripción de la página)>.
  • <META name=»Keywords» content=»Búsqueda de información, recuperación de información, motores de búsqueda, índices temáticos, tesauros»> Con esta etiquetas se especifican las palabras clave de cada página o documento electrónico...

.

Estos y otros atributos META nos permiten clasificar y etiquetar los documentos para su indexado y posterior recuperación.

.

.

Cómo se presentan los datos.

.

La información que nos presentan los buscadores suele estructurarse como sigue:

.

  • Título. El título se presenta de forma destacada y en forma de enlace hacia la página en cuestión.
  • URL. Buscador Uniforme de Recursos (Uniform Resourse Locator) Dirección electrónica de la página Web.
  • Descripción. Breve descripción con algún fragmento de la página resaltando la palabra clave utilizada en la búsqueda.
  • Páginas similares y caché. Se suele presentar alguna copia guardada en memoria caché del buscador y enlaces a páginas similares.

.

Ej.: En la siguiente imagen podemos ver la estructura de Presentación de la información en el buscador Google.

.

Presentación de la información en Google

.

.

Tipología de Buscadores.

.

La apariencia o funcionalidad de los buscadores de la Red suelen ser muy similares pero la experiencia nos demuestra que hay diferencias significativas en los resultados que nos presentan. La clasificación más general nos señala dos tipos: índices temáticos o directorios y motores de búsqueda. A. Delgado Domínguez nos señala las diferencias entre estos dos tipos de buscadores:

.

Descubrimiento de recursos

Representación del contenido del documento

Representación de la consulta

Presentación de los resultados

Directorios

La realizan personas

Clasificación manual

Implícita (mediante navegación por las categorías)

Páginas creadas previamente a la consulta.

Poco exhaustivos, muy precisos.

Buscadores

Principalmente de forma automática mediante robots

Indización automática

Explícita

(mediante palabras clave o conceptos, operadores, delimitadores, etc.)

Páginas creadas de forma dinámica para cada consulta.

Muy exhaustivos, poco precisos.

Fuente: Delgado Domínguez, A. Mecanismos de recuperación de información en la WWW. Directorios versus buscadores. [En linea: http://servidorti.uib.es/adelaida/tice/modul6/memfin.pdf%5D. [fecha de consulta: 1 de octubre de 2009].

.

Una clasificación más amplia y habitual de los buscadores suele ser la siguiente:

.

  • Índices temáticos, tesauros o directorios (browsing services). Son sistemas de clasificación y búsqueda organizados por temas o categorías jerarquizadas. Los tesauros son lenguajes controlados y estructurados cuyos términos guardan ente sí relaciones semánticas y genéricas (equivalencia, jerarquía, asociativa): son sistemas estandarizados (norma ISO 2788-1986). También suelen incluir búsquedas por palabra/as clave/es. Los índices, directorios y tesauros son bases de datos de direcciones Web, de documentos o de datos que han sido elaboradas manualmente, osea, que la asignación a una categoría o tema la establece una persona. Ejemplo de directorios son: Yahoo, Dmoz o Galaxy.

  • Motores de búsqueda o buscadores automáticos. Son sistemas de búsqueda a partir de palabras clave. Estos sistemas buscan e indexan páginas de la Red automáticamente a través de robots. Algunos motores de búsqueda son: Google, Yahoo, Bing, Ask Jeeves, A9, Altavista , Fast o WiseNut.

  • Los metabuscadores (metasearch engine) . Permiten realizar búsquedas en diferentes buscadores a la vez desde una  entrada única. Nos ofrece la información recuperada en una presentación única. La información presentada es previamente filtrada y ordenada según sus propios criterios de relevancia.

  • .

Ixquick:

http://www.ixquick.com/

Buscamultiple :

http://www.buscamultiple.com/

All4one Search Machine:

http://www.all4one.com

Biwe:

http://www.biwe.com/

Copernic:

http://www.copernic.com/

Dogpile

http://www.dogpile.com/

Vivisimo

http://vivisimo.com/

MetaCrawler:

http://www.metacrawler.com/

C4.com:

http://www.c4.com/

Search:

http://www.search.com/

Oneseek

http://www.oneseek.com/search.htm

Profusion

http://www.profusion.com/

NetaEureka

http://www.metaeureka.com/

Fuente: Lamarca Lapuente, M.J. “Hipertexto: Un nuevo concepto de documento en la cultura d e la imagen”. “Principales buscadores”. [Documento en línea]. [http://www.hipertexto.info/documentos/princip_buscad.htm#fuentes ]. [Fecha de actualización: 03/12/2009]. [Fecha de consulta 15/12/2009].

.

  • Multibuscadores (multi-search engine). Presentan un listado de buscadores desde los que poder realizar las búsquedas. Hay que introducir los términos de la búsqueda en cada uno de los buscadores. No filtran ni ordenan los resultados.

.

Tingloop

http://www.tingloop.com/buscadores/buscadores_espanoles.htm

Geoticies

http://www.geocities.com/SiliconValley/Vista/7673/

Mr Sapo

http://www.mrsapo.com/

Search Engines

http://www.search-engines-2.com/

Fuente: Lamarca Lapuente, M.J. “Hipertexto: Un nuevo concepto de documento en la cultura d e la imagen”. “Principales buscadores”. [Documento en línea]. [http://www.hipertexto.info/documentos/princip_buscad.htm#fuentes ]. [Fecha de actualización: 03/12/2009]. [Fecha de consulta 15/12/2009].

.

.

..

Es especialmente importante evaluar adecuadamente los sistemas que realizan sus clasificaciones estricta o parcialmente con criterios publicitarios, comerciales y de rentabilidad. También conviene evaluar los criterios ideológicos. Obviamente, el orden en que los resultados son presentados es un factor importante dado que la mayoría de personas que realizan una consulta no suelen pasar de los 20 o 30 primeros resultados. Teóricamente, por lógica booleanea, cuanto más nos alejamos de los primeros resultados menos posibilidades tenemos de obtener resultados relevantes según nuestra ecuación de búsqueda.

.

.

Ranking de buscadores.

.

Ranking del uso de buscadores durante noviembre de 2009. Fuente: Stat Counter Global Stats

.

.

Análisis del buscador Google.

.

Google es con diferencia el buscador más utilizado en todo el mundo. Actualmente tiene indexadas más de un billón de páginas en sus bases de datos sobre las cuales realiza sus búsquedas. Las búsquedas en Google se pueden realizar, bien, a través del cuadro de diálogo, bien, a través del directorio del buscador. La relevancia en Google es una operación de ingeniería compleja (y secreta) que se basa en la tecnología RagePank combinada con otras técnicas y que determinan el lugar en que los resultados serán mostrados. Según Google, los resultados se presentan por orden de relevancia según el RagePank y no están condicionados por cuestiones comerciales.

.

.

Cuadro de diálogo.

.

.

.

Directorio de Google

.

.

Otras funcionalidades complementarias a la búsqueda general en la Web que Google nos proporciona :

.

  • Buscador de videos.
  • Buscador de imágenes.
  • Buscador de de mapas.
  • Buscador de noticias.
  • Buscador de grupos.
  • Buscador de blogs.
  • Buscador de libros.
  • Integración con el correo gmail.
  • Traducción a otros idiomas.
  • Fotos.
  • Docs.
  • Reader.
  • Sites.
  • Nos proporciona recursos para realizar búsquedas avanzadas y herramientas del idioma (selección de idiomas, traducción de textos o de URL concretas).

.

.

Opciones de búsqueda avanzada en Google.

.

.

Cuadro de diálogo y sintaxis de Google.

.

Idioma

Interfaz de búsqueda y resultados en todos los idiomas seleccionados.

Acentos

La búsqueda Google en español no distingue acentos diacríticos y diéresis.

Mayúsculas / minúsculas

No es “sensible”: no distingue entre mayúsculas y minúsculas.

Palabras vacías

Ignora las palabras vacías y términos superfluos como “http” , “.com”, ”.es”, ”.cat” …

Para distinguirlos se debe utilizar el signo ”+”.

Truncamiento

No tiene operador de truncamiento para buscar derivaciones de una raíz o plurales (se deben escribir todos los términos que deseemos buscar).

P. ej.: «casa», «casita», «caserón»; casa, casas.

Operadores booleanos

AND

El uso de AND es por defecto (espacio en blanco entre palabras).

_

Utiliza el guión para excluir el término que lo acompaña.

NOT = «-«

P. Ej.: educación social -cursos (excluye el término cursos).

OR

Posibilita la búsqueda de una u otra opción.

P. ej.: educación social (adicciones OR drogas)

Operadores de proximidad

Frase

Permite la búsqueda exacta de una expresión si incluimos las palabras entre comillas.

P. ej.: «Si vis pacem, para pacem»

Operadores de rango

Fecha

Con la opción fecha del menú desplegable podemos buscar en un intervalo de fechas concreto.

Búsqueda por campos

Permite la búsqueda según:

* El tipo de archivo (“.doc”, “.pdf”, “.htm”, «ppt»…)
* Busca el término en la URL, en el título, en el contenido o vínculos hacia esa página.
* Un dominio concreto. P. ej.: “
https://signos21.wordpress.com

.



4 respuestas

Subscribe to comments with RSS.

  1. Juan said, on 22 diciembre 2009 at 8:44 pm

    La publicidad que aparece y desaparece en este post es obra y gracia de ads google. No es publicidad solicitada ni permitida. Manipulan los programas para colocar publicidad impunemente.

  2. Marcela Montante Piña said, on 10 junio 2012 at 5:17 pm

    Su documento me ayudó a comprender mejor el tema, gracias.

  3. Johne411 said, on 22 May 2014 at 7:47 pm

    Hey very nice website!! Man .. Beautiful .. Amazing .. I’ll bookmark your website and take the feeds alsoI’m happy to find numerous useful information here in the post, we need work out more techniques in this regard, thanks for sharing. . . . . . dgeedbdadaee

  4. Paula R.U said, on 19 abril 2016 at 10:00 am

    La búsqueda de fuente de información en internet es importante desde donde la hagamos, ya que nos podemos encontrar con mucha información errónea, incompleta o simplemente que no esté actualizada.
    Este post me parece que nos da información de las distintas herramientas de búsqueda de información en internet, pero para completar un poquito os dejo aquí un enlace donde podreis ver sitios seguros para encontrar información fiable:

    http://es.ccm.net/faq/7029-encontrar-fuentes-de-informacion-confiables-en-internet, y para completar un poco el contenido de este post las siguientes herramientas: bibliotecas online como the free library, gallica o questia; o herraminetas específicas de Google como Google Libros o Google Académico.


Deja un comentario