Unidad III
Conceptos Generales del
2.3 a 2.4.1
Consulta de información 2.3
•
Un buscador es una página web en la que se ofrece consultar una base de
datos en la cual se relacionan direcciones de páginas web con su contenido.
Su uso facilita enormemente la obtención de un listado de páginas web que
contienen información sobre el tema que nos interesa.
Origen.
•
El origen de los buscadores se remonta a abril de 1994, año en el que una
pareja de universitarios norteamericanos (David Filo y Jerry Yang) decidieron
crear una página web en la que se ofreciera un directorio de páginas
Direcciones URL
•
URL es una dirección única que poseen todos los elementos en
Internet, es decir que literalmente existe una URL por cada página,
imagen, video y documento en Internet, lo que nos permitirá ubicarlos
fácilmente gracias que la información que contiene. Siempre que
visitemos una página web, será a través de su URL y en cada
oportunidad en que pulsemos sobre cualquier enlace que contenga la
página o sitio, también nos dirigirá a otra U
•
RL. URL
Partes de una dirección.
° HTTP://: Protocolo de transferencia de hipertexto (Hypertext Transfer Protocol). Le
indica al navegador que tipo de información va a recibir para interpretarla y mostrarla
adecuadamente.
Es importante poner el prefijo www para acceder al sitio correcto.
WWW: significa World Wide Web.
. .NET. El proceso de registro de un nombre de dominio puede variar de acuerdo a la
clasificación Sin embargo independientemente de la clasificación, para realizar el registro
•
En esta sección podrás encontrar información de los
siguientes para realizar el procesos de registro.
•
Nombres de dominio de Clasificación Abierta:
•
Los nombres de dominio de Clasificación Abierta
son aquellos que pueden ser registrados por
cualquier persona física o moral que lo solicite, a
continuación listamos las clasificaciones abiertas
que puedes registrar:
•
.MX, .COM.MX, .ORG.MX, .LAT, .COM, .NET, .CC
•
ESTAS SON EXTENSIONES DE ALGUNOS PAISES :
•
Estados Unidos: .US
•
Uruguay: .UY
•
Brasil: .BR
•
China: .CN
•
Chile: .CL
Motores de búsqueda…
•
Un motor de búsqueda o buscador es, en términos generales, un
sistema encargado de buscar archivos almacenados en los servidores
web. Para encontrar tales archivos, los buscadores recurren a la
identificación de la palabra clave empleada por la persona que realiza la
búsqueda y, como resultado, el usuario obtiene una lista de enlaces que
direccionan a sitios web en los que se mencionan los temas relacionados
a la palabra clave.
•
Los motores de búsqueda se clasifican principalmente en 3 tipos:
•
Buscadores Jerárquicos
•
Directorios
Buscadores Jerárquicos
•
Buscadores jerárquicos (Arañas o
Spiders
)
•
Recorren las páginas recopilando información sobre los contenidos de las
páginas. Cuando se busca una información en los motores, ellos consultan
su base de datos y presentan resultados clasificados por su relevancia. De
las webs, los buscadores pueden almacenar desde la página de entrada, a
todas las páginas que residan en el servidor.
•
Si se busca una palabra, por ejemplo, “ordenadores”. En los resultados que
ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta
palabra en alguna parte de su texto.
•
Si consideran que un sitio web es importante para el usuario, tienden a
registrarlas todas. Si no la consideran importante, sólo almacenan una o
más páginas.
•
Cada cierto tiempo, los motores revisan los sitios, para actualizar los
•
Los buscadores jerárquicos tienen una colección de programas
simples y potentes con diferentes cometidos. Se suelen dividir
en tres partes. Los programas que exploran la red -arañas
(spiders)-, los que construyen la base de datos y los que utiliza
el usuario, el programa que explota la base de datos.
•
Si se paga, se puede aparecer en las primeras páginas de
resultados, aunque los principales buscadores delimitan estos
resultados e indican al usuario que se trata de resultados
esponsorizados o patrocinados. Hasta el momento,
aparentemente, esta forma de publicidad es indicada
explícitamente. Los buscadores jerárquicos se han visto
Directorios
•
Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se
requieren muchos recursos de informática. En cambio, se requiere más soporte humano y
mantenimiento.
•
Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados como
una colección de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran
algunos de los datos de nuestra página, como el título y la descripción que se introduzcan al momento de
registrar el sitio en el directorio.
•
Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al
directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por
operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del
tema de nuestro interés.
•
Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo
referencia a los contenidos y temática del sitio.
•
Su tecnología es muy barata y sencilla.
•
Ejemplos de directorios: Antiguos directorios,
Open Directory
Project,
Yahoo
!, Terra (antiguo
Olé
). Ahora,
Metabuscadores
•
Los buscadores (“Search Engine”), entre otros componentes,
constan de grandes bases de datos donde se almacena la
información que sus robots de búsqueda extraen de la red. Cada
buscador está configurado bajo una serie de parámetros que
cada compañía considera los más adecuados para ordenar las
búsquedas y mostrar los resultados.
•
•
Hoy por hoy, los buscadores más conocidos son
,
Bing
y
http://www.zapmeta.com/
Es uno de los que más me gustan por su rapidez y por la cantidad de buscadores a los que consulta. Además, incluye búsqueda organizada en “clusters” que pueden ayudar a filtrar
aun más los resultados.
http://www.zuula.com/
La diferencia con zapmeta es que te permite saber de dónde está extrayendo la información. Además, tiene la ventaja de poder buscar por “tags” y buscar dentro de “blogs”. Para mi
gusto, es uno de los más completos.
http://www.soovle.com/
Es uno de los meta-buscadores más originales que he visto en su visualización. Lo que le diferencia de los demás, además de cómo muestra el contenido, es que en “Engine” puedes
definir en qué buscadores quieres que consulte.
http://www.metacrawler.com/
Es uno de los más conocidos porque lleva mucho tiempo y es muy estable. Consulta en Google, Bing y Yahoo. Te permite buscar datos de contacto en “Páginas amarillas” y
“Páginas blancas”.
http://yippy.com/
Este metabuscador tiene la peculiaridad de organizar el contenido en forma de “cluster” lo que facilita mucho el filtrado en determinados momentos. Permite la búsqueda en “blogs”.
http://www.entireweb.com/
Es muy ágil e incluye búsquedas en tiempo real dentro de Twitter. La configuración avanzada es muy completa permitiendo idiomas, países y línea temporal.
http://vroosh.com/
Incluye búsquedas en FTP. Tiene parámetros de configuración bastante flexibles al permitir búsquedas por país.
http://iboogie.com/
Para mi gusto es otro de los mejores. Realiza búsquedas organizadas en “cluster” y tiene un motor muy potente. Además, puedes añadir pestañas solicitando buscar en bases de datos
concretas que tienen a disposición del usuario (no sólo de buscadores, sino también de “webs”).
http://polymeta.com/
Otro que organiza el contenido en “clusters”. Me gusta mucho su visualización. En una sola búsqueda puedes ver enlaces, vídeos, imágenes y socialmedia. Además, te permite elegir
las bases de datos en las que deseas rastrear.
http://www.dogpile.com/
Es muy ligero y rápido. Tiene un sistema de configuración muy sencillo con un sistema de filtrado de contenido que puedes configurar en débil, medio y fuerte.
http://duckduckgo.com/
Me gusta especialmente el hecho de que muestra los icono de dónde extrae la información. Así sabes de un vistazo si es un blog, una web, un slide, etc. Detecta cuáles son las otras
palabras más utilizadas en relación con la keyword que se busca y te las sugiere.