Mario Val Perrone – Regina Mot z
Eva lu a ción de M ot or e s de Bú squ e da e n I n t e r n e t
Universidad ORT, Mont evideo, Uruguay
e- m ail:
Re su m e n
El present e art ículo incluye docum ent ación de Mot or es de Búsqueda obt enida de dist int as fuent es y det alla las principales caract eríst icas de ellos, así com o t am bién cuáles son los m ej or es m ét odos a em plear para la inclusión de sit ios w eb en las bases de dat os de est os, de la form a m ás eficient e.
El principal fundam ent o y aplicación del present e art ículo, será el explicar el funcionam ient o de los m ot ores de búsqueda y el servir de guía para el desarr ollo de sit ios w eb con el fin que at raigan eficient em ent e a los m ot or es de búsqueda y Spiders.
1 I n t r oducción
La publicación de infor m ación en la w eb es cada día m as volum inosa. El obj et ivo de quienes publican su inform ación en I nt ernet , ya sea por m ot ivos com erciales o cult urales, es que ella llegue al m ayor num ero de nav egant es posibles ( ent endiéndose por navegant e, a un usuario de I nt ernet ) . Sin em bargo, el descubrim ient o de su sit io por part e del usuario dependerá fundam ent alm ent e de la indexación que sobre el realicen los m ot or es de búsqueda ut ilizados.
El principal obj et ivo de est e t r abaj o es evaluar el desem peño de dist int os m ot ores de búsqueda de sit ios Web con el fin de brindar direct ivas de diseño para lograr una indexación eficient e, o sea, ser cat alogados por la inform ación que consideram os relevant e y aparecer en un ranking de alt o por cent aj e por búsqueda de esa inform ación.
Tom ar decisiones fundam ent adas a la hora de evaluar los dist int os m ot ores de búsqueda y de diseñar un sit io Web para lograr una indexación eficient e es im port ant e consider ando que de a cuerdo a dat os ext raídos de Se a r h En gin e W a ch .com :
• el 75% de los nav egant es ut ilizan m ot or es de búsqueda al ingresar a I nt ernet .
• el 46% de los nav egant es, acceden a sit ios nuevos a t rav és de m ot ores de búsqueda.
• el 57% de los nav egant es r ealizan al m enos 1 búsqueda al día.
• el 42% de los nav egant es que realizan com pras online, acceden a los sit ios de v ent a a t rav és de m ot ores de búsqueda.
• 1 de cada 28 páginas visualizadas en I nt ernet es el r esult ado de una búsqueda. ( 3.5% del t ot al)
• El t rabaj ador prom edio que ut iliza I nt ernet , pasa 73 m inut os al m es en los m ot ores de búsqueda.
seguir para que un sit io w eb figure en los m ot ores de búsqueda en los prim eros lugares.
El rest o del t rabaj o se organiza de la siguient e m anera. En la sección 2 se present an los m ot or es de búsqueda m as populares y su form a de organizar los sit ios. En la sección 3 se pr esent a una r ecopilación de cuadr os est adíst icos de uso de los m ot or es de búsqueda. En la sección 4 discut im os aspect os a t ener en cuent a para el diseño de sit ios w eb fácilm ent e indexables. En la sección 5 m ost ram os dat os experim ent ales de evaluar la indexación de sit ios w eb con dist int os m ot ores de búsqueda. Finalm ent e en la sección 6 se dan algunas conclusiones.
2 . Bú sque da de I n for m a ción
Generalm ent e, cuando se inicia una búsqueda de inform ación ut ilizando un m ot or de búsqueda, se escribe una o m ás palabras claves que describen la inform ación que se est á buscando. Hay cuat r o t ipos de opciones para incluir en est e t ipo de búsquedas:
o Pa la b r a s r e q u e r id a s y pr oh ib id a s. Par a hacer que una palabr a est é obligat oriam ent e dent r o de la búsqueda, ant ecédala de un signo de sum a ( + ) . Para hacer que una palabra no se encuent r e en la búsqueda, ant ecédala de un signo de r est a ( - ) . Tenga en cuent a que no debe haber espacios ent r e las palabras y los signos.
o Re st r iccion e s a se ccion e s de docu m e n t os. Para buscar las palabras deseadas sólo en los t ít ulos de los sit ios en I nt ernet , ut ilice " t : " ant es de la palabra buscada. I ncluir " u: " ant es de la palabra buscada lim it a la búsqueda de la palabra especificada dent r o de los enlaces en el w eb.
o Bú squ e da d e Fr a se s. Para encont rar una fr ase, ut ilice las com illas para enm arcar la frase a buscar . No deben exist ir espacios ent re las com illas de apert ura y la prim era palabra, ni ent re la últ im a palabra de la frase y las com illas de cierr e.
o Bú squ e da con com odín . I ncluyendo un ast erisco ( * ) inm ediat am ent e después de la últ im a let ra de la palabra buscada, encont rará t odas las fuent es que cont engan las let ras incluidas en la palabra, adem ás de cualquier caráct er adicional.
o
Com b in a cion e s. Se pueden ut ilizar com binaciones de est as cuat roopciones, solo que debe r espet ar el m ism o orden ut ilizado para describir cada opción, est o es + , - , t : , u: , " " , y por últ im o * .
Algunos Motores permiten restringir las fechas de los documentos que aparecen
en el resultado.
o
Consulta de páginas indexadas de un Host
. Algunos motores de búsqueda,
como Altavista, permiten realizar consultas del tipo:
host:
undominio.com
, lo
cual traerá como resultado todas las páginas que se encuentran indexadas por
ejemplo de: undominio.com. Esto permite corroborar cuantas y cuales son las
páginas que se encuentran indexadas en dicho motor.
2 .1 D ife r e n t e s M ot or e s d e Bú squ e da de I n f or m a ción
Hoy en día exist en decenas de cient os de m ot ores de búsqueda en I nt ernet , algunos populares y ot ros no t ant o, pero los m ás populares concent ran el m ayor volum en de audiencia y de inform ación.
Mot ores de Búsqueda m ás populares :
Alt a Vist a
Ex cit e
H ot Bot
I nfo Se e k
Lycos
W e b Cr a w le r
Ya hoo!
Los m ot or es de búsqueda se dist inguen por sus m ét odos par a obt ener la inform ación:
• Los sit ios de ca t á logo m ant ienen sus propios índices ( cat álogos) de sit ios Web o páginas individuales. Las búsquedas se lim it an a los sit ios y páginas que est án en el cat álogo, en lugar de buscar se en t odo I nt ernet . ( Ej em plos: Alt aVist a y Lycos.)
• Los sit ios de r e v isión elaboran repasos y clasificaciones de sit ios Web, y present an r esúm enes t em át icos de los sit ios que coinciden con su crit erio de búsqueda. ( Ej em plos: Excit e y Magellean.)
• Los sit ios con ce pt u a le s organizan los sit ios por cat egorías y present an una list a de páginas en cat egorías r elacionadas con su cadena de búsqueda. ( Ej em plos: I nfoSeek y Yahoo! )
Mot ores de Búsqueda v s. Direct orios
Si bien com únm ent e llam am os “ Mot ores de Búsqueda” t ant o a los Mot or es de Búsqueda com o a los Direct orios, No son lo m ism o.
Los m ot or es de Búsqueda, com o Alt avist a, crean sus índices en form a aut om át ica, sin int erv ención hum ana, los m ism os r ecor r en un sit io y lo indexan y luego los navegant es consult an sobr e esos dat os r ecopilados.
Al m odificar las páginas, los m ot ores pueden det ect arlo y sobr escribir los dat os con la nueva inform ación recopilada, ya que los m ism os r et ornan a los sit ios en busca de los cam bios con frecuencias dadas.
t ravés de un form ulario w eb una descripción del sit io, un edit or lo r evisa y es alm acenada. Luego las búsquedas se r ealizarán sobre dicha descripción.
Los cam bios que se pueden llegar a hacer par a m ej orar los rankings en un m ot or de búsqueda, no son út iles para los Direct or ios, ya que r equieren una revisión m anual.
2 .2 For m a s de I n de x a cion y a lm a ce n a m ie n t o d e sit ios
Los m ot or es de búsqueda est án com puest os por 3 part es o elem ent os : Spide r o Cr a w le r , I n d ice y Soft w a r e del Mot or de Búsqueda.
El spide r visit a una página, la lee, y cont inua por los hipervínculos que cont enga la página, dent ro del sit io. Vuelve a r ecor rer el sit io según una frecuencia dada a la búsqueda de cam bios. ( Frecuent em ent e una vez cada 2 o 4 sem anas) . Todo lo que el spider encuent ra es alm acenado en el índice.
El ín d ice, algunas veces llam ado cat álogo, es donde se alm acenan las copias de las páginas leídas por el spider. Es posible que un sit io sea recor rido por un spider y no se agr egue al índice hast a un m om ent o post erior.
El Soft w a r e del Mot or de Búsqueda es el program a program a encargado de recorr er las m illones de páginas alm acenadas en el índice, que coinciden con una búsqueda dada, y r ealizar el ranking de los r esult ados de acuerdo al grado de relevancia que consider e t iene la inform ación.
El Soft w ar e de cada Mot or de Búsqueda se puede com parar con una recet a de com ida, donde los ingredient es son los m ism os, per o cada cocinero, puede agr egar sus ingredient es secr et os. De est a form a cada m ot or de búsqueda, si bien debe obt ener r esult ados relevant es a una búsqueda, la form a de det erm inar cual página o docum ent o indexado es m ás r elevant e, var ia de un m ot or a ot r o. Por ello la búsqueda de una m ism a cadena de t ext o en un m ot or de búsqueda nos da result ados dist int os en ot r os, adem ás de que la inform ación indexada por cada m ot or es dist int a.
Para det erm inar la relevancia de la inform ación se basan en el principio de Ubicación y Frecuencia.
Lo prim er o que suelen hacer es buscar que la palabra se encuent r e al principio de la página ( Tít ulo y/ o Encabezado de la página o en los prim eros 2 pár rafos) , ya que asum en que lo que se est á deseando encont rar, debe figurar desde el principio de una página para que t enga una relevancia considerable. De la m ism a form a la cant idad de aciert os dent ro de la m ism a página det erm ina cuán relevant e puede llegar a ser .
Est o últ im o ha ido ev olucionando con el pasar de los años y el aum ent o de la inform ación, y se han aplicado soluciones a los algorit m os de búsqueda para evit ar problem as de spam ( r epet ición de palabras en páginas para obt ener m ej or es rankings en las búsquedas) . Hoy en día una gran cant idad de m ot or es de búsqueda son capaces de ident ificar spam s y de hacerlo elim inan el sit io del índice.
Algunos m ot or es de búsqueda ( com o Excit e) consideran para det erm inar la relevancia de una página, la cant idad de hipervínculos que exist en de ot ras páginas a ella, ya que consideran que si hay m uchas páginas que “ apunt an” a est a, se debe t rat ar de una página im port ant e para dicha búsqueda.
3 . Algu n a s Est a díst ica s
Ca n t id a d de I n for m a ción I n de x a da vs. Ca n t ida d d e I n f or m a ción Ex ist e n t e
En Febrer o del 2000, un est udio en conj unt o llevado a cabo por I nkt om i y el Depart am ent o de I nv est igaciones de NEC r ev eló que exist en cerca de 1.000 m illones de páginas w eb indexables en I nt ernet .
La gráfica ilust ra com o se encuent ra “ r epart ida” la Web en cada m ot or de
búsqueda. Podem os apr eciar que Alt avist a es el m ot or de búsqueda que posee la m ayor cant idad de páginas indexadas, las principales razones de est o son :
• Posicionam ient o t em prano en el m er cado, m arcando un fact or
diferenciador al ser de los prim er os m ot or es de búsqueda de indexación por cont enido.-
• Facilidad para la regist ración de Páginas.
• Posibilidad de Traducción Online de las páginas.
Ca n t id a d de Pá gin a s I n de x a d a s e n f u n ción de l Tie m po
Ca n t id a d de p á gin a s vist a s a p a r t ir de bú squ e d a s r e a liz a d a s
El Siguient e gráfico ilust ra la cant idad de páginas vist as a part ir de una búsqueda realizada en un m ot or de búsqueda en un día dado. Los dat os ilust ran que sobre la m uest ra seleccionada, Yahoo fue el m ot or de búsqueda m ás ut ilizado, luego Alt avist a y Excit e en t er cer lugar. A pesar de que Yahoo ent ra dent ro de la cat egoría de sit ios concept uales, y la inclusión de sit ios se raliza m anualm ent e dem ost r ó ser el m ás ut ilizado, por lo cual per m it e concluir que est os t res m ot ores engloban m ás del 75% de las páginas buscadas por un navegant e.
YH= Yahoo, AV= Alt aVist a, EX= Excit e, GO= Go ( I nfoseek) , LY= Lycos, GT= GoTo, WC= WebCraw ler, SP= Snap, MSN= MSN ( I nform ación sum inist rada por St at Mark et .)
Los dat os fuer on r ecopilados sobre 100.00 sit ios w eb , el día 19 de Diciem br e de 1999.
4 . Algu n a s pa u t a s de D ise ñ o de sit ios W e b
En est a sección analizam os algunos aspect os a t ener en cuent a al realizar el diseño del sit io Web para que est e sea fácilm ent e indexable.
M e t a Et iqu e t a s
Las Met a et iquet as o Met a Dat os, se encuent ran ocult as al navegant e, y perm it en al diseñador incorporar una brev e descripción de lo que el sit io t rat a y las palabras clave con que el m ism o se encuent ra relacionado. Algunos Spiders considerarán el cont enido de est as et iquet as para aum ent ar la relevancia de la página. Ej em plos de m et a- et iquet as son las siguient es:
<META name="description" content="una descripción de 200 palabras">
<META name="keyword" content="lista de palabras clave separadas por comas">
Las Met a et iquet as t am bién sirven para indicar a los m ot or es de búsqueda que una página no debe ser indexada por un Spider. Ej em plos de est o son los siguient es:
<META NAME="robots" CONTENT="noindex">
Est o indica al Spider que no indexe la página que lo cont iene.
<META NAME="robots" CONTENT="nofollow">
Tam bién se pueden incluir cualquier de las 2 siguient es líneas para que no se index e la página que la cont iene ni a las que est én vinculadas.
<META NAME="robots" CONTENT="noindex, nofollow"> <META NAME="robots" CONTENT="none">
Muchos Webm ast ers creen que las m et a et iquet as son el secr et o para figurar en los prim eros lugares en los m ot or es de búsqueda, pues bien, est o no es así. Hot bot e I nfoseek consideran m ínim am ent e la exist encia de est os a la hora de det erm inar la relevancia, per o m ot or es com o Ly cos no los leen en absolut o.
Por lo cual los m ism os, son út iles per o no son el ingr edient e secret o que va a solucionar los problem as de los w ebm ast ers, a la hora de figurar en las prim eras posiciones.
Lim it a n t e s e x ist e n t e s
Exist en lim it ant es a nivel de las Spiders que r ecorr en los sit ios alim ent ándose de lo que encuent ran. Muchos Spiders no soport an fram es ( páginas con cuadros) , las única que lo soport a 100% es, el Wolf Spider, de Lycos e I nfoseek.
Es im port ant e por ello com plet ar la et iquet a NOFRAME de la página que posea fram es, para que al ser recorrida se pr ocese el t ext o cont enido dent r o de la m ism a. Ot r os t ant os Spider s no soport an hipervínculos em bebidos en una im agen, únicam ent e Alt avist a, I nfoseek y Web Craw ler soport an m apas de im ágenes.
Las páginas generadas dinám icam ent e, ut ilizando CGI , no pueden ser indexadas.
5 . D a t os Ex pe r im ent a le s
En est a sección se present an dat os experim ent ales de prueba de indexacion de t res sit ios difer ent es usando t r es m ot ores de búsqueda dist int os. El análisis se realiza present ando dat os dat os est adíst icos refer ent es a :
• Volum en de I nform ación alm acenada.
• Volum en de Audiencia ( Visit ant es) .
• Cant idad de Búsquedas realizadas.
• Soport e de Búsquedas Avanzadas.
• Form a de ej ecución de I ndexación de Sit ios.
Los sit ios Web seleccionados para el t est fuer on lo siguient es:
• Prom ociones y Servicios S.A.
• Profesionales SRL
• Discount Bank L.A.
Prom ociones y Ser vicios es una em pr esa dedicada a Negocios I nm obiliarios y Adm inist ración de I nm uebles.
Profesionales SRL es una consult ora y financia inversiones principalm ent e en el sect or agr opecuario.
Discount Bank L.A. es un banco subsidiario del I srael Discount Bank of New York .
Los t r es sit ios fuer on regist rados en los m ot or es de Búsqueda :
• Alt avist a.
• Yahoo!
Fecha de la regist ración : 5 d e Ju n io de l 2 0 0 0 . Fecha de las consult as : 1 0 de Ju lio de l 2 0 0 0 .
ALTAVI STA
A cont inuación de det allarán las búsquedas r ealizadas para cada uno de los dom inios seleccionados en Alt avist a.
host : psr ealest at e.com - Traj o com o r esult ado 21 páginas. host : profesionalessrl.com - Traj o com o r esult ado 2 páginas. host : discbank.com .uy - Traj o com o r esult ado 41 páginas.
Real Est at e Br ok er s Uruguay - Prim er result ado. Real Est at e Br ok er s Mont evideo - Prim er result ado. Real Est at e Br ok er s Punt a del Est e - Prim er result ado. + Alquiler + Pr opiedades + Uruguay 5t a. posición
“ Pr om ociones y Servicios” - Prim er result ado. + Pr om ociones + Servicios - Prim er result ado. “ Punt a del Est e” - 12va. posición
“ + Financiam ient o + I nv ersiones” - Prim er lugar : “ Pr ofesionales” No figura
“ Pr ofesionales Srl” - No figura “ Pr ofesionales SRL” - Prim er Lugar + Pr ofesionales + Uruguay - No figura
Discount Bank - 2do. lugar
“ Discount ” ( Sólo Español) - Prim er lugar página principal
“ + Bank + Lat in + Am erica” - Prim er lugar : 39.134.
YAH OO!
A cont inuación de det allarán las búsquedas r ealizadas para cada uno de los dom inios seleccionados en Yahoo!
w w w .psrealest at e.com - Traj o com o r esult ado 7 páginas. w w w .pr ofesionalessrl.com - Traj o com o r esult ado 2 páginas. w w w .discbank.com .uy - Traj o com o r esult ado 5 páginas.
+ Alquiler + Pr opiedades + Uruguay 8 result ados sin figurar. “ Pr om ociones y Servicios” - Prim er result ado.
+ Pr om ociones + Servicios - Prim er result ado. Real Est at e Br ok er s Uruguay- No figura.
Real Est at e Br ok er s Mont evideo - No figura. Real Est at e Br ok er s Punt a del Est e - No figura.
“ + Financiam ient o + I nv ersiones” - Prim er lugar : “ Pr ofesionales” - No figura
+ Pr ofesionales + Uruguay - No figura ( Exist en 320 r esult ados) Discount Bank - No figura.
“ Discount ” ( Sólo Español) - No figura. “ + Bank + Lat in + Am erica” - No figura.
LYCOS
A cont inuación de det allarán las búsquedas r ealizadas para cada uno de los dom inios seleccionados en Ly cos.
host : psr ealest at e.com - Traj o com o r esult ado 11 páginas. host : profesionalesrl.com - Traj o com o r esult ado 5 páginas. host : discbank.com .uy - Traj o com o r esult ado 12 páginas.
+ Alquiler + Pr opiedades + Uruguay - No figura. “ Pr om ociones y Ser vicios” - 3er- 6t o. 7m o. Lugar + Pr om ociones + Servicios - 3er . 5t o. Y 7m o. Lugar . Real Est at e Br ok er s Uruguay- Segundo Lugar .
Real Est at e Br ok er s Mont evideo - Segundo Lugar . Real Est at e Br ok er s Punt a del Est e - Segundo Lugar.
“ + Financiam ient o + I nv ersiones” - Prim er Lugar.
+ Pr ofesionales + srl - Los prim er os 15 r esult ados pert enecen al sit io. " Pr ofesionales SRL" - Los prim er os 15 r esult ados pert enecen al sit io. + Pr ofesionales + Uruguay - No figura ( Exist en 28451 result ados)
“ + Bank + Lat in + Am erica” - Prim er os 3 r esult ados pert enecen al sit io- “ Bancos Uruguay” - No figura en 9314 r esult ados.
Discount Bank - 4t o. Lugar.
6 . Con clusion es
A part ir de los dat os recogidos se puede afirm ar claram ent e las difer encias exist ent es en los dist int os com ponent es de los m ot ores de búsqueda y las dist int as polít icas de indexación.
Por ello debem os t ener en cuent a a la hora de disenar un Sit io y arm ar las páginas que lo com pongan ciert os punt os que pueden ser claves a la hora de figurar en las bases de dat os de los m ot ores de búsqueda indexados por las palabras que se desea.
Alt avist a, a diferencia de los rest ant es, es sensit ivo a m ayúsculas y m inúsculas. Los algorit m os para la búsqueda y det erm inación de relevancia varían en las prioridades dadas a los siguient es aspect os:
• t ít ulo de la página.
• m et adat os definidos.
• com binación de los dos ant erior es.
• repet ición de las palabras clave.
Alt avist a indexa las páginas a part ir de los prim er os 1024 caract er es de la página, t om ando de esa form a el t ít ulo, encabezados y m et aet iquet as exist ent es en cada página.
Los algorit m os em pleados por Ly cos definen la relevancia a part ir de la cant idad de aciert os de una búsqueda en el t ít ulo de la página y los m et adat os definidos en ella.
Yahoo! , al agrupar los sit ios en cat egorías en form a m anual, es m ás lent o en lo que refiere a la indexación y en uno de los casos analizados no figura, luego de haber solicit ado la indexación, un m es at rás.
Los m ot or es de búsqueda, cont inuarán m ej orando sus com ponent es, con el avance de la t ecnología, perm it iendo a los navegant es encont rar lo que est os buscan en for m a cada v ez m ás eficient e.
Los m edios de alm acenam ient o de inform ación, al igual que los algorit m os em pleados para la búsqueda e indexación de dat os cont inuarán evolucionando, surgirán nuevas t ecnologías que hoy en día se encuent ran en fase de pr ot ot ipo o prueba, las cuales perm it irán ir resolviendo los “ open pr oblem s” exist ent es.
De t odas form as en lo que r espect a al present e, exist en algunos punt os que se pueden considerar para lograr una indexación cor rect a por part e de los m ot ores búsqueda a la hora de publicar un sit io w eb.
Est os punt os son :
• Hacer buen uso de las et iquet as de las páginas.
• Arm ar eficazm ent e el encabezado de cada página.
• Ut ilizar Met a- et iquet as.
• No hacer páginas con excesiva cant idad de t ext o.
• No ut ilizar Fram es o Cuadros.
• Ser pacient e.
Re fe r e n cia s
En los siguient es sit ios Web podrá encont rar inform ación com plem ent ar ia al present e inform e.
Sear ch Engine Wat ch -
FAST Search -
Advanced Searching
Kansas Cit y Public Library -
Sear ch Engine Spiders
Sear ch Engine Spiders I I -
Sear ch Engine Feat ur es
WWW9 Papers -
AN EX O I
Gr á fica de Com pa r a ción e n t r e M ot or e s d e Bú squ e da
AltaVista
Excite
HotBot
Infoseek
Lycos
Northern
Light
Tamaño 250 Millones de páginas 250 Millones de páginas y objetos multimedia
110 Millones de Sitios 75 Millones de páginas 50 Millones de páginas
200 Millones de Sitios
Full-text
SI SI SI SI NO SI
Palabra por defecto
OR OR AND or and and
Boolean connectors
AND, AND NOT, NEAR AND, AND NOT
OR, NOT and, not or, not, adj., near, before, far or, not Búsqueda de Frase Usar Comillas Usar Comillas Usar Comillas Usar Comillas Usar Comillas Usar Comillas
Truncado
No, usar * No No, ? y * No No Automático
Sensible a Mayúsculas
SI No SI SI No No
Inclusión
de Palabras
Usar + Usar + Usar + Usar + Usar + Usar +
Eliminación
de Palabras
Usar - Usar - Usar - Usar - Usar - Usar
-Detección de Duplicados
Agupados por un mismo título
SI
Agupados por un mismo título
SI SI SI
Especiales
Limitar por
fecha, lenguaje o un campo seguido por una coma Búsqueda por Conceptos
Limitar por fecha, lenguaje, ubicación y profundidad de página Encontrar búsquedas similares Buscar por imagines y archivos de sonido
Carpetas personalizadas
A con t in u a ción se de t a lla n los d ist in t os a g e n t e s o Sp ide r s qu e u t iliz a n los m ot or e s de bú squ e da m á s popu la r e s :
Motor de Búsqueda Nombre del Agente Nombre del Host
(normal spider)
Scooter/2.0 G.R.A.B. X2.0 Scooter/1.0 [email protected]
scooter.pa-x.dec.com scooter*.av.pa-x.dec.com ejs.: scooter3.av.pa-x.dec.com
(instant spider)
Scooter/1.0 add-url.altavista.digital.com ww2.altavista.digital.com
(mega spider)
ArchitextSpider crawl*.atext.com ej. : crawl2.atext.com
(fresh spider)
ArchitextSpider crimpshrine.atext.com
(Experimental search engine)
BackRub/2.1
[email protected] http://google.stanford.edu/
*.stanford.edu ej. : hake.stanford.edu
(powers
Slurp/2.0 ([email protected]; http://www.inktomi.com/slurp.html)
*.inktomi.com ejs : j2001.inktomi.com
or j10.inktomi.com
(normal spider)
InfoSeek Sidewinder/0.9 *.infoseek.com ejs: wilbur-bbn.infoseek.com
o
IP: 204.162.98.90
(instant spider)
Mozilla/3.01 (Win95; I) Idem anterior
(regular spider)
Lycos_Spider_(T-Rex) lycosidae.lycos.com o
*.pgh.lycos.com ejs : spider3.srv.pgh.lycos.com
(Add URL spider)
Lycos_Spider_(T-Rex) *.sjc.lycos.com ej: sjc-fe4-1.sjc.lycos.com
Ca nt ida d de Búsque da s r e a liz a da s e n un m e s.
FUENTE
:
SearchEngineWatch.
-
La sig u ie n t e t a bla ilu st r a la s p r e f e r e n cia s de los n a ve ga n t e s a la h or a de con su lt a r dif e r e n t e s m ot or e s de bú squ e da s
Servicio AV AJ EX GO GT HB LS LY MSN NS SP YH
AV x 24% 22% 23% 25% 25% 29% 26% 19% 16% 20% 18%
AJ 4% x 4% 4% 4% 5% 5% 3% 3% 3% 4% 3%
EX 29% 31% x 23% 38% 33% 30% 30% 20% 30% 35% 20%
GO 43% 36% 33% x 35% 42% 36% 41% 32% 30% 40% 30%
GT 15% 14% 17% 11% x 20% 25% 19% 11% 19% 21% 9%
HB 17% 20% 17% 15% 22% x 21% 27% 11% 15% 18% 12%
LS 23% 20% 18% 15% 33% 24% x 22% 13% 21% 20% 13%
LY 36% 26% 31% 30% 44% 55% 39% x 26% 29% 37% 23%
MSN 52% 42% 42% 47% 53% 44% 45% 52% x 39% 46% 40%
NS 29% 31% 43% 30% 59% 41% 51% 40% 26% x 47% 27%
SP 14% 17% 19% 15% 25% 19% 18% 19% 12% 18% x 11%
YH 68% 65% 58% 63% 61% 67% 64% 65% 57% 56% 62%
Motor Cantida de Búsquedas Fecha de Informado
AltaVista
55 millones
05/2000
Inktomi
47 millones
04/2000
12 millones
04/2000
Ask Jeeves
4 millones
03/2000
Alta Vista
InfoSeek
Lycos
# de URLs 16 millones 1 millón 10,75 millones
Documentación Excelente; incluye los detalles y los ejemplos de la búsqueda para las interrogaciones simples y avanzadas.
Muy largo; algo difícil de localizar.
Justo, tan completo como podía ser.
Detección Duplicada
No Sí No
El Buscar Del Campo
Sí No No
Indexación de direcciones
Con texto completo Con texto completo
URLs, también opción de otras partes de paginaciones y texto.
Conjuntos Múltiples De la Búsqueda
No No No
Boleano Jerarquizada
Sí No No
El Buscar De la Proximidad
Sí, asegura ambos términos están dentro de diez palabras (o de frases si los términos se incluyen en cotizaciones).
Sí Sí, elija el tipo del emparejamiento (flojo, feria, los etc.) de menú pull-down.
Graduación De la Importancia
Sí, puede especificar qué términos al peso primero en la visualización de la extracción.
Sí Sí
Truncamiento Sí, pueden utilizar un asterisco en vástagos de la palabra más de largo de tres cartas.