• No se han encontrado resultados

Evaluación de motores de búsqueda en Internet

N/A
N/A
Protected

Academic year: 2017

Share "Evaluación de motores de búsqueda en Internet"

Copied!
14
0
0

Texto completo

(1)

Mario Val Perrone – Regina Mot z

Eva lu a ción de M ot or e s de Bú squ e da e n I n t e r n e t

Universidad ORT, Mont evideo, Uruguay

e- m ail:

Re su m e n

El present e art ículo incluye docum ent ación de Mot or es de Búsqueda obt enida de dist int as fuent es y det alla las principales caract eríst icas de ellos, así com o t am bién cuáles son los m ej or es m ét odos a em plear para la inclusión de sit ios w eb en las bases de dat os de est os, de la form a m ás eficient e.

El principal fundam ent o y aplicación del present e art ículo, será el explicar el funcionam ient o de los m ot ores de búsqueda y el servir de guía para el desarr ollo de sit ios w eb con el fin que at raigan eficient em ent e a los m ot or es de búsqueda y Spiders.

1 I n t r oducción

La publicación de infor m ación en la w eb es cada día m as volum inosa. El obj et ivo de quienes publican su inform ación en I nt ernet , ya sea por m ot ivos com erciales o cult urales, es que ella llegue al m ayor num ero de nav egant es posibles ( ent endiéndose por navegant e, a un usuario de I nt ernet ) . Sin em bargo, el descubrim ient o de su sit io por part e del usuario dependerá fundam ent alm ent e de la indexación que sobre el realicen los m ot or es de búsqueda ut ilizados.

El principal obj et ivo de est e t r abaj o es evaluar el desem peño de dist int os m ot ores de búsqueda de sit ios Web con el fin de brindar direct ivas de diseño para lograr una indexación eficient e, o sea, ser cat alogados por la inform ación que consideram os relevant e y aparecer en un ranking de alt o por cent aj e por búsqueda de esa inform ación.

Tom ar decisiones fundam ent adas a la hora de evaluar los dist int os m ot ores de búsqueda y de diseñar un sit io Web para lograr una indexación eficient e es im port ant e consider ando que de a cuerdo a dat os ext raídos de Se a r h En gin e W a ch .com :

• el 75% de los nav egant es ut ilizan m ot or es de búsqueda al ingresar a I nt ernet .

• el 46% de los nav egant es, acceden a sit ios nuevos a t rav és de m ot ores de búsqueda.

• el 57% de los nav egant es r ealizan al m enos 1 búsqueda al día.

• el 42% de los nav egant es que realizan com pras online, acceden a los sit ios de v ent a a t rav és de m ot ores de búsqueda.

• 1 de cada 28 páginas visualizadas en I nt ernet es el r esult ado de una búsqueda. ( 3.5% del t ot al)

• El t rabaj ador prom edio que ut iliza I nt ernet , pasa 73 m inut os al m es en los m ot ores de búsqueda.

(2)

seguir para que un sit io w eb figure en los m ot ores de búsqueda en los prim eros lugares.

El rest o del t rabaj o se organiza de la siguient e m anera. En la sección 2 se present an los m ot or es de búsqueda m as populares y su form a de organizar los sit ios. En la sección 3 se pr esent a una r ecopilación de cuadr os est adíst icos de uso de los m ot or es de búsqueda. En la sección 4 discut im os aspect os a t ener en cuent a para el diseño de sit ios w eb fácilm ent e indexables. En la sección 5 m ost ram os dat os experim ent ales de evaluar la indexación de sit ios w eb con dist int os m ot ores de búsqueda. Finalm ent e en la sección 6 se dan algunas conclusiones.

2 . Bú sque da de I n for m a ción

Generalm ent e, cuando se inicia una búsqueda de inform ación ut ilizando un m ot or de búsqueda, se escribe una o m ás palabras claves que describen la inform ación que se est á buscando. Hay cuat r o t ipos de opciones para incluir en est e t ipo de búsquedas:

o Pa la b r a s r e q u e r id a s y pr oh ib id a s. Par a hacer que una palabr a est é obligat oriam ent e dent r o de la búsqueda, ant ecédala de un signo de sum a ( + ) . Para hacer que una palabra no se encuent r e en la búsqueda, ant ecédala de un signo de r est a ( - ) . Tenga en cuent a que no debe haber espacios ent r e las palabras y los signos.

o Re st r iccion e s a se ccion e s de docu m e n t os. Para buscar las palabras deseadas sólo en los t ít ulos de los sit ios en I nt ernet , ut ilice " t : " ant es de la palabra buscada. I ncluir " u: " ant es de la palabra buscada lim it a la búsqueda de la palabra especificada dent r o de los enlaces en el w eb.

o Bú squ e da d e Fr a se s. Para encont rar una fr ase, ut ilice las com illas para enm arcar la frase a buscar . No deben exist ir espacios ent re las com illas de apert ura y la prim era palabra, ni ent re la últ im a palabra de la frase y las com illas de cierr e.

o Bú squ e da con com odín . I ncluyendo un ast erisco ( * ) inm ediat am ent e después de la últ im a let ra de la palabra buscada, encont rará t odas las fuent es que cont engan las let ras incluidas en la palabra, adem ás de cualquier caráct er adicional.

o

Com b in a cion e s. Se pueden ut ilizar com binaciones de est as cuat ro

opciones, solo que debe r espet ar el m ism o orden ut ilizado para describir cada opción, est o es + , - , t : , u: , " " , y por últ im o * .

Algunos Motores permiten restringir las fechas de los documentos que aparecen

en el resultado.

o

Consulta de páginas indexadas de un Host

. Algunos motores de búsqueda,

como Altavista, permiten realizar consultas del tipo:

host:

undominio.com

, lo

cual traerá como resultado todas las páginas que se encuentran indexadas por

ejemplo de: undominio.com. Esto permite corroborar cuantas y cuales son las

páginas que se encuentran indexadas en dicho motor.

(3)

2 .1 D ife r e n t e s M ot or e s d e Bú squ e da de I n f or m a ción

Hoy en día exist en decenas de cient os de m ot ores de búsqueda en I nt ernet , algunos populares y ot ros no t ant o, pero los m ás populares concent ran el m ayor volum en de audiencia y de inform ación.

Mot ores de Búsqueda m ás populares :

Alt a Vist a

Ex cit e

H ot Bot

I nfo Se e k

Lycos

W e b Cr a w le r

Ya hoo!

Los m ot or es de búsqueda se dist inguen por sus m ét odos par a obt ener la inform ación:

• Los sit ios de ca t á logo m ant ienen sus propios índices ( cat álogos) de sit ios Web o páginas individuales. Las búsquedas se lim it an a los sit ios y páginas que est án en el cat álogo, en lugar de buscar se en t odo I nt ernet . ( Ej em plos: Alt aVist a y Lycos.)

• Los sit ios de r e v isión elaboran repasos y clasificaciones de sit ios Web, y present an r esúm enes t em át icos de los sit ios que coinciden con su crit erio de búsqueda. ( Ej em plos: Excit e y Magellean.)

• Los sit ios con ce pt u a le s organizan los sit ios por cat egorías y present an una list a de páginas en cat egorías r elacionadas con su cadena de búsqueda. ( Ej em plos: I nfoSeek y Yahoo! )

Mot ores de Búsqueda v s. Direct orios

Si bien com únm ent e llam am os “ Mot ores de Búsqueda” t ant o a los Mot or es de Búsqueda com o a los Direct orios, No son lo m ism o.

Los m ot or es de Búsqueda, com o Alt avist a, crean sus índices en form a aut om át ica, sin int erv ención hum ana, los m ism os r ecor r en un sit io y lo indexan y luego los navegant es consult an sobr e esos dat os r ecopilados.

Al m odificar las páginas, los m ot ores pueden det ect arlo y sobr escribir los dat os con la nueva inform ación recopilada, ya que los m ism os r et ornan a los sit ios en busca de los cam bios con frecuencias dadas.

(4)

t ravés de un form ulario w eb una descripción del sit io, un edit or lo r evisa y es alm acenada. Luego las búsquedas se r ealizarán sobre dicha descripción.

Los cam bios que se pueden llegar a hacer par a m ej orar los rankings en un m ot or de búsqueda, no son út iles para los Direct or ios, ya que r equieren una revisión m anual.

2 .2 For m a s de I n de x a cion y a lm a ce n a m ie n t o d e sit ios

Los m ot or es de búsqueda est án com puest os por 3 part es o elem ent os : Spide r o Cr a w le r , I n d ice y Soft w a r e del Mot or de Búsqueda.

El spide r visit a una página, la lee, y cont inua por los hipervínculos que cont enga la página, dent ro del sit io. Vuelve a r ecor rer el sit io según una frecuencia dada a la búsqueda de cam bios. ( Frecuent em ent e una vez cada 2 o 4 sem anas) . Todo lo que el spider encuent ra es alm acenado en el índice.

El ín d ice, algunas veces llam ado cat álogo, es donde se alm acenan las copias de las páginas leídas por el spider. Es posible que un sit io sea recor rido por un spider y no se agr egue al índice hast a un m om ent o post erior.

El Soft w a r e del Mot or de Búsqueda es el program a program a encargado de recorr er las m illones de páginas alm acenadas en el índice, que coinciden con una búsqueda dada, y r ealizar el ranking de los r esult ados de acuerdo al grado de relevancia que consider e t iene la inform ación.

El Soft w ar e de cada Mot or de Búsqueda se puede com parar con una recet a de com ida, donde los ingredient es son los m ism os, per o cada cocinero, puede agr egar sus ingredient es secr et os. De est a form a cada m ot or de búsqueda, si bien debe obt ener r esult ados relevant es a una búsqueda, la form a de det erm inar cual página o docum ent o indexado es m ás r elevant e, var ia de un m ot or a ot r o. Por ello la búsqueda de una m ism a cadena de t ext o en un m ot or de búsqueda nos da result ados dist int os en ot r os, adem ás de que la inform ación indexada por cada m ot or es dist int a.

Para det erm inar la relevancia de la inform ación se basan en el principio de Ubicación y Frecuencia.

Lo prim er o que suelen hacer es buscar que la palabra se encuent r e al principio de la página ( Tít ulo y/ o Encabezado de la página o en los prim eros 2 pár rafos) , ya que asum en que lo que se est á deseando encont rar, debe figurar desde el principio de una página para que t enga una relevancia considerable. De la m ism a form a la cant idad de aciert os dent ro de la m ism a página det erm ina cuán relevant e puede llegar a ser .

Est o últ im o ha ido ev olucionando con el pasar de los años y el aum ent o de la inform ación, y se han aplicado soluciones a los algorit m os de búsqueda para evit ar problem as de spam ( r epet ición de palabras en páginas para obt ener m ej or es rankings en las búsquedas) . Hoy en día una gran cant idad de m ot or es de búsqueda son capaces de ident ificar spam s y de hacerlo elim inan el sit io del índice.

Algunos m ot or es de búsqueda ( com o Excit e) consideran para det erm inar la relevancia de una página, la cant idad de hipervínculos que exist en de ot ras páginas a ella, ya que consideran que si hay m uchas páginas que “ apunt an” a est a, se debe t rat ar de una página im port ant e para dicha búsqueda.

(5)

3 . Algu n a s Est a díst ica s

Ca n t id a d de I n for m a ción I n de x a da vs. Ca n t ida d d e I n f or m a ción Ex ist e n t e

En Febrer o del 2000, un est udio en conj unt o llevado a cabo por I nkt om i y el Depart am ent o de I nv est igaciones de NEC r ev eló que exist en cerca de 1.000 m illones de páginas w eb indexables en I nt ernet .

La gráfica ilust ra com o se encuent ra “ r epart ida” la Web en cada m ot or de

búsqueda. Podem os apr eciar que Alt avist a es el m ot or de búsqueda que posee la m ayor cant idad de páginas indexadas, las principales razones de est o son :

• Posicionam ient o t em prano en el m er cado, m arcando un fact or

diferenciador al ser de los prim er os m ot or es de búsqueda de indexación por cont enido.-

• Facilidad para la regist ración de Páginas.

• Posibilidad de Traducción Online de las páginas.

Ca n t id a d de Pá gin a s I n de x a d a s e n f u n ción de l Tie m po

(6)

Ca n t id a d de p á gin a s vist a s a p a r t ir de bú squ e d a s r e a liz a d a s

El Siguient e gráfico ilust ra la cant idad de páginas vist as a part ir de una búsqueda realizada en un m ot or de búsqueda en un día dado. Los dat os ilust ran que sobre la m uest ra seleccionada, Yahoo fue el m ot or de búsqueda m ás ut ilizado, luego Alt avist a y Excit e en t er cer lugar. A pesar de que Yahoo ent ra dent ro de la cat egoría de sit ios concept uales, y la inclusión de sit ios se raliza m anualm ent e dem ost r ó ser el m ás ut ilizado, por lo cual per m it e concluir que est os t res m ot ores engloban m ás del 75% de las páginas buscadas por un navegant e.

YH= Yahoo, AV= Alt aVist a, EX= Excit e, GO= Go ( I nfoseek) , LY= Lycos, GT= GoTo, WC= WebCraw ler, SP= Snap, MSN= MSN ( I nform ación sum inist rada por St at Mark et .)

Los dat os fuer on r ecopilados sobre 100.00 sit ios w eb , el día 19 de Diciem br e de 1999.

4 . Algu n a s pa u t a s de D ise ñ o de sit ios W e b

En est a sección analizam os algunos aspect os a t ener en cuent a al realizar el diseño del sit io Web para que est e sea fácilm ent e indexable.

M e t a Et iqu e t a s

Las Met a et iquet as o Met a Dat os, se encuent ran ocult as al navegant e, y perm it en al diseñador incorporar una brev e descripción de lo que el sit io t rat a y las palabras clave con que el m ism o se encuent ra relacionado. Algunos Spiders considerarán el cont enido de est as et iquet as para aum ent ar la relevancia de la página. Ej em plos de m et a- et iquet as son las siguient es:

<META name="description" content="una descripción de 200 palabras">

<META name="keyword" content="lista de palabras clave separadas por comas">

Las Met a et iquet as t am bién sirven para indicar a los m ot or es de búsqueda que una página no debe ser indexada por un Spider. Ej em plos de est o son los siguient es:

<META NAME="robots" CONTENT="noindex">

Est o indica al Spider que no indexe la página que lo cont iene.

<META NAME="robots" CONTENT="nofollow">

(7)

Tam bién se pueden incluir cualquier de las 2 siguient es líneas para que no se index e la página que la cont iene ni a las que est én vinculadas.

<META NAME="robots" CONTENT="noindex, nofollow"> <META NAME="robots" CONTENT="none">

Muchos Webm ast ers creen que las m et a et iquet as son el secr et o para figurar en los prim eros lugares en los m ot or es de búsqueda, pues bien, est o no es así. Hot bot e I nfoseek consideran m ínim am ent e la exist encia de est os a la hora de det erm inar la relevancia, per o m ot or es com o Ly cos no los leen en absolut o.

Por lo cual los m ism os, son út iles per o no son el ingr edient e secret o que va a solucionar los problem as de los w ebm ast ers, a la hora de figurar en las prim eras posiciones.

Lim it a n t e s e x ist e n t e s

Exist en lim it ant es a nivel de las Spiders que r ecorr en los sit ios alim ent ándose de lo que encuent ran. Muchos Spiders no soport an fram es ( páginas con cuadros) , las única que lo soport a 100% es, el Wolf Spider, de Lycos e I nfoseek.

Es im port ant e por ello com plet ar la et iquet a NOFRAME de la página que posea fram es, para que al ser recorrida se pr ocese el t ext o cont enido dent r o de la m ism a. Ot r os t ant os Spider s no soport an hipervínculos em bebidos en una im agen, únicam ent e Alt avist a, I nfoseek y Web Craw ler soport an m apas de im ágenes.

Las páginas generadas dinám icam ent e, ut ilizando CGI , no pueden ser indexadas.

5 . D a t os Ex pe r im ent a le s

En est a sección se present an dat os experim ent ales de prueba de indexacion de t res sit ios difer ent es usando t r es m ot ores de búsqueda dist int os. El análisis se realiza present ando dat os dat os est adíst icos refer ent es a :

• Volum en de I nform ación alm acenada.

• Volum en de Audiencia ( Visit ant es) .

• Cant idad de Búsquedas realizadas.

• Soport e de Búsquedas Avanzadas.

• Form a de ej ecución de I ndexación de Sit ios.

Los sit ios Web seleccionados para el t est fuer on lo siguient es:

• Prom ociones y Servicios S.A.

• Profesionales SRL

• Discount Bank L.A.

Prom ociones y Ser vicios es una em pr esa dedicada a Negocios I nm obiliarios y Adm inist ración de I nm uebles.

Profesionales SRL es una consult ora y financia inversiones principalm ent e en el sect or agr opecuario.

Discount Bank L.A. es un banco subsidiario del I srael Discount Bank of New York .

Los t r es sit ios fuer on regist rados en los m ot or es de Búsqueda :

• Alt avist a.

• Yahoo!

(8)

Fecha de la regist ración : 5 d e Ju n io de l 2 0 0 0 . Fecha de las consult as : 1 0 de Ju lio de l 2 0 0 0 .

ALTAVI STA

A cont inuación de det allarán las búsquedas r ealizadas para cada uno de los dom inios seleccionados en Alt avist a.

host : psr ealest at e.com - Traj o com o r esult ado 21 páginas. host : profesionalessrl.com - Traj o com o r esult ado 2 páginas. host : discbank.com .uy - Traj o com o r esult ado 41 páginas.

Real Est at e Br ok er s Uruguay - Prim er result ado. Real Est at e Br ok er s Mont evideo - Prim er result ado. Real Est at e Br ok er s Punt a del Est e - Prim er result ado. + Alquiler + Pr opiedades + Uruguay 5t a. posición

“ Pr om ociones y Servicios” - Prim er result ado. + Pr om ociones + Servicios - Prim er result ado. “ Punt a del Est e” - 12va. posición

“ + Financiam ient o + I nv ersiones” - Prim er lugar : “ Pr ofesionales” No figura

“ Pr ofesionales Srl” - No figura “ Pr ofesionales SRL” - Prim er Lugar + Pr ofesionales + Uruguay - No figura

Discount Bank - 2do. lugar

“ Discount ” ( Sólo Español) - Prim er lugar página principal

“ + Bank + Lat in + Am erica” - Prim er lugar : 39.134.

YAH OO!

A cont inuación de det allarán las búsquedas r ealizadas para cada uno de los dom inios seleccionados en Yahoo!

w w w .psrealest at e.com - Traj o com o r esult ado 7 páginas. w w w .pr ofesionalessrl.com - Traj o com o r esult ado 2 páginas. w w w .discbank.com .uy - Traj o com o r esult ado 5 páginas.

+ Alquiler + Pr opiedades + Uruguay 8 result ados sin figurar. “ Pr om ociones y Servicios” - Prim er result ado.

+ Pr om ociones + Servicios - Prim er result ado. Real Est at e Br ok er s Uruguay- No figura.

Real Est at e Br ok er s Mont evideo - No figura. Real Est at e Br ok er s Punt a del Est e - No figura.

“ + Financiam ient o + I nv ersiones” - Prim er lugar : “ Pr ofesionales” - No figura

(9)

+ Pr ofesionales + Uruguay - No figura ( Exist en 320 r esult ados) Discount Bank - No figura.

“ Discount ” ( Sólo Español) - No figura. “ + Bank + Lat in + Am erica” - No figura.

LYCOS

A cont inuación de det allarán las búsquedas r ealizadas para cada uno de los dom inios seleccionados en Ly cos.

host : psr ealest at e.com - Traj o com o r esult ado 11 páginas. host : profesionalesrl.com - Traj o com o r esult ado 5 páginas. host : discbank.com .uy - Traj o com o r esult ado 12 páginas.

+ Alquiler + Pr opiedades + Uruguay - No figura. “ Pr om ociones y Ser vicios” - 3er- 6t o. 7m o. Lugar + Pr om ociones + Servicios - 3er . 5t o. Y 7m o. Lugar . Real Est at e Br ok er s Uruguay- Segundo Lugar .

Real Est at e Br ok er s Mont evideo - Segundo Lugar . Real Est at e Br ok er s Punt a del Est e - Segundo Lugar.

“ + Financiam ient o + I nv ersiones” - Prim er Lugar.

+ Pr ofesionales + srl - Los prim er os 15 r esult ados pert enecen al sit io. " Pr ofesionales SRL" - Los prim er os 15 r esult ados pert enecen al sit io. + Pr ofesionales + Uruguay - No figura ( Exist en 28451 result ados)

“ + Bank + Lat in + Am erica” - Prim er os 3 r esult ados pert enecen al sit io- “ Bancos Uruguay” - No figura en 9314 r esult ados.

Discount Bank - 4t o. Lugar.

6 . Con clusion es

A part ir de los dat os recogidos se puede afirm ar claram ent e las difer encias exist ent es en los dist int os com ponent es de los m ot ores de búsqueda y las dist int as polít icas de indexación.

Por ello debem os t ener en cuent a a la hora de disenar un Sit io y arm ar las páginas que lo com pongan ciert os punt os que pueden ser claves a la hora de figurar en las bases de dat os de los m ot ores de búsqueda indexados por las palabras que se desea.

Alt avist a, a diferencia de los rest ant es, es sensit ivo a m ayúsculas y m inúsculas. Los algorit m os para la búsqueda y det erm inación de relevancia varían en las prioridades dadas a los siguient es aspect os:

• t ít ulo de la página.

• m et adat os definidos.

• com binación de los dos ant erior es.

• repet ición de las palabras clave.

(10)

Alt avist a indexa las páginas a part ir de los prim er os 1024 caract er es de la página, t om ando de esa form a el t ít ulo, encabezados y m et aet iquet as exist ent es en cada página.

Los algorit m os em pleados por Ly cos definen la relevancia a part ir de la cant idad de aciert os de una búsqueda en el t ít ulo de la página y los m et adat os definidos en ella.

Yahoo! , al agrupar los sit ios en cat egorías en form a m anual, es m ás lent o en lo que refiere a la indexación y en uno de los casos analizados no figura, luego de haber solicit ado la indexación, un m es at rás.

Los m ot or es de búsqueda, cont inuarán m ej orando sus com ponent es, con el avance de la t ecnología, perm it iendo a los navegant es encont rar lo que est os buscan en for m a cada v ez m ás eficient e.

Los m edios de alm acenam ient o de inform ación, al igual que los algorit m os em pleados para la búsqueda e indexación de dat os cont inuarán evolucionando, surgirán nuevas t ecnologías que hoy en día se encuent ran en fase de pr ot ot ipo o prueba, las cuales perm it irán ir resolviendo los “ open pr oblem s” exist ent es.

De t odas form as en lo que r espect a al present e, exist en algunos punt os que se pueden considerar para lograr una indexación cor rect a por part e de los m ot ores búsqueda a la hora de publicar un sit io w eb.

Est os punt os son :

• Hacer buen uso de las et iquet as de las páginas.

• Arm ar eficazm ent e el encabezado de cada página.

• Ut ilizar Met a- et iquet as.

• No hacer páginas con excesiva cant idad de t ext o.

• No ut ilizar Fram es o Cuadros.

• Ser pacient e.

Re fe r e n cia s

En los siguient es sit ios Web podrá encont rar inform ación com plem ent ar ia al present e inform e.

Sear ch Engine Wat ch -

FAST Search -

Advanced Searching

Kansas Cit y Public Library -

Sear ch Engine Spiders

Sear ch Engine Spiders I I -

Sear ch Engine Feat ur es

WWW9 Papers -

(11)

AN EX O I

Gr á fica de Com pa r a ción e n t r e M ot or e s d e Bú squ e da

AltaVista

Excite

HotBot

Infoseek

Lycos

Northern

Light

Tamaño 250 Millones de páginas 250 Millones de páginas y objetos multimedia

110 Millones de Sitios 75 Millones de páginas 50 Millones de páginas

200 Millones de Sitios

Full-text

SI SI SI SI NO SI

Palabra por defecto

OR OR AND or and and

Boolean connectors

AND, AND NOT, NEAR AND, AND NOT

OR, NOT and, not or, not, adj., near, before, far or, not Búsqueda de Frase Usar Comillas Usar Comillas Usar Comillas Usar Comillas Usar Comillas Usar Comillas

Truncado

No, usar * No No, ? y * No No Automático

Sensible a Mayúsculas

SI No SI SI No No

Inclusión

de Palabras

Usar + Usar + Usar + Usar + Usar + Usar +

Eliminación

de Palabras

Usar - Usar - Usar - Usar - Usar - Usar

-Detección de Duplicados

Agupados por un mismo título

SI

Agupados por un mismo título

SI SI SI

Especiales

Limitar por

fecha, lenguaje o un campo seguido por una coma Búsqueda por Conceptos

Limitar por fecha, lenguaje, ubicación y profundidad de página Encontrar búsquedas similares Buscar por imagines y archivos de sonido

Carpetas personalizadas

(12)

A con t in u a ción se de t a lla n los d ist in t os a g e n t e s o Sp ide r s qu e u t iliz a n los m ot or e s de bú squ e da m á s popu la r e s :

Motor de Búsqueda Nombre del Agente Nombre del Host

(normal spider)

Scooter/2.0 G.R.A.B. X2.0 Scooter/1.0 [email protected]

scooter.pa-x.dec.com scooter*.av.pa-x.dec.com ejs.: scooter3.av.pa-x.dec.com

(instant spider)

Scooter/1.0 add-url.altavista.digital.com ww2.altavista.digital.com

(mega spider)

ArchitextSpider crawl*.atext.com ej. : crawl2.atext.com

(fresh spider)

ArchitextSpider crimpshrine.atext.com

(Experimental search engine)

BackRub/2.1

[email protected] http://google.stanford.edu/

*.stanford.edu ej. : hake.stanford.edu

(powers

Slurp/2.0 ([email protected]; http://www.inktomi.com/slurp.html)

*.inktomi.com ejs : j2001.inktomi.com

or j10.inktomi.com

(normal spider)

InfoSeek Sidewinder/0.9 *.infoseek.com ejs: wilbur-bbn.infoseek.com

o

IP: 204.162.98.90

(instant spider)

Mozilla/3.01 (Win95; I) Idem anterior

(regular spider)

Lycos_Spider_(T-Rex) lycosidae.lycos.com o

*.pgh.lycos.com ejs : spider3.srv.pgh.lycos.com

(Add URL spider)

Lycos_Spider_(T-Rex) *.sjc.lycos.com ej: sjc-fe4-1.sjc.lycos.com

(13)

Ca nt ida d de Búsque da s r e a liz a da s e n un m e s.

FUENTE

:

SearchEngineWatch.

-

La sig u ie n t e t a bla ilu st r a la s p r e f e r e n cia s de los n a ve ga n t e s a la h or a de con su lt a r dif e r e n t e s m ot or e s de bú squ e da s

Servicio AV AJ EX GO GT HB LS LY MSN NS SP YH

AV x 24% 22% 23% 25% 25% 29% 26% 19% 16% 20% 18%

AJ 4% x 4% 4% 4% 5% 5% 3% 3% 3% 4% 3%

EX 29% 31% x 23% 38% 33% 30% 30% 20% 30% 35% 20%

GO 43% 36% 33% x 35% 42% 36% 41% 32% 30% 40% 30%

GT 15% 14% 17% 11% x 20% 25% 19% 11% 19% 21% 9%

HB 17% 20% 17% 15% 22% x 21% 27% 11% 15% 18% 12%

LS 23% 20% 18% 15% 33% 24% x 22% 13% 21% 20% 13%

LY 36% 26% 31% 30% 44% 55% 39% x 26% 29% 37% 23%

MSN 52% 42% 42% 47% 53% 44% 45% 52% x 39% 46% 40%

NS 29% 31% 43% 30% 59% 41% 51% 40% 26% x 47% 27%

SP 14% 17% 19% 15% 25% 19% 18% 19% 12% 18% x 11%

YH 68% 65% 58% 63% 61% 67% 64% 65% 57% 56% 62%

Motor Cantida de Búsquedas Fecha de Informado

AltaVista

55 millones

05/2000

Inktomi

47 millones

04/2000

Google

12 millones

04/2000

Ask Jeeves

4 millones

03/2000

(14)

Alta Vista

InfoSeek

Lycos

# de URLs 16 millones 1 millón 10,75 millones

Documentación Excelente; incluye los detalles y los ejemplos de la búsqueda para las interrogaciones simples y avanzadas.

Muy largo; algo difícil de localizar.

Justo, tan completo como podía ser.

Detección Duplicada

No Sí No

El Buscar Del Campo

Sí No No

Indexación de direcciones

Con texto completo Con texto completo

URLs, también opción de otras partes de paginaciones y texto.

Conjuntos Múltiples De la Búsqueda

No No No

Boleano Jerarquizada

Sí No No

El Buscar De la Proximidad

Sí, asegura ambos términos están dentro de diez palabras (o de frases si los términos se incluyen en cotizaciones).

Sí Sí, elija el tipo del emparejamiento (flojo, feria, los etc.) de menú pull-down.

Graduación De la Importancia

Sí, puede especificar qué términos al peso primero en la visualización de la extracción.

Sí Sí

Truncamiento Sí, pueden utilizar un asterisco en vástagos de la palabra más de largo de tres cartas.

Referencias

Documento similar

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

dente: algunas decían que doña Leonor, &#34;con muy grand rescelo e miedo que avía del rey don Pedro que nueva- mente regnaba, e de la reyna doña María, su madre del dicho rey,

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

Sanz (Universidad Carlos III-IUNE): &#34;El papel de las fuentes de datos en los ranking nacionales de universidades&#34;.. Reuniones científicas 75 Los días 12 y 13 de noviembre

(Banco de España) Mancebo, Pascual (U. de Alicante) Marco, Mariluz (U. de València) Marhuenda, Francisco (U. de Alicante) Marhuenda, Joaquín (U. de Alicante) Marquerie,

6 Para la pervivencia de la tradición clásica y la mitología en la poesía machadiana, véase: Lasso de la Vega, José, “El mito clásico en la literatura española

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que