Google: no sólo el mejor buscador
Análisis de las
características ocultas de Google
Saulo Barajas, Saulo.Net, 06oct02.- Internet no sería lo mismo
sin Google. El proyecto que comenzaron dos jóvenes estudiantes de la Universidad
de Stanford está revolucionando la forma de usar Internet. Pero Larry Page y
Sergey Brin no sólo han creado el mejor buscador de páginas web, algo que ya
nadie discute: el proyecto es mucho más ambicioso. Bajo una página principal de
apenas 5 KB se esconden docenas de servicios y nuevos proyectos.
Google fue fundado en 1998. Han sido 4 años de innovaciones continuas y, sin
embargo, sus creadores afirman que todavía están en la fase inicial del
proyecto. La clave del éxito: los algoritmos de ordenación. La filosofía:
exponer los resultados de forma sencilla, útil y eficiente. Todos los servicios
de Google funcionan sin intervención humana, desde la clasificación de páginas
hasta la inserción de publicidad.
Complejos algoritmos con capacidades de inteligencia artificial son capaces
de clasificar la información más rápida y eficientemente que pudiera hacerlo un
equipo de cientos de personas. Por ejemplo: el nuevo servicio de clasificación de noticias muestra siempre las
últimas noticias que se han producido en el mundo, clasificadas por secciones,
extraídas de miles de fuentes automáticamente. La información se renueva con una
periodicidad de minutos. ¿Cuántas personas harían falta para hacer semejante
trabajo? Probablemente fuese inviable.
Buscador de páginas web
Página: www.google.com
Es el servicio original de Google y, habitualmente, el único que los usuarios
conocen. Los resultados de las búsquedas se devuelven clasificados por orden de
relevancia, establecida mediante el índice PageRank. Este indicador patentado es
el corazón de Google: una página es más importante que otra si tiene un mayor
número de enlaces que apunten a ella. Las páginas de alta calidad serán
enlazadas por otras muchas páginas y esto generará un mayor PageRank que,
combinado con otros factores, asegura que las páginas que más se acerquen a
nuestra búsqueda se sitúen en primer lugar.
Buscador de imágenes
Página: http://images.google.com
Se pueden buscar imágenes relacionadas con un determinado tema. Google
devolverá un listado de imágenes en miniatura ordenado por orden de importancia.
Para la clasificación de las imágenes se utiliza el texto que las rodea en la
página original. Estas imágenes en miniatura suelen ocupar menos de 5 KB cada
una y son las únicas que Google almacena en sus servidores. Si hacemos clic en
alguna de ellas se abrirá la página original donde podremos ver la imagen a
tamaño completo dentro de su contexto.
Grupos de noticias
Página: http://groups.google.com
Los grupos de noticias Usenet siempre han sido los grandes desconocidos de
Internet debido a que para acceder a ellos se requería la configuración de un
programa específico y un servidor de news. Pero gracias a Google es
posible el acceso por página web a la enorme base de datos de mensajes
publicados en Usenet. También se permite la publicación de nuevos mensajes. El
servicio, desarrollado originalmente por Deja.com, fue adquirido por Google en
febrero de 2001.
El mensaje
más antiguo que se puede encontrar en el archivo de mensajes está fechado en
mayo del año 1981, año en el que una compañía llamada Microsoft se
daba a conocer por el lanzamiento del sistema operativo MS-DOS. El archivo
completo incluye más de 20 años de
historia. Podemos encontrar mensajes históricos como el de un joven llamado
Linus Torvalds anunciando que había desarrollado una versión gratuita de
apariencia similar a Minix
(sistema operativo creado por el profesor Tanenbaum con fines educativos) o el famoso
debate entre profesor y estudiante acerca de Linux: "escribir un nuevo
sistema operativo sólo para el 386 en 1991 te lleva a obtener tu segundo
suspenso para este trimestre. Pero si el examen final lo haces realmente bien,
todavía puedes aprobar el curso", le dijo Tanenbaum al creador de
Linux.
El potente buscador de mensajes es una herramienta complementaria a la
búsqueda de páginas web. Frecuentemente se encuentra en mensajes información que
no está disponible en ninguna página web. Por ejemplo, reportes de usuarios
acerca de problemas técnicos sobre combinaciones específicas de hardware y
software. También es muy útil para conocer distintas opiniones sobre un tema o
producto concreto.
Corrección de errores
En realidad no es un servicio establecido como tal en Google, pero es tan
útil que merece la pena dedicarle un apartado. Por ejemplo, suponga que no está
seguro de si la palabra "Washinton" está bien escrita. Basta hacer una búsqueda
de la palabra dudosa y Google nos indicará la palabra correcta:
"Washington". Esta característica no se basa en un corrector ortográfico sino
que parte del supuesto de que las palabras bien escritas aparecerán más veces en
la web que las incorrectas. La gran velocidad de respuesta de Google
probablemente nos resuelva dudas ortográficas en un menor tiempo que una
consulta a un diccionario o enciclopedia. Aunque no debemos olvidar el método de
funcionamiento de esta características para interpretar correctamente la validez
de los resultados.
La capacidad de enmienda automática de errores está patente incluso en el
propio nombre de dominio de Google. ¿A dónde iremos si escribimos www.gogle.com, www.gooogle.com o www.googel.com? Pruébelo y comprobará que
Google ha adquirido nombres de dominio similares para que usuarios despistados
sigan llegando al popular buscador.
Traducciones
Página: http://www.google.com/language_tools?hl=es
Google es un proyecto que pretende ofrecer a toda la comunidad internacional
una web ordenada y accesible. El esfuerzo para hacer Google cercano a distintas
comunidades de usuarios se observa accediendo a las versiones específicas del
buscador para países como Japón e Israel. También se pueden encontrar
versiones para sitios más exóticos como Islas
Vírgenes o Micronesia.
La interfaz de Google se puede mostrar en más de 80 idiomas distintos (para
español es: http://www.google.com/intl/es/),
algunos de ellos tan curiosos como el Klingon (la lengua de Star Trek), el Elmer Fudd (el gruñón
de los Looney Tunes) o el Bork
Bork Bork (la jerga que habla el cocinero sueco de los Muppets).
Otro "idioma" curioso es el hacker, que fue el origen de un
bulo que circuló por Internet alertando de una supuesta intrusión en el popular
sitio cuando, en realidad, se trata de una funcionalidad fruto del gran sentido
del humor de sus creadores. Las traducciones están realizadas por voluntarios, coordinados
por la empresa, que pasan a formar parte de proyectos de
traducción.
Pero no sólo se traduce la interfaz de Google, también se ofrece la
posibilidad de traducir
textos o páginas web completas.
Directorio
Página: http://directory.google.com
Los buscadores se pueden clasificar en motores de búsqueda (indexación
automática), índices (un grupo de personas clasifican las páginas en categorías)
y metabuscadores (buscador que utiliza otros buscadores). Google ha pertenecido
siempre al primer grupo, aunque con la inclusión del directorio,
ahora también al segundo. Sin embargo, no cabe en la filosofía de Google tener
un grupo de empleados realizando las tareas de clasificación (como es el caso de
www.yahoo.com).
¿Cómo funciona entonces el directorio de Google? Muy sencillo: se basa en Dmoz.org, un proyecto abierto gestionado por
Netscape para la ordenación de la web por voluntarios. Al contrario que otros
buscadores que venden las primeras posiciones de cada categoría, el directorio
de Google ordena las páginas objetivamente, según su índice PageRank. De esta
forma se combinan la selección humana de páginas y los algoritmos automáticos de
Google.
...
[el artículo está sin terminar. La versión final aparecerá
publicada en:
http://www.saulo.net/pub/articulo.php?cod=google ]
Un saludo,
--
Saulo Barajas
www.saulo.net