Google: no sólo el mejor buscador
Análisis de las
características ocultas de Google
Saulo Barajas, Saulo.Net, 06oct02.- Internet no sería lo
mismo sin Google. El proyecto que comenzaron dos jóvenes estudiantes de la
Universidad de Stanford está revolucionando la forma de usar Internet. Pero
Larry Page y Sergey Brin no sólo han creado el mejor buscador de páginas web,
algo que ya nadie discute: el proyecto es mucho más ambicioso. Bajo una página
principal de apenas 5 KB se esconden docenas de servicios y nuevos
proyectos.
Google fue fundado en 1998. Han sido 4 años de innovaciones continuas y,
sin embargo, sus creadores afirman que todavía están en la fase inicial del
proyecto. La clave del éxito: los algoritmos de ordenación. La filosofía:
exponer los resultados de forma sencilla, útil y eficiente. Todos los
servicios de Google funcionan sin intervención humana, desde la clasificación
de páginas hasta la inserción de publicidad.
Complejos algoritmos con capacidades de inteligencia artificial son capaces
de clasificar la información más rápida y eficientemente que pudiera hacerlo
un equipo de cientos de personas. Por ejemplo: el nuevo servicio de clasificación de noticias muestra siempre
las últimas noticias que se han producido en el mundo, clasificadas por
secciones, extraídas de miles de fuentes automáticamente. La información se
renueva con una periodicidad de minutos. ¿Cuántas personas harían falta para
hacer semejante trabajo? Probablemente fuese inviable.
Buscador de páginas web
Página: www.google.com
Es el servicio original de Google y, habitualmente, el único que los
usuarios conocen. Los resultados de las búsquedas se devuelven clasificados
por orden de relevancia, establecida mediante el índice PageRank. Este
indicador patentado es el corazón de Google: una página es más importante que
otra si tiene un mayor número de enlaces que apunten a ella. Las páginas de
alta calidad serán enlazadas por otras muchas páginas y esto generará un mayor
PageRank que, combinado con otros factores, asegura que las páginas que más se
acerquen a nuestra búsqueda se sitúen en primer lugar.
Buscador de imágenes
Página: http://images.google.com
Se pueden buscar imágenes relacionadas con un determinado tema. Google
devolverá un listado de imágenes en miniatura ordenado por orden de
importancia. Para la clasificación de las imágenes se utiliza el texto que las
rodea en la página original. Estas imágenes en miniatura suelen ocupar menos
de 5 KB cada una y son las únicas que Google almacena en sus servidores. Si
hacemos clic en alguna de ellas se abrirá la página original donde podremos
ver la imagen a tamaño completo dentro de su contexto.
Grupos de noticias
Página: http://groups.google.com
Los grupos de noticias Usenet siempre han sido los grandes desconocidos de
Internet debido a que para acceder a ellos se requería la configuración de un
programa específico y un servidor de news. Pero gracias a Google es
posible el acceso por página web a la enorme base de datos de mensajes
publicados en Usenet. También se permite la publicación de nuevos mensajes. El
servicio, desarrollado originalmente por Deja.com, fue adquirido por Google en
febrero de 2001.
El mensaje más
antiguo que se puede encontrar en el archivo de mensajes está fechado en
mayo del año 1981, año en el que una compañía llamada Microsoft
se daba a conocer por el lanzamiento del sistema operativo MS-DOS. El archivo
completo incluye más de 20 años de
historia. Podemos encontrar mensajes históricos como el de un joven
llamado Linus Torvalds anunciando que había desarrollado una versión gratuita
de apariencia similar a Minix (sistema operativo creado
por el profesor Tanenbaum con fines
educativos) o el famoso
debate entre profesor y estudiante acerca de Linux: "escribir un
nuevo sistema operativo sólo para el 386 en 1991 te lleva a obtener tu segundo
suspenso para este trimestre. Pero si el examen final lo haces realmente bien,
todavía puedes aprobar el curso", le dijo Tanenbaum al creador de
Linux.
El potente buscador de mensajes es una herramienta complementaria a la
búsqueda de páginas web. Frecuentemente se encuentra en mensajes información
que no está disponible en ninguna página web. Por ejemplo, reportes de
usuarios acerca de problemas técnicos sobre combinaciones específicas de
hardware y software. También es muy útil para conocer distintas opiniones
sobre un tema o producto concreto.
Corrección de errores
En realidad no es un servicio establecido como tal en Google, pero es tan
útil que merece la pena dedicarle un apartado. Por ejemplo, suponga que no
está seguro de si la palabra "Washinton" está bien escrita. Basta hacer una búsqueda
de la palabra dudosa y Google nos indicará la palabra correcta:
"Washington". Esta característica no se basa en un corrector ortográfico sino
que parte del supuesto de que las palabras bien escritas aparecerán más veces
en la web que las incorrectas. La gran velocidad de respuesta de Google
probablemente nos resuelva dudas ortográficas en un menor tiempo que una
consulta a un diccionario o enciclopedia. Aunque no debemos olvidar el método
de funcionamiento de esta características para interpretar correctamente la
validez de los resultados.
La capacidad de enmienda automática de errores está patente incluso en el
propio nombre de dominio de Google. ¿A dónde iremos si escribimos www.gogle.com, www.gooogle.com o www.googel.com? Pruébelo y comprobará que
Google ha adquirido nombres de dominio similares para que usuarios despistados
sigan llegando al popular buscador.
Traducciones
Página: http://www.google.com/language_tools?hl=es
Google es un proyecto que pretende ofrecer a toda la comunidad
internacional una web ordenada y accesible. El esfuerzo para hacer Google
cercano a distintas comunidades de usuarios se observa accediendo a las
versiones específicas del buscador para países como Japón e Israel. También se pueden encontrar
versiones para sitios más exóticos como Islas
Vírgenes o Micronesia.
La interfaz de Google se puede mostrar en más de 80 idiomas distintos (para
español es: http://www.google.com/intl/es/),
algunos de ellos tan curiosos como el Klingon (la lengua de Star Trek), el Elmer Fudd (el gruñón
de los Looney Tunes) o el Bork
Bork Bork (la jerga que habla el cocinero sueco de los
Muppets). Otro "idioma" curioso es el hacker, que fue el origen de
un bulo que circuló por Internet alertando de una supuesta intrusión en el
popular sitio cuando, en realidad, se trata de una funcionalidad fruto del
gran sentido del humor de sus creadores. Las traducciones están realizadas por
voluntarios,
coordinados por la empresa, que pasan a formar parte de proyectos de
traducción.
Pero no sólo se traduce la interfaz de Google, también se ofrece la
posibilidad de traducir textos o
páginas web completas.
Directorio
Página: http://directory.google.com
Los buscadores se pueden clasificar en motores de búsqueda (indexación
automática), índices (un grupo de personas clasifican las páginas en
categorías) y metabuscadores (buscador que utiliza otros buscadores). Google
ha pertenecido siempre al primer grupo, aunque con la inclusión del directorio,
ahora también al segundo. Sin embargo, no cabe en la filosofía de Google tener
un grupo de empleados realizando las tareas de clasificación (como es el caso
de www.yahoo.com).
¿Cómo funciona entonces el directorio de Google? Muy sencillo: se basa en
Dmoz.org, un proyecto abierto gestionado por
Netscape para la ordenación de la web por voluntarios. Al contrario que otros
buscadores que venden las primeras posiciones de cada categoría, el directorio
de Google ordena las páginas objetivamente, según su índice PageRank. De esta
forma se combinan la selección humana de páginas y los algoritmos automáticos
de Google.
...
[el artículo está sin terminar. La versión final aparecerá
publicada en:
http://www.saulo.net/pub/articulo.php?cod=google ]
Un saludo,
--
Saulo Barajas
www.saulo.net