| Asunto: | Re: [SauloNet] Rastro que dejan los navegadores | | Fecha: | Martes, 28 de Octubre, 2003 10:44:39 (+0100) | | Autor: | Saulo Barajas - Saulo.Net <webmaster @.....net>
|
Hola Juan Antonio:
Te paso unos trozos de código que tengo en una función que se
llama al principio de cada página PHP de mi web. La función
bloqueausuario() muestra una pantalla informativa al usuario,
genera un registro y me envía un correo con su IP y más datos
(puedes probarlo si quieres). Si buscas un poco por Internet
encontrarás listados enormes de programas de descarga
(prueba con "user agent" o similares) e incluso códigos mucho
mejores que el mío. Sin embargo, con este pequeño código
sencillo cubro la mayoría de los casos sin demasiada sobrecarga.
Por supuesto, hay mil formas de saltárselo pero ya sólo con esto
reduces mucho ancho de banda gastado inutilmente.
$vble_http_user_agent=$HTTP_USER_AGENT;
$listanegra = array ("HTTrack","WebCopier","Teleport","WebZIP","WebReaper","DA
5.","WebCapture","WebStripper","Getleft");
while (list ($key, $val) = each ($listanegra)) {
if (strstr ($vble_http_user_agent, $val)) {
bloqueausuario(1); #bloquea y finaliza
}
}
Cuando veo en los logs de mi web un agente de usuario que se
repite mucho, lo incluyo en la lista.
También puedes incluir una lista negra de IPs de esta misma
forma ;)
Un saludo,
--
Saulo Barajas
www.saulo.net
----- Original Message -----
From: "Juan Antonio Jiménez Torres"
Sent: Tuesday, October 28, 2003 9:38 AM
Subject: [SauloNet] Rastro que dejan los navegadores
Hola a todos:
Esta vez escribo para preguntar y no para responder...
Tengo un pequeño problema informático que pretendo resolver.
La historia es la siguiente, tengo una web en Internet. Esta web está
llena de fotos y quiero que cualquier navegador pueda funcionar
correctamente en ella, que cualquier spider o robot de un buscador pueda
recorrerla de arriba a abajo e indexarla, pero pretendo que mi página
discrimine si un navegador es del tipo wget, teleport pro, webzip o
cualquier otro browser offline y si está intentando bajarse todas las fotos
automáticamente. En este caso, rechazaría sus peticiones...
Puesto que esta discriminación ha de hacerse a nivel de servidor, pero
cómo no conozco los identificadores que usa cada navegador, he hecho un
pequeño script, que cada vez que alguien visita mi web
(http://www.fotoMadrid.com) añade una línea a un archivo indicando el
identificador del navegador que acaba de entrar a la web
(http://www.fotomadrid.com/inc/navegadores.txt). El asunto es que de esta
forma conozco sólo los identificadores de los navegadores que entran, y
sería necesario que entrase alguien con algún spider o browser offline para
que quedara un registro. Puesto que eso es precisamente lo que quiero
evitar, ahora viene mi pregunta...
¿donde puedo conseguir la lista de identificadores que dejan los
navegadores en un log?
¿me podéis enviar alguno de esos nombres que quiero prohibir?
Un saludo de ...
... Juan Antonio Jiménez
http://www.fotoMadrid.com
http://e-Contento.com
|