[Perl] generar una araña

Joel Muñoz joel_munoz en hotmail.com
Lun Nov 8 12:59:18 CST 2004


Hay 2 opciones que te ofrezco (que si usas internet y un poquito de interes 
tambien las puedes encontrar)

1) buscadores
google
http://www.google.com/search?hl=en&q=web+spider+perl

cpan.org  (HOGAR de modulos/scripts/tutoriales de PERL)
http://search.cpan.org/search?query=web+spider&mode=all

Y otros ejemplos
http://webharvest.sourceforge.net/ng/
http://www.searchtools.com/robots/robot-code.html
http://webharvest.sourceforge.net/ng/download.shtml

Si no mascas el inglich .... pos ahi ya no puedo ayudarte mucho .... aunque 
una opcion seria
http://babelfish.altavista.com

Saludos!

________________
   Joel Muñoz




>From: luis medrano <lmzaldivar en gmail.com>
>Reply-To: luis medrano <lmzaldivar en gmail.com>
>To: tei <421621 en ingta.unizar.es>
>CC: perl en tlali.iztacala.unam.mx
>Subject: Re: [Perl] generar una araña
>Date: Mon, 8 Nov 2004 10:05:04 -0800
>MIME-Version: 1.0
>Received: from mc6-f8.hotmail.com ([65.54.252.144]) by mc6-s14.hotmail.com 
>with Microsoft SMTPSVC(5.0.2195.6713); Mon, 8 Nov 2004 10:13:24 -0800
>Received: from tlali.iztacala.unam.mx ([132.248.79.97]) by 
>mc6-f8.hotmail.com with Microsoft SMTPSVC(5.0.2195.6713); Mon, 8 Nov 2004 
>10:08:32 -0800
>Received: from tlali.iztacala.unam.mx (localhost [127.0.0.1])by 
>tlali.iztacala.unam.mx (8.13.1/8.13.1/Debian-16) with ESMTP id 
>iA8IwiYN004395;Mon, 8 Nov 2004 12:58:44 -0600
>Received: from rproxy.gmail.com (rproxy.gmail.com [64.233.170.204])by 
>tlali.iztacala.unam.mx (8.13.1/8.13.1/Debian-16) with ESMTP 
>idiA8Iwf9K004392for <perl en tlali.iztacala.unam.mx>; Mon, 8 Nov 2004 12:58:42 
>-0600
>Received: by rproxy.gmail.com with SMTP id b11so384117rnefor 
><perl en tlali.iztacala.unam.mx>; Mon, 08 Nov 2004 10:05:04 -0800 (PST)
>Received: by 10.38.86.18 with SMTP id j18mr147922rnb;Mon, 08 Nov 2004 
>10:05:04 -0800 (PST)
>Received: by 10.38.102.18 with HTTP; Mon, 8 Nov 2004 10:05:04 -0800 (PST)
>X-Message-Info: vGzX0e+ktu6A1RHNAdtp7KzbDsEvhE/Ii/ali77icvw=
>DomainKey-Signature: a=rsa-sha1; q=dns; c=nofws; s=beta; 
>d=gmail.com;h=received:message-id:date:from:reply-to:to:subject:cc:in-reply-to:mime-version:content-type:content-transfer-encoding:references;b=QiFhAx/WBwBg0uoOS5f5O+In6FQsjQ8u9PNGctHkzkePda+ci1hsXoxu6YGR+YTRqr0jqJvasaBkMEjktofb6BWvwD2elyiSo9wabz+oVPrQVihjuEMzn8CrY7AeZn223VHAJBdZlAa+hf5ZFFHFYTWC31QUQ5CiYTbEOoyZZxc=
>Message-ID: <50aeae6f04110810052d26572d en mail.gmail.com>
>In-Reply-To: <418CA4AD.60201 en ingta.unizar.es>
>References: 
><50aeae6f04110515402e1e2de5 en mail.gmail.com><418CA4AD.60201 en ingta.unizar.es>
>X-BeenThere: perl en tlali.iztacala.unam.mx
>X-Mailman-Version: 2.1.5
>Precedence: list
>List-Id: Lista general de Perl en español<perl.tlali.iztacala.unam.mx>
>List-Unsubscribe: 
><http://tlali.iztacala.unam.mx/cgi-bin/mailman/listinfo/perl>, 
><mailto:perl-request en tlali.iztacala.unam.mx?subject=unsubscribe>
>List-Archive: <http://tlali.iztacala.unam.mx/pipermail/perl>
>List-Post: <mailto:perl en tlali.iztacala.unam.mx>
>List-Help: <mailto:perl-request en tlali.iztacala.unam.mx?subject=help>
>List-Subscribe: 
><http://tlali.iztacala.unam.mx/cgi-bin/mailman/listinfo/perl>, 
><mailto:perl-request en tlali.iztacala.unam.mx?subject=subscribe>
>Errors-To: perl-bounces en tlali.iztacala.unam.mx
>Return-Path: perl-bounces en tlali.iztacala.unam.mx
>X-OriginalArrivalTime: 08 Nov 2004 18:08:35.0019 (UTC) 
>FILETIME=[F69CF9B0:01C4C5BD]
>
>Vaya que si te has explicado pero ahora mi pregunta es: Que modulos de
>perl me permitirian hacer esto y donde podria encontrar la
>documentacion necesaria para hacer esto?...
>
>Saludos
>Luis
>
>
>
>On Sat, 06 Nov 2004 11:17:17 +0100, tei <421621 en ingta.unizar.es> wrote:
> > luis medrano wrote:
> >
> >
> > > Lista,
> > >
> > > alguien me podria explicar con manzanitas como puedo generar una araña
> > > de web?...
> > >
> > > Saludos,
> > > Luis
> >
> >
> > es un procedimiento recursivo (que se llama a si mismo indefinidamente)
> >
> > Examinar (enlace)
> > {
> >   coger "enlace"
> >   extra todos los enlaces de esa pagina cogida
> >   para todos los enlaces
> >     Examinar (enlaces)
> > }
> >
> > hay modulos y cosas, sencillos y bien documentados que te sirven para
> > simplificar la tarea de bajar las paginas conociendo la url, y crear el
> > array con todos los urls de esa pagina.
> >
> > ¿lo he explicado facil?
> >
> > yo tampoco es que haya escrito uno de estos nunca,.. creo, pero se que
> > van asi :D
> >
>_______________________________________________
>Perl mailing list
>Perl en tlali.iztacala.unam.mx
>http://tlali.iztacala.unam.mx/cgi-bin/mailman/listinfo/perl

_________________________________________________________________
Express yourself instantly with MSN Messenger! Download today it's FREE! 
http://messenger.msn.com/



Más información sobre la lista de distribución Perl