[Perl] Contenido de sites

Luis Medrano Zaldivar aldus@todito.com
Wed, 6 Feb 2002 16:51:58 -0600 (CST)


Talvez no me explique bien...Lo que pasa es lo siguiente..

Lo que quiero hacer es por ejemplo checar cuantos <p> tiene una pagina por ejemplo y que me genere un reporte. Yo me acuerdo que perl tenia una funcion para hacer esto...pero no me acuerdo..


>On Wed, 6 Feb 2002, Luis Medrano Zaldivar wrote:
>
>> Disculpa mi ignorancia pero como se usa el wget??
>
> En realidad eso no responde a tu pregunta. wget es un
>programa para "bajar" páginas y que entre sus cualidades
>esta la de analizar el contenido para traer de manera
>recursiva las páginas relacionadas en el documento. Muy útil
>en realidad cuando quieres bajar un sitio completo.
>
>> >> optener todo el contenido de un site en particular sin
>> >> tener que usar el browser unicamente mediante el script
>> >> de perl.
>
> Para esto lo que puedes hacer es usar el módulo NET para
>establecer la conexión al servidor, traer la página,
>parsearla buscando ligas y traer las páginas, gráficas y
>demás elementos que estan en la página así como en las que
>van llegando despues.
>
> O puedes buscar en la red una versión de wget para la
>plataforma que utilizas y no reinventar el hilo negro :)
>
> Saludos,
> Toño
>---
>Every journalist has a novel in him, which is an excellent place for it.
>
>
--