-- PD 2008-09: Práctica 9 (16 de diciembre de 2009) -- Departamento de Ciencias de la Computación e I.A. -- Universidad de Sevilla -- ============================================================================ -- ---------------------------------------------------------------------------- -- Importación de librerías auxiliares -- -- ---------------------------------------------------------------------------- import System import IO import List( nub ) import Char import Test.QuickCheck -- --------------------------------------------------------------------- -- Introducción -- -- --------------------------------------------------------------------- {- Un "extractor de datos de la pantalla" es una herramienta para extraer datos de sitios web a partir de su código fuente. En este ejercicio, escribirá uno de los más odiado capturadores de datos: uno que extrae direcciones de correo electrónico. ¿Por qué es odiado? Porque se usa para recopilar direcciones de correo para enviarles correos basura. Sin embargo, en este ejercicio mostraremos una aplicación útil del capturador. Vamos a extrar nombres y correos de páginas escritas en HTML (HyperText Markup Language). Por ejemplo, a partir del siguiente HTML (que se encuentra en http://www.cs.us.es/~jalonso/cursos/pd/practicas/ejemplo.html)