Esta herramienta de web scraping permite a los usuarios extraer información de páginas web utilizando XPath. La interfaz de usuario está diseñada con Tailwind CSS para una experiencia moderna y responsive.
src/index.html
en tu navegador web para usar la herramienta.Para recompilar los estilos de Tailwind CSS automáticamente mientras desarrollas, ejecuta: npx tailwindcss -i ./src/input.css -o ./dist/output.css --watch.
Esto vigilará los cambios en tus archivos y recompilará los estilos automáticamente.
index.html
en tu navegador web.Para obtener imágenes de coches en Marca:
https://www.marca.com/coches-y-motos/coches.html?intcmp=MENUPROD&s_kw=coches
//img
Para obtener enlaces de noticias de coches en Marca:
https://www.marca.com/coches-y-motos/coches.html?intcmp=MENUPROD&s_kw=coches
//ul[@id='marca']//a
Para obtener todos los nombres de meta tags:
https://es.wikipedia.org/wiki/JavaScript
//meta/@name
Para obtener títulos de productos de JD Sports:
https://www.jdsports.es/marca/adidas/
//span[@class='itemTitle']
Para obtener el contenido del generador de meta tags:
https://es.wikipedia.org/wiki/JavaScript
//meta[@name='generator']/@content
src/index.html
: Archivo HTML principalsrc/script.js
: Lógica de JavaScript para el scrapingsrc/input.css
: Archivo de entrada para Tailwind CSSdist/output.css
: Archivo CSS compilado por Tailwindtailwind.config.js
: Configuración de Tailwind CSSLa herramienta incluye manejo de errores para:
Los errores se muestran de manera amigable en la interfaz de usuario.
La herramienta utiliza fetch()
y async/await
para realizar solicitudes HTTP de forma asíncrona, asegurando que la interfaz de usuario permanezca responsiva durante el proceso de scraping.
Este proyecto fue desarrollado como parte de una tarea. El objetivo principal era implementar una herramienta de web scraping utilizando XPath y diseñar una interfaz de usuario con Tailwind CSS.