Herramientas de Extracción Web Scraper.
🔍 Guía Práctica: Cómo Usar Web Scraper Paso a Paso.
Para descargar Web Scraper, haz clic AQUÍ.
🧰 Paso 1: Ingresa al sitio web.
Dirígete a la página desde donde deseas extraer información. Si hay varias categorías o departamentos, elige el que te interese. Por ejemplo: PRODUCTS > DRINKWARE.
🔢 Paso 2: Selecciona la subcategoría.
Si hay subcategorías, entra a la que prefieras. En este ejemplo: SHOP ALL.
📍 Paso 3: Identifica la cantidad de páginas.
Desliza hasta el final de la página para encontrar el último número de página. Haz clic sobre él para que la URL se actualice y puedas copiarla más adelante.
⌨️ Paso 4: Verifica la URL.
Asegúrate de que la URL termine con el formato correcto, como: ?pageNumber=10. Esto es clave para automatizar la extracción de datos por páginas.
⌨️ Paso 5: Abre las herramientas de desarrollador.
Presiona Ctrl + Shift + C para abrir el panel de configuración del navegador.
📂 Paso 6: Accede a la extensión Web Scraper.
Haz clic en la pestaña "Web Scraper" en el panel lateral.
➕ Paso 7: Crea un nuevo Sitemap.
Selecciona "CREATE NEW SITEMAP" > "CREATE SITEMAP".
🖊️ Paso 8: Asigna nombre y URL.
-
En "SITEMAP NAME": escribe un nombre simple (ej.
dei-example-drinkware, sin mayúsculas ni caracteres especiales). -
En "START URL": usa una versión modificada de la URL. Por ejemplo:
https://www.deidirect.com/Products-Drinkware-Shop-All/?pageNumber=[1-10]
Esto le indica a Web Scraper que navegue por las páginas del 1 al 10.
Haz clic en "CREATE SITEMAP".
🌐 Paso 9: Comienza la configuración en _ROOT.
Haz clic en "_ROOT" para comenzar a configurar el recorrido de extracción.
📁 Paso 10: Agrega un nuevo selector.
Haz clic en "ADD NEW SELECTOR". Llena los campos así:
-
ID:
LINK -
TYPE: selecciona
Link
Marca la opción MULTIPLE para indicar que hay varios productos.
Selecciona dos productos para que se reconozcan todos los demás. Luego haz clic en "DONE SELECTING" y finalmente en "SAVE SELECTOR".
🤖 Paso 11: Programa los detalles de cada producto.
Haz clic sobre "LINK" (ya aparecerá como subproceso de _ROOT) para entrar a su configuración.
Haz clic en uno de los productos para iniciar la extracción desde su página interna.
Agrega un nuevo selector para extraer, por ejemplo:
-
ID:
UPC -
Selecciona el elemento en la página (aparecerá sombreado en rojo)
-
Haz clic en "DONE SELECTING" y luego en "SAVE SELECTOR"
Repite el proceso para cualquier otro dato que quieras extraer.
📊 Paso 12: Verifica la estructura con Selector Graph.
Desde el menú desplegable del sitemap, elige "SELECTOR GRAPH" para verificar que tu configuración esté correcta.
▶️ Paso 13: Inicia la extracción.
Desde el mismo menú desplegable, selecciona "SCRAPE" > "START SCRAPING".
Haz clic en "REFRESH" para ver el progreso.
Cuando termine, el ícono de Web Scraper desaparecerá y se mostrará una notificación.
📄 Paso 14: Exporta los datos a CSV.
Desde el menú del sitemap, elige "EXPORT DATA AS CSV" y haz clic en "DOWNLOAD ALL".
💾 Paso 15: Convierte el CSV a Excel.
-
Abre un archivo nuevo de Excel.
-
Ve a la pestaña "DATOS" > "DESDE TEXTO/CSV".
-
Selecciona el archivo descargado y haz clic en "IMPORTAR".
-
En la opción DELIMITADOR, elige "COMA".
-
Haz clic en "CARGAR" para ver tus datos organizados por columnas.
🎉¡Listo! Ya sabes cómo automatizar la extracción de datos usando Web Scraper paso a paso. Esta herramienta te ahorrará mucho tiempo y esfuerzo al momento de recopilar información valiosa de sitios web.