Fuentes

Fuentes de productos

Breezaro responde preguntas sobre productos con precios, disponibilidad e imágenes en vivo. La precisión de esas respuestas depende totalmente de lo que podamos leer de tu tienda. Esta página explica las tres formas en que podemos leer tu catálogo y cómo estimamos productos en e-commerces personalizados que no publican un feed.

Fuentes

Fuentes admitidas

Shopify Public Feed

Lee /products.json desde la URL de tu tienda — el mismo feed público al que cualquier visitante puede acceder. Sin login ni token de API.

Pega la URL de tu tienda (ej. shop.example.com) en el asistente.

Recomendado para: cualquier tienda Shopify.

XML Feed

Feeds estándar de productos: Heureka, Google Shopping, Glami, Zboží.cz y formatos similares.

Pega la URL pública del feed en el asistente.

Recomendado para: tiendas que ya publican un feed de marketing.

Rastreador con detección de productos

Visita las páginas públicas de tu tienda, lee datos estructurados de productos (JSON-LD, microdatos, dataLayer) y etiquetas Open Graph, y arma el catálogo desde ahí.

Pega tu URL base y acepta el primer rastreo.

Recomendado para: e-commerces personalizados o sin plataforma estándar y sin feed.

Comportamiento

Cómo estimamos productos en e-commerces personalizados

Cuando conectas el rastreador, visitamos cada página accesible e intentamos reconocer productos a partir de las señales que cada página expone. La detección funciona por niveles — la primera coincidencia gana.

Qué visita el rastreador

  • Cada página accesible desde la URL base configurada.
  • Respeta robots.txt — las rutas no permitidas se omiten.
  • Seguro contra SSRF: rechaza objetivos internos/privados antes de que cualquier petición salga de nuestra red.

Niveles de detección

  • Nivel 1 — Confianza ALTA

    JSON-LD (schema.org/Product) → Microdatos (itemtype="…/Product") → dataLayer (eventos de e-commerce de GA4 / GTM). Gana la primera coincidencia completa.

  • Nivel 2 — Confianza MEDIA

    Open Graph (og:type=product) corroborado por una señal parcial del Nivel 1. Los campos del Nivel 1 prevalecen en caso de conflicto.

  • Nivel 2 — Confianza BAJA

    Open Graph en solitario, cuando no existe ninguna señal de Nivel 1. Muchas plantillas solo publican extensiones OG de producto — sin este fallback, esas tiendas tendrían 0% de cobertura.

Campos obligatorios

Una página se acepta como producto solo si podemos leer un título, un precio y una moneda. La imagen es best-effort: señal del extractor → búsqueda en el DOM → búsqueda en vivo con Playwright sobre el DOM post-JS.

Fallback de moneda

Cuando la página no expone una moneda, la inferimos del TLD de la URL base (ej. .cz → CZK).

Comportamiento

Límites y frecuencia de sincronización

  • 01Cada tenant puede contener hasta 5000 productos detectados por el rastreador. Para catálogos más grandes conviene usar una fuente de feed.
  • 02La sincronización nocturna vigila los productos ya detectados (precio, disponibilidad, imágenes). Los productos nuevos solo aparecen tras un nuevo rastreo completo.
  • 03Puedes pausar, reanudar o abortar cualquier ejecución del rastreo desde la pantalla de Fuentes.
Privacidad

Privacidad y seguridad