Sources de produits
Breezaro répond aux questions sur les produits avec des prix, une disponibilité et des images en temps réel. La précision de ces réponses dépend entièrement de ce que nous lisons depuis votre boutique. Cette page explique les trois façons dont nous pouvons lire votre catalogue, et comment nous estimons les produits sur les e-shops sur mesure qui ne publient pas de feed.
Sources prises en charge
Shopify Public Feed
Lit /products.json depuis l'URL de votre boutique — le même feed public que n'importe quel visiteur peut consulter. Aucun login ni jeton API requis.
Collez l'URL de votre boutique (ex. shop.example.com) dans l'assistant.
Recommandé pour : toute boutique Shopify.
Flux XML
Flux produits standards : Heureka, Google Shopping, Glami, Zboží.cz et formats similaires.
Collez l'URL publique du flux dans l'assistant.
Recommandé pour : les boutiques qui publient déjà un flux marketing.
Crawler avec détection de produits
Visite les pages publiques de votre boutique, lit les données structurées de produits (JSON-LD, microdata, dataLayer) et les balises Open Graph, puis assemble le catalogue à partir de là.
Collez votre URL de base et acceptez le premier crawl.
Recommandé pour : les e-shops sur mesure ou sans plateforme standard, sans flux.
Comment nous estimons les produits sur les e-shops sur mesure
Lorsque vous connectez le crawler, nous visitons chaque page accessible et essayons de reconnaître des produits à partir des signaux que chaque page expose. La détection s'effectue par niveaux — la première correspondance complète gagne.
Ce que le crawler visite
- Chaque page accessible depuis l'URL de base configurée.
- Respecte robots.txt — les chemins interdits sont ignorés.
- Sécurisé contre SSRF : rejette les cibles internes/privées avant que toute requête ne quitte notre réseau.
Niveaux de détection
- Niveau 1 — confiance ÉLEVÉE
JSON-LD (schema.org/Product) → Microdata (itemtype="…/Product") → dataLayer (événements e-commerce GA4 / GTM). La première correspondance complète gagne.
- Niveau 2 — confiance MOYENNE
Open Graph (og:type=product) corroboré par un signal partiel de niveau 1. Les champs de niveau 1 ont la priorité en cas de conflit.
- Niveau 2 — confiance FAIBLE
Open Graph seul, lorsqu'aucun signal de niveau 1 n'existe. De nombreux thèmes ne publient que des extensions OG produit — sans ce repli, ces boutiques seraient couvertes à 0 %.
Champs obligatoires
Une page n'est acceptée comme produit que si nous pouvons lire un titre, un prix et une devise. L'image est best-effort : signal de l'extracteur → recherche dans le DOM → recherche en direct via Playwright sur le DOM post-JS.
Repli de devise
Lorsque la page n'expose pas de devise, nous l'inférons depuis le TLD de l'URL de base (ex. .cz → CZK).
Limites et fréquence de synchronisation
- 01Chaque tenant peut contenir jusqu'à 5 000 produits détectés par le crawler. Pour des catalogues plus grands, mieux vaut utiliser une source de flux.
- 02La synchronisation nocturne surveille les produits déjà détectés (prix, disponibilité, images). Les nouveaux produits n'apparaissent qu'après un nouveau crawl complet.
- 03Vous pouvez mettre en pause, reprendre ou interrompre n'importe quel run de crawl depuis l'écran Sources.