Sources

Sources de produits

Breezaro répond aux questions sur les produits avec des prix, une disponibilité et des images en temps réel. La précision de ces réponses dépend entièrement de ce que nous lisons depuis votre boutique. Cette page explique les trois façons dont nous pouvons lire votre catalogue, et comment nous estimons les produits sur les e-shops sur mesure qui ne publient pas de feed.

Sources

Sources prises en charge

Shopify Public Feed

Lit /products.json depuis l'URL de votre boutique — le même feed public que n'importe quel visiteur peut consulter. Aucun login ni jeton API requis.

Collez l'URL de votre boutique (ex. shop.example.com) dans l'assistant.

Recommandé pour : toute boutique Shopify.

Flux XML

Flux produits standards : Heureka, Google Shopping, Glami, Zboží.cz et formats similaires.

Collez l'URL publique du flux dans l'assistant.

Recommandé pour : les boutiques qui publient déjà un flux marketing.

Crawler avec détection de produits

Visite les pages publiques de votre boutique, lit les données structurées de produits (JSON-LD, microdata, dataLayer) et les balises Open Graph, puis assemble le catalogue à partir de là.

Collez votre URL de base et acceptez le premier crawl.

Recommandé pour : les e-shops sur mesure ou sans plateforme standard, sans flux.

Comportement

Comment nous estimons les produits sur les e-shops sur mesure

Lorsque vous connectez le crawler, nous visitons chaque page accessible et essayons de reconnaître des produits à partir des signaux que chaque page expose. La détection s'effectue par niveaux — la première correspondance complète gagne.

Ce que le crawler visite

  • Chaque page accessible depuis l'URL de base configurée.
  • Respecte robots.txt — les chemins interdits sont ignorés.
  • Sécurisé contre SSRF : rejette les cibles internes/privées avant que toute requête ne quitte notre réseau.

Niveaux de détection

  • Niveau 1 — confiance ÉLEVÉE

    JSON-LD (schema.org/Product) → Microdata (itemtype="…/Product") → dataLayer (événements e-commerce GA4 / GTM). La première correspondance complète gagne.

  • Niveau 2 — confiance MOYENNE

    Open Graph (og:type=product) corroboré par un signal partiel de niveau 1. Les champs de niveau 1 ont la priorité en cas de conflit.

  • Niveau 2 — confiance FAIBLE

    Open Graph seul, lorsqu'aucun signal de niveau 1 n'existe. De nombreux thèmes ne publient que des extensions OG produit — sans ce repli, ces boutiques seraient couvertes à 0 %.

Champs obligatoires

Une page n'est acceptée comme produit que si nous pouvons lire un titre, un prix et une devise. L'image est best-effort : signal de l'extracteur → recherche dans le DOM → recherche en direct via Playwright sur le DOM post-JS.

Repli de devise

Lorsque la page n'expose pas de devise, nous l'inférons depuis le TLD de l'URL de base (ex. .cz → CZK).

Comportement

Limites et fréquence de synchronisation

  • 01Chaque tenant peut contenir jusqu'à 5 000 produits détectés par le crawler. Pour des catalogues plus grands, mieux vaut utiliser une source de flux.
  • 02La synchronisation nocturne surveille les produits déjà détectés (prix, disponibilité, images). Les nouveaux produits n'apparaissent qu'après un nouveau crawl complet.
  • 03Vous pouvez mettre en pause, reprendre ou interrompre n'importe quel run de crawl depuis l'écran Sources.
Confidentialité

Confidentialité et sécurité