Quellen

Produktquellen

Breezaro beantwortet Produktfragen mit aktuellen Preisen, Verfügbarkeit und Bildern. Die Genauigkeit dieser Antworten hängt vollständig davon ab, was wir aus Ihrem Shop lesen können. Diese Seite erklärt die drei Wege, auf denen wir Ihren Katalog lesen können, und wie wir Produkte bei individuellen Online-Shops ohne Feed schätzen.

Quellen

Unterstützte Quellen

Shopify Public Feed

Liest /products.json aus der URL Ihres Storefronts — derselbe öffentliche Feed, den jeder Besucher abrufen kann. Kein Login und kein API-Token erforderlich.

Storefront-URL (z. B. shop.example.com) in den Assistenten einfügen.

Empfohlen für: jeden Shopify-Shop.

XML-Feed

Standard-Produktfeeds: Heureka, Google Shopping, Glami, Zboží.cz und ähnliche Formate.

Öffentliche Feed-URL in den Assistenten einfügen.

Empfohlen für: Shops, die bereits einen Marketing-Feed veröffentlichen.

Crawler mit Produkterkennung

Besucht die öffentlichen Seiten Ihres Shops, liest strukturierte Produktdaten (JSON-LD, Microdata, dataLayer) und Open-Graph-Tags und stellt daraus den Katalog zusammen.

Basis-URL einfügen und dem ersten Crawl-Lauf zustimmen.

Empfohlen für: individuelle oder plattformlose Online-Shops ohne Feed.

Verhalten

Wie wir Produkte bei individuellen Online-Shops schätzen

Wenn Sie den Crawler verbinden, besuchen wir jede erreichbare Seite und versuchen, anhand der von der Seite gelieferten Signale Produkte zu erkennen. Die Erkennung läuft in Stufen — die erste vollständige Übereinstimmung gewinnt.

Was der Crawler besucht

  • Jede erreichbare Seite ausgehend von der konfigurierten Basis-URL.
  • Respektiert robots.txt — gesperrte Pfade werden übersprungen.
  • SSRF-sicher: lehnt interne/private Ziele ab, bevor eine Anfrage unser Netzwerk verlässt.

Erkennungsstufen

  • Stufe 1 — HOHE Konfidenz

    JSON-LD (schema.org/Product) → Microdata (itemtype="…/Product") → dataLayer (E-Commerce-Events von GA4 / GTM). Die erste vollständige Übereinstimmung gewinnt.

  • Stufe 2 — MITTLERE Konfidenz

    Open Graph (og:type=product), bestätigt durch ein Teilsignal aus Stufe 1. Felder aus Stufe 1 haben bei Konflikten Vorrang.

  • Stufe 2 — NIEDRIGE Konfidenz

    Open Graph allein, wenn kein Signal aus Stufe 1 vorhanden ist. Viele Themes liefern nur OG-Produkterweiterungen — ohne diesen Fallback wären solche Shops mit 0 % abgedeckt.

Pflichtfelder

Eine Seite wird nur dann als Produkt akzeptiert, wenn wir Titel, Preis und Währung lesen können. Das Bild ist Best-Effort: Extraktor-Signal → DOM-Suche → Live-Suche per Playwright im Post-JS-DOM.

Währungs-Fallback

Wenn die Seite keine Währung liefert, leiten wir sie aus der TLD der Basis-URL ab (z. B. .cz → CZK).

Verhalten

Limits und Synchronisationstakt

  • 01Pro Tenant können bis zu 5.000 per Crawler erkannte Produkte gehalten werden. Größere Kataloge sollten besser eine Feed-Quelle nutzen.
  • 02Die nächtliche Synchronisation überwacht bereits erkannte Produkte (Preis, Verfügbarkeit, Bilder). Neue Produkte erscheinen erst nach einem weiteren vollständigen Crawl.
  • 03Sie können jeden Crawl-Lauf im Quellenbildschirm pausieren, fortsetzen oder abbrechen.
Datenschutz

Datenschutz & Sicherheit