Produktquellen
Breezaro beantwortet Produktfragen mit aktuellen Preisen, Verfügbarkeit und Bildern. Die Genauigkeit dieser Antworten hängt vollständig davon ab, was wir aus Ihrem Shop lesen können. Diese Seite erklärt die drei Wege, auf denen wir Ihren Katalog lesen können, und wie wir Produkte bei individuellen Online-Shops ohne Feed schätzen.
Unterstützte Quellen
Shopify Public Feed
Liest /products.json aus der URL Ihres Storefronts — derselbe öffentliche Feed, den jeder Besucher abrufen kann. Kein Login und kein API-Token erforderlich.
Storefront-URL (z. B. shop.example.com) in den Assistenten einfügen.
Empfohlen für: jeden Shopify-Shop.
XML-Feed
Standard-Produktfeeds: Heureka, Google Shopping, Glami, Zboží.cz und ähnliche Formate.
Öffentliche Feed-URL in den Assistenten einfügen.
Empfohlen für: Shops, die bereits einen Marketing-Feed veröffentlichen.
Crawler mit Produkterkennung
Besucht die öffentlichen Seiten Ihres Shops, liest strukturierte Produktdaten (JSON-LD, Microdata, dataLayer) und Open-Graph-Tags und stellt daraus den Katalog zusammen.
Basis-URL einfügen und dem ersten Crawl-Lauf zustimmen.
Empfohlen für: individuelle oder plattformlose Online-Shops ohne Feed.
Wie wir Produkte bei individuellen Online-Shops schätzen
Wenn Sie den Crawler verbinden, besuchen wir jede erreichbare Seite und versuchen, anhand der von der Seite gelieferten Signale Produkte zu erkennen. Die Erkennung läuft in Stufen — die erste vollständige Übereinstimmung gewinnt.
Was der Crawler besucht
- Jede erreichbare Seite ausgehend von der konfigurierten Basis-URL.
- Respektiert robots.txt — gesperrte Pfade werden übersprungen.
- SSRF-sicher: lehnt interne/private Ziele ab, bevor eine Anfrage unser Netzwerk verlässt.
Erkennungsstufen
- Stufe 1 — HOHE Konfidenz
JSON-LD (schema.org/Product) → Microdata (itemtype="…/Product") → dataLayer (E-Commerce-Events von GA4 / GTM). Die erste vollständige Übereinstimmung gewinnt.
- Stufe 2 — MITTLERE Konfidenz
Open Graph (og:type=product), bestätigt durch ein Teilsignal aus Stufe 1. Felder aus Stufe 1 haben bei Konflikten Vorrang.
- Stufe 2 — NIEDRIGE Konfidenz
Open Graph allein, wenn kein Signal aus Stufe 1 vorhanden ist. Viele Themes liefern nur OG-Produkterweiterungen — ohne diesen Fallback wären solche Shops mit 0 % abgedeckt.
Pflichtfelder
Eine Seite wird nur dann als Produkt akzeptiert, wenn wir Titel, Preis und Währung lesen können. Das Bild ist Best-Effort: Extraktor-Signal → DOM-Suche → Live-Suche per Playwright im Post-JS-DOM.
Währungs-Fallback
Wenn die Seite keine Währung liefert, leiten wir sie aus der TLD der Basis-URL ab (z. B. .cz → CZK).
Limits und Synchronisationstakt
- 01Pro Tenant können bis zu 5.000 per Crawler erkannte Produkte gehalten werden. Größere Kataloge sollten besser eine Feed-Quelle nutzen.
- 02Die nächtliche Synchronisation überwacht bereits erkannte Produkte (Preis, Verfügbarkeit, Bilder). Neue Produkte erscheinen erst nach einem weiteren vollständigen Crawl.
- 03Sie können jeden Crawl-Lauf im Quellenbildschirm pausieren, fortsetzen oder abbrechen.