Zdroje produktů
Breezaro odpovídá na dotazy o produktech s aktuálními cenami, dostupností a obrázky. Přesnost těchto odpovědí stojí a padá s tím, co umíme z vašeho e-shopu přečíst. Tato stránka popisuje tři způsoby, jakými umíme načíst váš katalog, a jak odhadujeme produkty na zakázkových e-shopech, které nemají feed.
Podporované zdroje
Shopify Public Feed
Čteme /products.json z URL vašeho storefrontu – stejný veřejný feed, který si může otevřít kterýkoliv návštěvník. Žádné přihlášení ani API token.
Vložte URL svého storefrontu (např. shop.example.com) do průvodce.
Doporučeno pro: jakýkoliv Shopify e-shop.
XML Feed
Standardní produktové feedy: Heureka, Google Shopping, Glami, Zboží.cz a podobné formáty.
Vložte veřejnou URL feedu do průvodce.
Doporučeno pro: e-shopy, které už marketingový feed publikují.
Crawler s detekcí produktů
Navštíví veřejné stránky vašeho e-shopu, přečte strukturovaná data o produktech (JSON-LD, microdata, dataLayer) a značky Open Graph a z nich katalog poskládá.
Vložte základní URL a potvrďte první procházení.
Doporučeno pro: zakázkové e-shopy nebo e-shopy bez feedu.
Jak odhadujeme produkty na zakázkových e-shopech
Po připojení crawleru navštívíme každou dostupnou stránku a snažíme se na ní rozpoznat produkt podle signálů, které stránka nabízí. Detekce probíhá v úrovních – první kompletní shoda vyhrává.
Co crawler navštíví
- Každou dostupnou stránku z nakonfigurované základní URL.
- Respektuje robots.txt – zakázané cesty se přeskočí.
- Bezpečné vůči SSRF: interní a privátní cíle odmítáme dříve, než opustí naši síť.
Úrovně detekce
- Úroveň 1 – VYSOKÁ jistota
JSON-LD (schema.org/Product) → Microdata (itemtype="…/Product") → dataLayer (e-commerce události GA4 / GTM). První kompletní shoda vyhrává.
- Úroveň 2 – STŘEDNÍ jistota
Open Graph (og:type=product) doplněný částečným signálem z úrovně 1. Při konfliktu mají přednost pole z úrovně 1.
- Úroveň 2 – NÍZKÁ jistota
Pouze Open Graph, pokud neexistuje žádný signál úrovně 1. Mnoho šablon publikuje jen OG produktové rozšíření – bez tohoto fallbacku bychom takové e-shopy pokryli z 0 %.
Povinná pole
Stránka je přijata jako produkt jen tehdy, když z ní umíme přečíst název, cenu a měnu. Obrázek se získává best-effort: signál z extraktoru → DOM → živé Playwright vyhledání po proběhnutí JS.
Fallback pro měnu
Pokud stránka měnu neuvádí, odhadujeme ji z TLD základní URL (např. .cz → CZK).
Limity a frekvence synchronizace
- 01Každý tenant pojme maximálně 5 000 produktů detekovaných crawlerem. Větší katalogy je lepší napojit přes feed.
- 02Noční synchronizace hlídá už detekované produkty (cena, dostupnost, obrázky). Nové produkty se objeví až po dalším kompletním procházení.
- 03Běh procházení můžete kdykoliv pozastavit, obnovit nebo přerušit v sekci Zdroje.