Zdroje

Zdroje produktů

Breezaro odpovídá na dotazy o produktech s aktuálními cenami, dostupností a obrázky. Přesnost těchto odpovědí stojí a padá s tím, co umíme z vašeho e-shopu přečíst. Tato stránka popisuje tři způsoby, jakými umíme načíst váš katalog, a jak odhadujeme produkty na zakázkových e-shopech, které nemají feed.

Zdroje

Podporované zdroje

Shopify Public Feed

Čteme /products.json z URL vašeho storefrontu – stejný veřejný feed, který si může otevřít kterýkoliv návštěvník. Žádné přihlášení ani API token.

Vložte URL svého storefrontu (např. shop.example.com) do průvodce.

Doporučeno pro: jakýkoliv Shopify e-shop.

XML Feed

Standardní produktové feedy: Heureka, Google Shopping, Glami, Zboží.cz a podobné formáty.

Vložte veřejnou URL feedu do průvodce.

Doporučeno pro: e-shopy, které už marketingový feed publikují.

Crawler s detekcí produktů

Navštíví veřejné stránky vašeho e-shopu, přečte strukturovaná data o produktech (JSON-LD, microdata, dataLayer) a značky Open Graph a z nich katalog poskládá.

Vložte základní URL a potvrďte první procházení.

Doporučeno pro: zakázkové e-shopy nebo e-shopy bez feedu.

Chování

Jak odhadujeme produkty na zakázkových e-shopech

Po připojení crawleru navštívíme každou dostupnou stránku a snažíme se na ní rozpoznat produkt podle signálů, které stránka nabízí. Detekce probíhá v úrovních – první kompletní shoda vyhrává.

Co crawler navštíví

  • Každou dostupnou stránku z nakonfigurované základní URL.
  • Respektuje robots.txt – zakázané cesty se přeskočí.
  • Bezpečné vůči SSRF: interní a privátní cíle odmítáme dříve, než opustí naši síť.

Úrovně detekce

  • Úroveň 1 – VYSOKÁ jistota

    JSON-LD (schema.org/Product) → Microdata (itemtype="…/Product") → dataLayer (e-commerce události GA4 / GTM). První kompletní shoda vyhrává.

  • Úroveň 2 – STŘEDNÍ jistota

    Open Graph (og:type=product) doplněný částečným signálem z úrovně 1. Při konfliktu mají přednost pole z úrovně 1.

  • Úroveň 2 – NÍZKÁ jistota

    Pouze Open Graph, pokud neexistuje žádný signál úrovně 1. Mnoho šablon publikuje jen OG produktové rozšíření – bez tohoto fallbacku bychom takové e-shopy pokryli z 0 %.

Povinná pole

Stránka je přijata jako produkt jen tehdy, když z ní umíme přečíst název, cenu a měnu. Obrázek se získává best-effort: signál z extraktoru → DOM → živé Playwright vyhledání po proběhnutí JS.

Fallback pro měnu

Pokud stránka měnu neuvádí, odhadujeme ji z TLD základní URL (např. .cz → CZK).

Chování

Limity a frekvence synchronizace

  • 01Každý tenant pojme maximálně 5 000 produktů detekovaných crawlerem. Větší katalogy je lepší napojit přes feed.
  • 02Noční synchronizace hlídá už detekované produkty (cena, dostupnost, obrázky). Nové produkty se objeví až po dalším kompletním procházení.
  • 03Běh procházení můžete kdykoliv pozastavit, obnovit nebo přerušit v sekci Zdroje.
Soukromí

Soukromí a bezpečnost