Technické SEO • E-commerce

Indexace filtrační navigace: Kompletní SEO rozhodovací matice

Ivo Kylián
15. června 2026 • 11 min čtení
Indexace filtrační navigace a SEO rozhodovací matice
Filtrační navigace je tichým zabijákem crawl budgetu na e-shopech a velkých katalozích. Podle oficiálních vyjádření Googlu stojí za zhruba 50 % všech hlášených chyb s procházením webu. Nekontrolovaná kombinace parametrů, barev, velikostí a řazení dokáže vygenerovat miliony duplicitních URL adres. Tento článek přináší kompletní technickou matici pro třídění jednotlivých parametrů a vysvětluje, kdy použít robots.txt, meta noindex, canonical nebo URL fragmenty.

Když na velkém e-shopu necháte vyhledávací roboty volně procházet veškeré kombinace filtrů, koledujete si o vážný technický problém. Filtrační navigace (v angličtině faceted navigation) je skvělá pro uživatele, ale pro vyhledávače představuje obrovské riziko v podobě tzv. kombinatorického výbuchu. Jediná kategorie s osmi aktivními filtry nevygeneruje osm dalších stránek, nýbrž matematickou kombinaci všech těchto stavů vynásobenou stránkováním a řazením.

Mnoho e-shopových platforem a vývojářů řeší tento problém plošně – buď vše zakážou v robots.txt, nebo naopak na všechny parametry nasadí značku noindex. Oba přístupy jsou však extrémní a nesprávné. Správné řízení indexace vyžaduje podrobnou analýzu parametrů případ od případu. Jako specialista na technické SEO se s těmito chybami setkávám velmi často a jejich vyřešení bývá klíčem k tomu, aby vyhledávače začaly správně procházet a indexovat vaše hlavní produktové stránky.

Klíčová statistická data o filtrační navigaci

Proč byste měli filtrační navigaci věnovat zvýšenou pozornost? Následující data z reálných případových studií a vyjádření zástupců Googlu ukazují rozsah celého problému:

Statistický údaj Hodnota / Zjištění Zdroj / Kontext
Podíl na chybách procházení Googlu ~50 % všech chyb Gary Illyes (Google, 2023). Akční parametry (košík, řazení) tvoří dalších 25 %.
Poměr zbytečného procházení (Crawl waste) 39 : 1 Případová studie Ahrefs. Na 1 indexovatelnou URL připadlo 39 neindexovatelných.
Kombinatorický nárůst URL Přes 500 000 000 URL Případová studie Botify. E-shop s méně než 200k produkty vygeneroval 500M+ botům přístupných URL.
Dlouhý chvost vyhledávání (Long-tail) 39,33 % celkové hledanosti Ahrefs data. Až 99,84 % klíčových slov má hledanost pod 1000/měsíc, ale tvoří téměř 40 % poptávky.

Crawl Budget a jeho dvě složky

Abychom pochopili dopad filtrů na vyhledávače, musíme si správně definovat crawl budget. Podle oficiální dokumentace Google Search Central se skládá ze dvou hlavních složek:

  1. Crawl capacity limit (Limit kapacity procházení): Maximální zatížení, které web zvládne bez zpomalení serveru. Pokud server reaguje pomalu, Googlebot okamžitě sníží frekvenci procházení.
  2. Crawl demand (Poptávka po procházení): Jak často vyhledávač považuje za nutné vaše stránky reindexovat. Je určena popularitou stránek a frekvencí jejich aktualizací.

Nekontrolovaná filtrační navigace poškozuje obě tyto složky. Googlebot plýtvá kapacitou na procházení bezcenných kombinací parametrů (např. ?color=cervena&size=xl&price-max=500) a zároveň dochází k naředění poptávky, protože vyhledávač nevidí jasné priority. Vše o analýze a správném nastavení průchodnosti webu řeším pro klienty v rámci kompletní SEO analýzy.

Čtyři kontrolní signály: Co máte k dispozici?

Pro řízení procházení a indexace parametrů máme čtyři hlavní nástroje. Každý dělá jinou práci a jejich záměna je nejčastější příčinou SEO katastrof:

  • Robots.txt Disallow (Zákaz procházení): Zabraňuje robotům vůbec odeslat požadavek na dané URL. Šetří crawl budget. Pozor: Blokované URL může být stále indexováno bez popisku, pokud na něj vedou silné zpětné odkazy.
  • URL fragmenty (#): Vše za znakem mřížky vyhledávače ignorují. Přesun stavu filtrů do fragmentů je nejčistší technické řešení pro moderní weby, protože nevytváří žádná nová URL pro roboty.
  • rel=canonical (Kanonizace): Slučuje rankovací signály na autoritativní (rodičovskou) kategorii. Googlebot však kanonizované parametry přesto prochází – nešetří tedy crawl budget, je to pouze doporučení pro indexaci.
  • meta noindex (Zákaz indexace): Definitivně odstraňuje stránku z indexu. Vyžaduje však, aby robot stránku nejprve navštívil a přečetl si tento tag. Nešetří crawl budget a spotřebovává výkon serveru.

Rozhodovací matice pro filtrační navigaci

Tato tabulka slouží jako technický návod. Najděte si svůj typ parametru a aplikujte doporučené nastavení:

Typ parametru / URL Doporučený signál Chování a nejčastější chyby
?sort=price-asc (Řazení) Robots.txt Disallow Parametry řazení nepřináší žádný unikátní obsah. Zablokujte procházení. Chyba: Nekombinujte robots.txt disallow s meta noindex na stejném URL.
?sessionid= / ?utm= Robots.txt Disallow Session ID a trackovací parametry jsou čistý odpad. Zablokujte je. Ideálně je vůbec negenerujte do odkazů v HTML.
?color=modra (Nízká poptávka) Canonical na rodiče Filtr s nízkou hledaností nepatří do indexu. Kanonizujte jej na základní kategorii, čímž konsolidujete PageRank.
/skinny-jeans (Vysoká poptávka) Index + Self-canonical Pokud má filtr (např. značka nebo konkrétní střih) hledanost, vytvořte z něj plnohodnotné URL s unikátním H1, textem a vlastním kanonickým odkazem. Tyto cenné vstupní stránky je pak nutné udržovat stále aktuální, k čemuž slouží naše matice prioritizace obnovy obsahu.
?color=modra&size=xl&... (Kombinace) Robots.txt / Noindex Hluboké kombinace filtrů s nulovou poptávkou. Zablokujte je v robots.txt pro úsporu crawl budgetu, nebo použijte noindex,follow. Nikdy obojí najednou.
/wide-leg-skinny-jeans Index + Self-canonical Vícekriteriální kombinace s doložitelnou hledaností (tzv. Zalando model). Vyžaduje statické URL a unikátní obsah, ne surové parametry.
Filtr s 0 výsledky HTTP 404 Stránky filtrů, které nevrací žádné produkty, by měly vracet stavový kód 404, nikoliv soft-200 nebo přesměrování.
JS filter (Bez změny URL) Netřeba řešit Klientské filtrování přes AJAX, kde se nemění URL nebo se mění pouze fragmenty za #. Vyhledávače tyto stavy nevidí a neprochází. Zlatý standard moderního vývoje.

Zásadní omyl: Robots.txt versus Noindex

Tato část je kriticky důležitá. Většina vývojářů dělá osudovou chybu: ve snaze vyčistit index nasadí na parametry filtračních stránek tag <meta name="robots" content="noindex"> a současně tyto parametry zablokují v souboru robots.txt.

Proč to nefunguje a škodí?
Pokud robots.txt zakazuje procházení parametru ?sort=, Googlebot se na tuto stránku nikdy nepodívá. Tím pádem si nemůže přečíst značku noindex, která se nachází v HTML kódu této stránky. Výsledkem je, že stránky s těmito parametry zůstanou v indexu Googlu po celou dobu, často bez popisku (tzv. "indexed without snippet").

Pravidlo je jednoznačné: Vyberte vždy pouze jeden signál. Pokud chcete stránku dostat z indexu, musíte ji nechat přístupnou pro procházení a nasadit noindex. Jakmile z indexu zmizí, můžete ji teprve zablokovat v robots.txt pro úsporu crawl budgetu.

Kdy má smysl crawl budget aktivně řídit?

Ne každý web musí optimalizaci procházení řešit do detailu. Pro malé weby je to spíše otázka hygieny, u velkých portálů se však jedná o prioritu první kategorie:

Velikost webu Hranice / Indikátor SEO Akce
Malé weby Do 10 000 indexovatelných stran Crawl budget není hlavním problémem. Nastavte základní kanonické tagy a sledujte stav „Indexováno, ale není v souboru sitemap“.
Střední a velké e-shopy 10 000+ stran a denní aktualizace Crawl budget začíná být klíčový. Aktivně řiďte parametry řazení a monitorujte stav „Procházeno – neindexováno“.
Enterprise e-shopy 1 000 000+ stran Crawl budget je kritický. Je nutné agresivně blokovat filtry v robots.txt, analyzovat serverové logy a eliminovat crawl waste.
Libovolný web Vysoké „Objeveno – neindexováno“ Varovný signál vyčerpání crawl budgetu v GSC. Bez ohledu na velikost webu je nutné okamžitě zahájit audit parametrů.

Nezapomeňte, že Google v březnu 2022 definitivně odstranil nástroj URL Parameters ze Search Console (který sloužil k ručnímu nastavení chování parametrů). Google tehdy uvedl, že pouze 1 % konfigurací v tomto nástroji bylo užitečných a crawleři se dnes učí zpracovávat parametry sami. Pro nás to však znamená jediné: musíme se spoléhat výhradně na čistou implementaci robots.txt, kanonických značek a meta robots.

Jak provést audit filtrační navigace?

Předtím, než začnete upravovat konfigurační soubory, doporučuji provést audit procházení ve 4 krocích:

1. Simulace procházení (Screaming Frog)

Spusťte crawl webu a v záložce URL -> Parameters sledujte, které parametry vyhledávač nachází nejčastěji. V nastavení programu můžete simulovat blokování parametrů a sledovat, jak se změní celkový počet nalezených stránek.

2. Analýza stavů indexace v GSC

V přehledu stránek (Index Coverage Report) se zaměřte na tři stavy: „Indexováno, ale není v souboru sitemap“ (může značit nechtěné indexované filtry), „Procházeno – neindexováno“ a „Objeveno – neindexováno“.

3. Analýza serverových logů

Nejspolehlivější metoda. Získejte přístup k logům webového serveru a spočítejte, kolikrát Googlebot přistoupil na URL s parametry vs na běžná produktová a kategoriální URL. Poměr mezi nimi určuje vaše plýtvání rozpočtem procházení.

4. Ověření poptávky pro indexované filtry

Než nějaký filtr (např. konkrétní barvu či materiál) necháte indexovat, ověřte si v nástroji na analýzu klíčových slov (např. Ahrefs, Collabim nebo Google Keyword Planner), že daná kombinace má reálnou hledanost a stojí za to pro ni držet unikátní přistávací stránku.

Závěr a doporučení

Řízení indexace filtrační navigace není otázkou jednoho kliknutí nebo plošného zákazu. Je to proces neustálého vyvažování mezi tím, co potřebuje uživatel (bohaté možnosti filtrů) a co zvládne vyhledávač. Správná architektura filtrů a eliminace crawl waste vám zajistí, že se vaše nové produkty a změny na webu projeví ve vyhledávání v řádu hodin, nikoliv týdnů.

Pokud si nejste jisti, jak váš web v tomto ohledu funguje, nebo bojujete s velkým množstvím neindexovaných stránek v Search Console, rád vám pomohu. V rámci svých služeb se specializuji na technické SEO a audity velkých e-shopů. Můžeme se také domluvit na individuálním školení technického SEO pro váš vývojářský tým.

Líbil se vám článek?

Ujistěte se, že vaše technické základy jsou v pořádku a vyhledávače prochází váš web efektivně.

Technické SEO pro váš web Školení technického SEO
Přidat do preferovaných zdrojů na Googlu

Bojujete s crawl budgetem a indexací na e-shopu?

Svěřte audit a optimalizaci filtrační navigace do rukou zkušeného SEO konzultanta.

Nezávazně poptat technické SEO