Technické GEOrobots.txtAI crawlery

robots.txt pro AI crawlery: Kompletní průvodce GPTBot, ClaudeBot a PerplexityBot

Jak správně nakonfigurovat robots.txt pro AI crawlery. Kdo jsou GPTBot, ClaudeBot, PerplexityBot a Google-Extended a jak zajistit, aby měli přístup k vašemu obsahu.

Marek Nocar27. ledna 20264 min čtení

Pravděpodobně máte robots.txt. Pravděpodobně je nastaven pro Google. A pravděpodobně jste vůbec neřešili, zda vás může indexovat ChatGPT nebo Perplexity.

Tato mezera je pro GEO zásadní - a přitom ji lze opravit za méně než hodinu.

Proč robots.txt hraje roli v GEO

Aby vás AI systémy mohly citovat, musejí váš obsah znát. A aby ho znaly, musejí ho jejich crawleri (indexovací roboti) navštívit a zpracovat.

Každý major AI systém má vlastního crawlera:

AI systém	Crawler	User-agent
ChatGPT (OpenAI)	GPTBot	`GPTBot`
ChatGPT browsing	ChatGPT-User	`ChatGPT-User`
Perplexity AI	PerplexityBot	`PerplexityBot`
Claude (Anthropic)	ClaudeBot	`ClaudeBot`, `anthropic-ai`
Gemini (Google)	Google-Extended	`Google-Extended`
Microsoft Copilot	Bingbot	`Bingbot`

Pokud je některý z těchto crawlerů ve vašem robots.txt blokován - nebo pokud pro ně neexistuje explicitní direktiva - výsledek závisí na výchozím chování každého systému. A to nemusí být ve váš prospěch.

Jak zkontrolovat aktuální stav

Otevřete v prohlížeči vašweb.cz/robots.txt. Zkontrolujte:

Existuje direktiva User-agent: GPTBot? Pokud ne, GPTBot se řídí výchozím pravidlem (obvykle User-agent: *)
Je povolení explicitní (Allow: /) nebo blokování (Disallow: /)?
Jsou GPTBot a ostatní AI crawleři blokováni v rámci obecného User-agent: * s Disallow: /?

Pokud váš web používá bezpečnostní plugin nebo WAF (Web Application Firewall), zkontrolujte i tam - některé konfigurace blokují neznámé crawlery paušálně.

Jak robots.txt pro AI správně nakonfigurovat

Doporučená konfigurace pro maximální AI přístupnost:

User-agent: *
Allow: /
Disallow: /api/
Disallow: /admin/
Disallow: /private/

# OpenAI
User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

# Anthropic
User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

# Perplexity
User-agent: PerplexityBot
Allow: /

# Google (Gemini)
User-agent: Google-Extended
Allow: /

# Cohere
User-agent: cohere-ai
Allow: /

Sitemap: https://vašweb.cz/sitemap.xml

Klíčové principy:

Explicitní Allow: / pro každý AI crawler - nespoléhejte na výchozí chování
Blokujte api/, admin/ a podobné sekce, které AI nemají indexovat
Vždy uveďte odkaz na sitemap

Co blokovat, co ne

Nejčastější chyba: blokovat příliš mnoho. Druhá nejčastější chyba: blokovat příliš málo.

Blokujte AI crawlerům:

/api/ - API endpointy nejsou obsah pro citování
/admin/ - administrační rozhraní
/checkout/, /cart/ - transakční stránky
/user/, /account/ - uživatelské profily
URL s dynamickými parametry (?session=, ?token=)

Nechte přístupné:

Všechny obsahové stránky (blog, produkty, služby)
About a Contact stránky
FAQ a dokumentaci
Landing pages

robots.txt nestačí - doplňte llms.txt

robots.txt říká AI crawlerům, kde smějí chodit. llms.txt jim říká, co tam najdou a jak o vás přemýšlet. Obojí je součást kompletní technické GEO konfigurace.

Typická chyba: firma opraví robots.txt, ale nenasadí llms.txt. Výsledek: AI crawler stránku navštíví, ale nezíská strukturovaný kontext o firmě - a musí si ho poskládat sám z různorodého obsahu.

Ověření po implementaci

Po změně robots.txt:

Google Search Console → „Test robots.txt" - ověření syntaxe
Přímý test: curl -A "GPTBot" https://vašweb.cz/robots.txt - simulace GPTBot požadavku
robots.txt tester (volně dostupné nástroje online) - kompletní validace
Zkontrolujte log serveru po 48–72 hodinách - zda se crawleři skutečně objevují

Výsledky v AI odpovědích nejsou okamžité - AI systémy re-indexují obsah v různých intervalech, typicky v řádu týdnů až měsíců.

Etická dimenze: proč blokovat AI crawlery?

Existují legitimní důvody k blokování AI crawlerů - zejména pro vydavatele obsahu, kteří nechtějí, aby jejich práce trénovala AI modely bez kompenzace.

Pro firmy, které chtějí být viditelné v AI odpovědích, je blokování kontraproduktivní. Nelze zároveň blokovat GPTBot a očekávat, že vás ChatGPT bude citovat.

Rozhodnutí blokovat nebo povolit AI crawlery je strategické - a mělo by být vědomé, ne výsledek opomenuté konfigurace.

Časté otázky

Které AI crawlery mám povolit? Pro viditelnost v AI odpovědích minimálně OAI-SearchBot a ChatGPT-User (OpenAI), PerplexityBot a ClaudeBot. Trénovací boty (GPTBot, Google-Extended) můžete řídit nezávisle podle své strategie.

Jaký je rozdíl mezi GPTBot a OAI-SearchBot? GPTBot sbírá data pro trénink modelů, OAI-SearchBot indexuje web pro vyhledávání a citace v ChatGPT. Můžete blokovat trénink a zároveň zůstat viditelní ve vyhledávání — jsou to oddělená pravidla.

Poškodí blokování AI crawlerů moje pozice v Googlu? Ne — Googlebot je samostatný crawler a blokace AI botů ho neovlivní. Přijdete ale o viditelnost v ChatGPT, Perplexity a dalších AI systémech, které dnes ovlivňují rostoucí část nákupních rozhodnutí.

Stačí povolit crawlery, abych byl v AI odpovědích? Ne. Robots.txt jen otevírá dveře — o citaci rozhoduje citovatelnost obsahu, entity signály a llms.txt jako doplněk.

Technická GEO konfigurace - robots.txt, llms.txt, schema markup - je součástí každého našeho GEO Auditu. Pokud si nejste jisti aktuálním stavem, rádi to zkontrolujeme za vás.

Marek Nocar

GEO Strategist & Founder, NocarStudio

Zakladatel prvního GEO studia v ČR. Pomáhá firmám stát se autoritou pro ChatGPT, Gemini a Perplexity.

Související články

Schema markup pro GEO: Které typy jsou nejdůležitější a jak je implementovat

Průvodce schema markupem z pohledu GEO optimalizace. FAQPage, Organization, Article, HowTo - co implementovat jako první a proč schema markup přímo ovlivňuje AI citovatelnost.

Co je llms.txt a proč ho vaše firma potřebuje v roce 2026

llms.txt je nový standard pro komunikaci s AI crawlery. Vysvětlujeme, co to je, jak ho správně napsat a proč firmy, které ho implementují jako první, získávají trvalou výhodu.

Chcete GEO pro vaši firmu?

Bezplatný GEO preview ukáže, jak vás vidí ChatGPT dnes.

Získat bezplatný preview