Jak ChatGPT vybírá zdroje, které cituje v odpovědích

Autor: Marek Nocar - GEO specialista, NocarStudio

Autor: Marek Nocar — GEO specialista, NocarStudio

ChatGPT a další AI modely vybírají zdroje pro citaci na základě kombinace tréninkových dat, brand mentions, strukturovanosti obsahu, autority zdroje a entitního propojení. Žádný jednotlivý faktor nerozhoduje — AI pracuje s váženým signálem, kde brand mentions korelují s citacemi třikrát silněji než zpětné odkazy (Ahrefs, prosinec 2025, vzorek 75 000 značek). Tento článek vysvětluje, jak proces výběru funguje a co konkrétně AI hledá.

Co jsou tréninková data a proč na nich tolik záleží

Velké jazykové modely jako GPT-4o nebo Claude se učí z obrovských textových korpusů sebraných z internetu, knih, vědeckých článků a dalších zdrojů. Tréninková data určují, co model „ví" o světě před tím, než dostane otázku. Pokud vaše firma v těchto datech chybí, model o vás nemůže odpovídat z paměti — a musí se spolehnout na vyhledávání v reálném čase, pokud má tu funkci dostupnou.

Tréninkový cutoff (datum, do kterého má model data) je u většiny modelů zpožděný o měsíce. Nové firmy a značky se do tréninkových dat dostávají postupně — tím častěji, čím více je o nich zmínek. Pro AI viditelnost to znamená: budovat přítomnost dnes, abyste byli citováni v modelu za 6–12 měsíců. To je důvod, proč GEO není kampaňová disciplína — je to dlouhodobá investice do entitní přítomnosti.

Jaký vliv mají brand mentions na AI citace

Brand mention je každá zmínka názvu vaší firmy v textu — i bez odkazu. Výzkum Ahrefs zveřejněný v prosinci 2025 prokázal na vzorku 75 000 značek korelaci 0,664 mezi počtem brand mentions a frekvencí AI citací. Pro srovnání: korelace mezi domain rating (klasická SEO autorita přes backlinky) a AI citacemi je pouze 0,266. Brand mentions jsou tedy přibližně třikrát silnější signál pro AI než zpětné odkazy.

Důvod je strukturní: AI modely se učí z přirozeného textu. Když lidé v článcích, příspěvcích a komentářích zmiňují vaši firmu jménem, model si vás spojí s daným kontextem — oborem, geografií, specializací. Backlink je technický signál pro vyhledávač. Brand mention je sémantický signál pro AI. Pro GEO optimalizaci je proto kvantita a kvalita zmínek důležitější než budování klasického backlink profilu.

Které platformy mají na AI citace největší vliv

Ne každá platforma má pro AI citaci stejnou váhu. Z analýzy korelací mezi přítomností na různých platformách a frekvencí citování v AI odpovědích vyplývá jasné pořadí. YouTube zmínky mají nejsilnější korelaci s AI citacemi (přibližně 0,737) — pravděpodobně proto, že YouTube přepisy jsou ve velkém zpracovávány a obsahují přirozenou řeč o značkách. Reddit má vysokou korelaci díky autenticitě a tematickému kontextu diskuzí.

Wikipedia funguje jako entitní kotva. Pokud vaše firma má Wikipedia stránku, AI modely vás rozpoznávají s nejvyšší jistotou. LinkedIn je pro B2B kritický — odborné příspěvky s diskuzí mají v tréninkových datech větší váhu než marketingové statusy. Klasické backlinky v podobě domain rating skóre mají oproti tomu výrazně slabší signál (~0,266). To neznamená, že backlinky nemají hodnotu — jen že pro AI viditelnost nejsou primárním pákovým bodem.

Proč AI preferuje strukturovaný a samonosný obsah

Když AI generuje odpověď, hledá v dostupných zdrojích pasáže, které lze citovat bez ztráty kontextu. Optimální délka pasáže pro AI citaci je 134–167 slov — dostatečně dlouhá, aby obsahovala užitečnou informaci, ale dostatečně krátká, aby se vešla do odpovědi. Pasáže kratší než 100 slov jsou pro AI příliš mělké. Pasáže delší než 200 slov AI typicky parafrázuje, což snižuje šanci, že vás explicitně cituje.

Druhý důležitý faktor je samonosnost. Odstavec, který začíná „Jak je popsáno výše..." nebo „Z předchozí kapitoly vyplývá..." není použitelný pro citaci — AI ho nemůže vytrhnout z kontextu. Naopak odstavec, který začíná konkrétní definicí nebo přímou odpovědí na otázku, je ideálním kandidátem. Question-based H2 nadpisy a self-contained answer bloky jsou proto v GEO optimalizaci základem, nikoli stylistickou volbou.

Role autorit a entitních signálů

AI modely vyhodnocují důvěryhodnost zdroje na základě metasignálů — kdo je autor, jaká instituce za článkem stojí, jaký je věk a aktualizace obsahu. Anonymní obsah bez autorství má nižší citační váhu než článek s pojmenovaným autorem, datem a profesní afiliací. Toto se zesílilo zejména po Google December 2025 Core Update, který rozšířil E-E-A-T hodnocení (Experience, Expertise, Authoritativeness, Trustworthiness) na všechny konkurenční dotazy, ne jen YMYL témata.

Entitní propojení posiluje autoritu zdroje. Pokud autor článku má LinkedIn profil, Wikipedia stránku nebo viditelnou aktivitu v oboru, AI tomu zdroji přiřadí vyšší citační skóre. Pro firmy to znamená: budovat osobní entitu zakladatele a klíčových odborníků je stejně důležité jako budovat firemní entitu. Osobní LinkedIn s odbornou činností a veřejné výstupy v médiích nebo podcastech jsou nejsilnější autoritní signály pro českou GEO viditelnost.

Jak se AI rozhoduje mezi více kandidáty na citaci

Pro většinu dotazů existuje více potenciálních zdrojů. AI musí vybrat ten nejvhodnější. Rozhodovací logika kombinuje čtyři hlavní faktory: relevanci (jak dobře zdroj odpovídá na konkrétní dotaz), autoritu (jak důvěryhodný zdroj je), specifičnost (jak konkrétní a využitelná odpověď je) a aktuálnost (kdy byl obsah publikován nebo aktualizován). Pro různé typy dotazů platí různé váhy.

U faktických dotazů („co je GEO") AI preferuje autoritu a definitivnost. U dotazů o aktuálním stavu („kdo je nejlepší GEO agentura v Česku") přidává váhu na recency a specifičnost. U srovnávacích dotazů („GEO vs SEO") preferuje strukturovaný obsah s jasnými tabulkami a definicemi. Pro firmu to znamená: pokud chcete být citováni napříč různými typy dotazů, musíte mít obsah optimalizovaný pro každou logiku zvlášť.

Rozdíly mezi platformami: ChatGPT, Perplexity, Google AI Overviews

Každá AI platforma má vlastní logiku výběru zdrojů. ChatGPT s povolenou web search funkcí kombinuje znalosti z tréninku s reálným vyhledáváním — preferuje zdroje s vysokou autoritou a strukturovaným obsahem. Perplexity je explicitně search-first — vždy vyhledává a transparentně citujedíky. Vhodný pro firmy s aktuálním a často aktualizovaným obsahem. Google AI Overviews využívá Google Search rankingu jako základ — zdroje, které jsou na první stránce Googlu, mají výrazně vyšší šanci na citaci v AIO.

Pouze 11 % domén je citovaných zároveň ChatGPT i Google AI Overviews pro stejný dotaz (Ahrefs, 2025). To znamená: optimalizace pro jednu platformu negarantuje viditelnost na druhé. Pro českou GEO strategii doporučujeme prioritizaci podle obchodního dopadu — zjistit, kde vaši zákazníci AI dotazy zadávají, a optimalizovat tam jako první. Pro většinu B2B firem je nejdůležitější ChatGPT a Perplexity, pro lokální e-shopy Google AI Overviews.

Přehledová tabulka — citační signály podle platformy

Signál

ChatGPT

Perplexity

Google AIO

Bing Copilot

Brand mentions

Vysoký

Střední

Vysoký

Vysoký

Aktuální obsah (recency)

Střední

Velmi vysoký

Vysoký

Vysoký

Strukturovaný obsah (schema)

Vysoký

Vysoký

Velmi vysoký

Velmi vysoký

Klasické SEO rankings

Nízký

Střední

Velmi vysoký

Vysoký

Wikipedia entita

Velmi vysoký

Velmi vysoký

Vysoký

Velmi vysoký

YouTube/podcastové zmínky

Vysoký

Střední

Střední

Střední

Co z toho plyne pro českou firmu v roce 2026

Pochopení mechaniky výběru zdrojů AI modely mění priority v digitálním marketingu. Klasické SEO zůstává relevantní, ale samo o sobě nestačí pro AI viditelnost. Firmy, které budou v roce 2026 a 2027 dominovat AI citacím, jsou ty, které paralelně budují tři vrstvy: technickou (schema, struktura obsahu, AI crawler access), obsahovou (samonosné pasáže, question-based struktura, autoritní signály) a entitní (Wikipedia, LinkedIn, brand mentions, podcastová přítomnost).

České prostředí má specifickou výhodu: trh je méně saturovaný než anglický, AI modely mají méně českých zdrojů a kdo začne dnes systematicky budovat AI viditelnost, získá výhodu v okně, které se postupně zavírá. Pokud chcete vědět, jak na vás dnes AI modely reagují, začněte bezplatnou konzultací v NocarStudio. Více o tom, proč vás AI nemusí doporučovat: 7 nejčastějších důvodů.

Nejčastější otázky

Jak ChatGPT vybírá zdroje pro citaci?

ChatGPT vybírá zdroje na základě kombinace tréninkových dat, brand mentions, strukturovanosti obsahu, autority zdroje a entitního propojení. Brand mentions korelují s citacemi třikrát silněji než zpětné odkazy (Ahrefs 2025, vzorek 75 000 značek).

Jaký je nejsilnější signál pro AI citaci?

YouTube a podcastové zmínky mají nejvyšší korelaci s AI citacemi (~0,737), následované Reddit a Wikipedia přítomností. Klasické backlinky a domain rating mají korelaci pouze ~0,266 — výrazně slabší signál než brand mentions.

Cituje ChatGPT jen ze svých tréninkových dat?

Ne. ChatGPT s povolenou web search funkcí kombinuje znalosti z tréninkových dat s reálným vyhledáváním na webu. Tréninková data určují, co model „zná", web search rozšiřuje záběr o aktuální zdroje.

Cituje ChatGPT a Google AI Overviews stejné zdroje?

Ne. Pouze 11 % domén je citovaných zároveň oběma platformami pro stejný dotaz (Ahrefs 2025). ChatGPT preferuje brand mentions a strukturu, Google AIO se opírá o klasický Google ranking. Optimalizace pro jednu negarantuje viditelnost na druhé.

Jak dlouhé pasáže AI nejlépe cituje?

Optimální délka pasáže pro AI citaci je 134–167 slov. Kratší pasáže jsou pro AI mělké, delší AI typicky parafrázuje místo přímé citace. Klíčem je samonosnost — pasáž musí dávat smysl bez kontextu okolního textu.

Cituje AI raději nové, nebo etablované zdroje?

Záleží na typu dotazu. U faktických dotazů AI preferuje etablované autoritativní zdroje. U dotazů o aktuálním stavu nebo trendech upřednostňuje recency. Perplexity je nejvíce citlivé na aktuálnost, ChatGPT a Google AIO vyvažují recency s autoritou.

Chcete být zdrojem, který AI cituje?

V NocarStudio začínáme GEO auditem — zjistíme, jak vás dnes vidí ChatGPT, Perplexity a Google AI Overviews, a navrhneme konkrétní kroky pro zvýšení AI viditelnosti. Bezplatná úvodní konzultace nezavazuje.

Napište nám na marek@nocarstudio.cz nebo si rezervujte bezplatnou konzultaci.

Marek Nocar | NocarStudio — GEO analýza, strategie a měření AI viditelnosti