Grupa Insight

Dostępność Techniczna

HomeFrameworksAI Search ReadinessDostępność Techniczna

Dostępność techniczna to stopień, w jakim crawlery AI Search mogą uzyskać dostęp, pobierać i interpretować treść strony — warunek wstępny dla jakiejkolwiek widoczności w AI Search, niezależnie od jakości treści czy jasności encji.

Dlaczego to ma znaczenie

Widoczność w AI Search zaczyna się od dostępu. Jeśli system nie może crawlować, pobierać lub interpretować Twoich treści, nie może ich niezawodnie cytować — niezależnie od tego, jak dobrze treść jest ustrukturyzowana lub jak mocne są sygnały encji.

Nie każdy crawler AI ma ten sam cel. Zrozumienie różnicy między crawlerami wyszukiwania a crawlerami trenowania modeli jest niezbędne przed podejmowaniem decyzji dotyczących robots.txt, które wpływają na widoczność w AI Search.

Crawlery AI — wyszukiwanie vs trenowanie

OAI-SearchBot

Odkrywanie ChatGPT Search

Używany przez OpenAI do surfowania stron w funkcjach ChatGPT Search. Zezwolenie na tego crawlera umożliwia cytowanie Twoich treści w wynikach ChatGPT Search.

Zezwól jeśli widoczność AI Search jest celem

GPTBot

Trenowanie modeli OpenAI

Używany przez OpenAI do potencjalnego zbierania danych treningowych. Niezależny od OAI-SearchBot — blokowanie GPTBot nie wpływa na widoczność w ChatGPT Search.

Oceń osobno na podstawie polityki danych treningowych

PerplexityBot

Indeksowanie wyszukiwania Perplexity

Używany przez Perplexity do surfowania stron w wynikach wyszukiwania. Zgodnie z dokumentacją Perplexity, respektuje robots.txt i nie używa zablokowanych treści do pre-treningu modeli.

Zezwól jeśli widoczność Perplexity jest celem

ClaudeBot

Crawlowanie Anthropic

Używany przez Anthropic. Sprawdź aktualną dokumentację dotyczącą celu crawlowania i konfiguracji robots.txt.

Zapoznaj się z aktualną dokumentacją Anthropic

Przykład konfiguracji robots.txt

# Zezwól na crawler ChatGPT Search

User-agent: OAI-SearchBot

Allow: /

# Blokuj crawler trenowania modeli

User-agent: GPTBot

Disallow: /

# Zezwól na crawler wyszukiwania Perplexity

User-agent: PerplexityBot

Allow: /

llms.txt

llms.txt to plik tekstowy umieszczony w katalogu głównym strony, który sygnalizuje agentom AI, które treści są autorytatywne i jak interpretować strukturę strony. Jest to proponowany standard — nie potwierdzony uniwersalny wymóg widoczności AI Search — ale jest to niskonakładowy dodatek wart wdrożenia obok robots.txt, sitemap.xml, schema markup i mocnego linkowania wewnętrznego.

Lista kontrolna implementacji

Powiązane zasoby