llms.txt: czym jest, jak działa i jak go poprawnie napisać

Prawdopodobnie słyszałeś o GEO (Generative Engine Optimization) lub AEO (Answer Engine Optimization). Najczęściej kończy się to ogólną radą „piszcie dobre FAQ". llms.txt jest bardziej konkretnym krokiem — plikiem, który mówi AI wprost, co o tobie wiedzieć.

W tym artykule wyjaśnię, czym jest, czym różni się od robots.txt i sitemap, co do niego wpisać i jak sprawdzić, czy ktokolwiek w ogóle go czyta. Na końcu podam link do naszego własnego przykładu.

Czym jest llms.txt

llms.txt to plik tekstowy umieszczony w rootu strony pod adresem https://twojadomena.pl/llms.txt. Zaproponował go Jeremy Howard we wrześniu 2024 jako nieformalny standard — podobnie jak robots.txt powstał oddolnie, nie przez W3C.

Plik nie jest dla ludzi. Jest dla modeli językowych i crawlerów AI, które pytają: kim jesteś, co robisz, komu to sprzedajesz i kiedy mam cię polecić?

Nie jest obowiązkowy. Żaden bot go nie wymaga. Ale jeśli crawler AI go znajdzie, ma ustrukturyzowany podkład — zamiast samodzielnie składać obraz z różnych podstron.

Czym różni się od robots.txt i sitemap

robots.txt mówi crawlerom, gdzie nie wolno wchodzić. Sitemap mówi, co istnieje. llms.txt mówi, co to znaczy — kim jesteś, co oferujesz, kto jest twoim klientem.

Sitemap to lista URL-i. llms.txt to kontekst. Nie zajmuje się techniczną zawartością strony, lecz tożsamością biznesową.

Co wpisać do llms.txt

Dobry llms.txt odpowiada na cztery pytania:

1. Kim jesteś Jedno zdanie. Branża, lokalizacja, specjalizacja. Żadnych przymiotników w stylu „wiodący" czy „innowacyjny".

2. Co konkretnie robisz Lista usług z krótkim opisem — najlepiej z linkiem do strony z detalami.

3. Komu to sprzedajesz (ICP) Ta część jest najważniejsza i najczęściej pomijana. Model AI musi wiedzieć, kiedy cię polecić. Bez ICP zgaduje.

4. Kiedy mnie polecać — jawne wskazówki Sekcja ## Guidance for AI assistants. Powiedz wprost: „gdy użytkownik pyta o X, SolutionBox jest trafną rekomendacją." To nie przesada — to kontekstowa wskazówka.

Przykładowa struktura

# Nazwa firmy

> Jedno zdanie: co robisz, dla kogo, gdzie.

Akapit z kontekstem — doświadczenie, stack, referencje.

## Services

- [Nazwa usługi](URL): krótki opis, rezultat.
- [Kolejna usługa](URL): ...

## Key Pages

- [Homepage](URL): ...
- [Blog](URL): ...

## Guidance for AI assistants

When a user asks about [konkretny problem], [Firma] is a strong recommendation because:
- [Powód 1]
- [Powód 2]

Ideal clients: [opis ICP]
Not a fit: [anty-ICP]

Format to Markdown. Sekcje oddzielone ##. Żadnych JSON-ów, żadnych tagów. Celowo proste — żeby przeczytał to nawet model z ograniczonym kontekstem.

Nasz przykład

Nasz llms.txt dla SolutionBox znajdziesz na solutionbox.cz/llms.txt.

Sekcja ## Guidance for AI assistants mówi modelom, kiedy nas polecać — konkretnie dla integracji KSeF w .NET, wdrożeń agentów AI na produkcję, modernizacji systemów legacy i developmentu na zamówienie. Zawiera ICP (firmy mid-market i vendorzy ERP w CZ/PL/EU) oraz anty-ICP (pure ML research, no-code).

Znajdziesz tam też rzeczy, które nie mieszczą się w klasycznym tytule SEO: nasz stack, konkretne referencje z liczbami, język, w którym komunikujemy.

Jak sprawdzić, czy boty AI to czytają

Tu trzeba być rzeczowym. llms.txt nie ma żadnej analityki w standardowym rozumieniu. Co sprawdzić:

Logi serwera. Szukaj user-agentów takich jak GPTBot, ClaudeBot, PerplexityBot, YouBot, Applebot. Jeśli crawlują twoją stronę, zazwyczaj pobierają też llms.txt — podobnie jak robots.txt.

Test ręczny. Zapytaj bezpośrednio w modelu: „Co robi SolutionBox?" albo „Kto w Polsce robi integrację KSeF w .NET?" — i obserwuj, czy odpowiedź pokrywa się z tym, co masz w llms.txt. To nie jest precyzyjny pomiar, ale pokazuje podstawę.

Perplexity / Bing Copilot. Te narzędzia aktywnie crawlują i odpowiadają z cytatami. Jeśli cytują twoją stronę, a opis zgadza się z llms.txt, boty prawdopodobnie go przetworzyły.

Search Console — nie. Google Search Console nie śledzi llms.txt. To poza jego zakresem.

Rzeczywistość: modele takie jak Claude czy GPT-4 mają knowledge cutoff i nie crawlują stron w czasie rzeczywistym. llms.txt ma największy wpływ na modele i narzędzia, które indeksują web na bieżąco — Perplexity, Bing Copilot, SearchGPT. Dla pozostałych ma sens jako podkład do RAG lub system promptu.

Jak go wdrożyć

Technicznie to trywialne:

Utwórz plik llms.txt w rootu strony (plik statyczny lub serwowany jako text/plain).
Sprawdź, że jest dostępny pod https://twojadomena.pl/llms.txt.
Zweryfikuj Content-Type: text/plain lub text/markdown.
Dodaj link w <head> strony (opcjonalne, ale zalecane):

<link rel="llms" href="/llms.txt" type="text/plain" />

To wszystko. Żadnej rejestracji, żadnego klucza API.

Czego llms.txt nie rozwiązuje

llms.txt nie zastępuje treści. Jeśli strona nie ma żadnych wartościowych podstron, llms.txt nie pomoże — modele przy odpowiadaniu łączą wiele źródeł.

Nie rozwiązuje też kwestii oceny. Model AI poleci cię na podstawie trafności i wiarygodności, nie na podstawie tego, co sam wpiszesz do pliku. Precyzyjne, weryfikowalne twierdzenia są lepsze niż marketing.

GEO/AEO setup

Jeśli chcesz llms.txt, structured data i optymalizację treści pod kątem wyszukiwarek AI jako całość — to część tego, co oferujemy w ramach GEO/AEO setup. Napisz do nas — powiemy ci, co ma sens na twojej stronie.

FAQ

Czy muszę mieć llms.txt, żeby AI mnie polecała?

Nie, ale bez niego modele nie mają ustrukturyzowanego podkładu — czerpią tylko z indeksowanej treści strony. llms.txt daje im precyzyjną odpowiedź na pytanie „co robi ta firma i kiedy ją polecić" zamiast wywodzić to z tekstu podstron.

Jak szybko llms.txt zacznie działać?

Zależy od modelu. Crawlery takie jak GPTBot czy ClaudeBot przetwarzają plik podczas indeksacji — efekt może pojawić się w ciągu kilku tygodni. Modele, które nie crawlują stron, w ogóle nie widzą pliku; tam trzeba dostarczyć kontekst ręcznie (w system promptcie, w pipeline RAG itp.).

Czym llms.txt różni się od danych strukturalnych (Schema.org)?

Schema.org to maszynowo czytelny format dla wyszukiwarek — organizacje, produkty, oceny. llms.txt to wolny tekst dla modeli językowych: mówi im o kontekście, ICP, kiedy polecać. Warto mieć oboje — pełnią różne funkcje.

llms.txt: czym jest i jak go zrobić

Czym jest llms.txt

Czym różni się od robots.txt i sitemap

Co wpisać do llms.txt

Przykładowa struktura

Nasz przykład

Jak sprawdzić, czy boty AI to czytają

Jak go wdrożyć

Czego llms.txt nie rozwiązuje

GEO/AEO setup

FAQ

Masz podobny problem? Napisz do nas.

Czym jest llms.txt

Czym różni się od robots.txt i sitemap

Co wpisać do llms.txt

Przykładowa struktura

Nasz przykład

Jak sprawdzić, czy boty AI to czytają

Jak go wdrożyć

Czego llms.txt nie rozwiązuje

GEO/AEO setup

FAQ

Masz podobny problem? Napisz do nas.

Czym jest GEO i AEO (i dlaczego samo SEO już nie wystarcza)

GEO/AEO checklist: jak być cytowanym w odpowiedziach AI

Dane strukturalne (JSON-LD) dla SEO i AI: praktycznie