Зачем это бизнесу
Что llms.txt даёт нейросети — и чего не даёт sitemap.xml
Когда LLM-краулер приходит на сайт без llms.txt, он действует наугад: идёт по ссылкам из навигации, пытается понять структуру по HTML, тратит ограниченное контекстное окно на служебные страницы, фильтры и дубли. У него нет способа узнать, что страница каталога важнее страницы вакансий, а ключевой кейс важнее архивной новости. Решение о важности он принимает сам — и часто ошибается, потому что устроен под обход, а не под понимание приоритетов бизнеса.
llms.txt снимает эту неопределённость. Файл говорит нейросети прямо: вот пятнадцать страниц, которые я считаю определяющими для понимания моей компании, и вот человеческие пояснения к каждой. Это кураторский сигнал от владельца — тот же по природе, что мета-теги или Schema.org-разметка, но адресованный конкретно языковым моделям. Нейросеть получает не сырой HTML, а уже осмысленный, отобранный и прокомментированный маршрут.
sitemap.xml эту задачу не решает и не должен. Он создан для поисковых роботов и оптимизирован под полноту индексации: все URL, даты последнего изменения, частота обновления — машинные поля без смысловых пояснений. sitemap отвечает на вопрос «какие страницы существуют»; llms.txt отвечает на вопрос «какие страницы понимают бизнес и что на них». Это разные оси: охват против кураторского смысла, машина против языковой модели. Поэтому файлы дополняют друг друга, а не конкурируют.