robots.txt - текстовый файл в корне сайта (/robots.txt). Роботы запрашивают его перед обходом страниц. Файл состоит из блоков: каждый начинается с User-agent: и содержит правила Allow: и Disallow:.
- User-agent - для какого робота действуют правила ниже (например, Googlebot, YandexBot или * для всех).
- Disallow - путь, который робот не должен обходить. Пустой Disallow означает «разрешено всё».
- Allow - явное разрешение обхода (важно при конфликте с Disallow - побеждает более длинное совпадение).
- Sitemap - ссылка на карту сайта. Не обязательна, но помогает роботам быстрее находить страницы.