0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p>Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.</p>
1
<p>Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.</p>
2
<p>GPTBot - новый поисковый робот компании OpenAI, который будет просматривать и анализировать веб-страницы в поисках контента для обучения ИИ-моделей. При этом он умеет отфильтровывать ресурсы, которые требуют платного доступа, содержат персональную информацию пользователей или нарушают внутренние правила компании. По мнению экспертов, его запуск связан с разработкой и обучением ChatGPT-5.</p>
2
<p>GPTBot - новый поисковый робот компании OpenAI, который будет просматривать и анализировать веб-страницы в поисках контента для обучения ИИ-моделей. При этом он умеет отфильтровывать ресурсы, которые требуют платного доступа, содержат персональную информацию пользователей или нарушают внутренние правила компании. По мнению экспертов, его запуск связан с разработкой и обучением ChatGPT-5.</p>
3
<p>Если вы не хотите, чтобы данные вашего сайта или блога использовались бесплатно для обучения ИИ-моделей, то вы можете заблокировать доступ GPTBot. Информация об этом появилась<a>в документации к API Open AI</a>.</p>
3
<p>Если вы не хотите, чтобы данные вашего сайта или блога использовались бесплатно для обучения ИИ-моделей, то вы можете заблокировать доступ GPTBot. Информация об этом появилась<a>в документации к API Open AI</a>.</p>
4
<p>Для запрета доступа GPTBot к сайту в файл robots.txt добавьте текст:</p>
4
<p>Для запрета доступа GPTBot к сайту в файл robots.txt добавьте текст:</p>
5
User-agent: GPTBot Disallow: /<p>Теперь поисковый робот не сможет использовать информацию с вашего сайта. Если вы хотите запретить доступ только к определённым разделам сайта и папкам, то их можно явно указать в тексте:</p>
5
User-agent: GPTBot Disallow: /<p>Теперь поисковый робот не сможет использовать информацию с вашего сайта. Если вы хотите запретить доступ только к определённым разделам сайта и папкам, то их можно явно указать в тексте:</p>
6
User-agent: GPTBot Allow: /directory-1/ Disallow: /directory-2/
6
User-agent: GPTBot Allow: /directory-1/ Disallow: /directory-2/