Я не думаю, что это будет долго до тех пор OpenAI он также будет задействован для разработки поисковой системы на основе искусственного интеллекта. Новый web crawler GPTBot с широкой языковой моделью GPT-5 уже выпущена.
Те, кто использует ChatGPT Я знаю, что эта широкая языковая модель (LLM) сейчас работает GPT-3.5, обучающийся на наборе данных, обновленном в сентябре 2021 года. Поэтому, если будет запрошена более новая информация с этой даты, ChatGPT не может предоставить точную информацию. Разумеется, справедливо для бесплатной версии, не поддерживающей использование вспомогательных плагинов.
С запуском GPTBot, OpenAI открывает путь для индексации веб-страниц с помощью этого нового web crawler. Как это делают уже много лет такие компании, как Google, Microsoft, Yahoo и многие другие.
GPT-5 и новый веб-паук GPTBot, разработанный OpenAI.
новый web crawler GPTBot использует web agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Владельцы веб-сайтов могут контролировать индексацию веб-страниц через файл robots.txt
, используя те же директивы, что и для других web crawlerи других компаний.
Например, если владелец веб-сайта не хочет, чтобы OpenAI для сбора информации с сайта, может добавить в robots.txt
линии:
User-agent: GPTBot
Disallow: /
Даже если он действует как один web crawler, GPTBot будет иметь четкую цель: собирать общедоступные данные, тщательно избегая источников, связанных с платным доступом, сбором личных данных или контентом, нарушающим политики. OpenAI.
Но есть немало противоречий, некоторые из которых даже повлекли за собой судебные иски против компании. OpenAI о конфиденциальности и использовании контента без согласия авторов или без указания источников.
В июне регулятор конфиденциальности Японии выпустил предупреждение для OpenAI относительно несанкционированного сбора данных. Италия также временно запретила использование в начале этого года. ChatGPT из-за предполагаемых нарушений законов о конфиденциальности Европейского Союза.