Amazon, CNN, New York Times и другие сайты блокируют робота ChatGPT –

Как лучшие предложения,
хвост не застрял

О ЧатGPT способен ответить на многочисленные вопросы с достаточной точностью, как это было обученный работе с большими объемами текстанапример, книги, статьи, а также веб-сайты. Однако последние, похоже, весьма обеспокоены. Опросы показывают, что более 15 из 100 лучших сайтов заблокировали GBBTot, робот OpenAI, отвечающий за сбор контента. В этом списке находятся Amazon, New York Times, CNN и другие..

ChatGPT от OpenAI (Изображение: Витор Падуа / )

Данные получены в результате анализа компании Originality.ai, которая специализируется на проверке того, был ли контент создан искусственным интеллектом или является плагиатом.

Среди 100 наиболее посещаемых сайтов в Интернете как минимум 15 уже заблокировали робота. Среди 1000 наиболее посещаемых стран более 70 приняли ту же самую меру.

Среди более 1000 веб-сайтов, блокирующих GPBTot, есть такие известные имена, как:

  • Амазонка
  • Нью-Йорк Таймс
  • Си-Эн-Эн
  • Викихау
  • Шаттерсток
  • Кора
  • Блумберг
  • Скрибд
  • Рейтер
  • Икеа
  • Эйрбнб
  • Курсера

Блокировка робота OpenAI — это способ предотвратить использование контента, защищенного авторским правом.

«Интеллектуальная собственность — это источник жизненной силы нашего бизнеса, и нам необходимо защищать авторские права на наш контент», — заявила пресс-секретарь информационного агентства Reuters в сообщении газеты. Хранитель.

The New York Times обновила условия обслуживания, включив в них пункт, запрещающий сбор контента для обучения и развития искусственного интеллекта.

Эта тема стала горячей темой с тех пор, как были выпущены ChatGPT и другие инструменты генеративного искусственного интеллекта.

Банк изображений Getty Images, например, подал в суд на создателей Stable Diffusion за обучение ИИ с помощью фотографий, защищенных авторским правом. На некоторых творениях инструмента даже есть водяной знак Getty.

Авторы пошли по аналогичному пути и подали в суд на OpenAI, в то время как коллективный иск был подан против Microsoft, GitHub и OpenAI за нарушение лицензий на атрибуцию открытого исходного кода, используемого при обучении инструментов.

Сайты также блокируют сканер общедоступных файлов.

GPBTot — это «сканер» OpenAI. Это имя дается роботам, которые «сканируют» веб-индексацию и собирают информацию. Например, у Google и Bing есть свои собственные страницы, которые каталогизируют интернет-страницы для отображения результатов поиска.

Идея OpenAI заключается в сборе информации для обучения крупномасштабной языковой модели, обеспечивающей работу ChatGPT.

О GPBTot было объявлено в начале августа 2023 года. OpenAI также предоставила информацию о том, как веб-сайты могут помешать ему собирать контент: просто удалите разрешение в файле robots.txt или заблокируйте IP.

Некоторые (но не все) сайты в списке также заблокировали CCBot, некоммерческий сканер Common Crawl, целью которого является создание общедоступных файлов, к которым может получить доступ каждый.

Некоторые данные, используемые при обучении ChatGPT, а также модели Google и других компаний, получены из Common Crawl.

С информацией: Business Insider, The Guardian, Search Engine Land.

сканерGPTBot

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *