Как лучшие предложения,
хвост не застрялО ЧатGPT способен ответить на многочисленные вопросы с достаточной точностью, как это было обученный работе с большими объемами текстанапример, книги, статьи, а также веб-сайты. Однако последние, похоже, весьма обеспокоены. Опросы показывают, что более 15 из 100 лучших сайтов заблокировали GBBTot, робот OpenAI, отвечающий за сбор контента. В этом списке находятся Amazon, New York Times, CNN и другие..
ChatGPT от OpenAI (Изображение: Витор Падуа / )
Данные получены в результате анализа компании Originality.ai, которая специализируется на проверке того, был ли контент создан искусственным интеллектом или является плагиатом.
Среди 100 наиболее посещаемых сайтов в Интернете как минимум 15 уже заблокировали робота. Среди 1000 наиболее посещаемых стран более 70 приняли ту же самую меру.
Среди более 1000 веб-сайтов, блокирующих GPBTot, есть такие известные имена, как:
- Амазонка
- Нью-Йорк Таймс
- Си-Эн-Эн
- Викихау
- Шаттерсток
- Кора
- Блумберг
- Скрибд
- Рейтер
- Икеа
- Эйрбнб
- Курсера
ChatGPT и другие ИИ обвиняются в нарушении авторских прав
Блокировка робота OpenAI — это способ предотвратить использование контента, защищенного авторским правом.
«Интеллектуальная собственность — это источник жизненной силы нашего бизнеса, и нам необходимо защищать авторские права на наш контент», — заявила пресс-секретарь информационного агентства Reuters в сообщении газеты. Хранитель.
The New York Times обновила условия обслуживания, включив в них пункт, запрещающий сбор контента для обучения и развития искусственного интеллекта.
Эта тема стала горячей темой с тех пор, как были выпущены ChatGPT и другие инструменты генеративного искусственного интеллекта.
Банк изображений Getty Images, например, подал в суд на создателей Stable Diffusion за обучение ИИ с помощью фотографий, защищенных авторским правом. На некоторых творениях инструмента даже есть водяной знак Getty.
Авторы пошли по аналогичному пути и подали в суд на OpenAI, в то время как коллективный иск был подан против Microsoft, GitHub и OpenAI за нарушение лицензий на атрибуцию открытого исходного кода, используемого при обучении инструментов.
Сайты также блокируют сканер общедоступных файлов.
GPBTot — это «сканер» OpenAI. Это имя дается роботам, которые «сканируют» веб-индексацию и собирают информацию. Например, у Google и Bing есть свои собственные страницы, которые каталогизируют интернет-страницы для отображения результатов поиска.
Идея OpenAI заключается в сборе информации для обучения крупномасштабной языковой модели, обеспечивающей работу ChatGPT.
О GPBTot было объявлено в начале августа 2023 года. OpenAI также предоставила информацию о том, как веб-сайты могут помешать ему собирать контент: просто удалите разрешение в файле robots.txt или заблокируйте IP.
Некоторые (но не все) сайты в списке также заблокировали CCBot, некоммерческий сканер Common Crawl, целью которого является создание общедоступных файлов, к которым может получить доступ каждый.
Некоторые данные, используемые при обучении ChatGPT, а также модели Google и других компаний, получены из Common Crawl.
С информацией: Business Insider, The Guardian, Search Engine Land.
сканерGPTBot