OpenAI может использовать вашу онлайн-активность; посмотри как заблокировать

Большая часть обучения современных ИИ, таких как ChatGPT от OpenAI и Bard от Google, проходила в Интернете. Это потому, что языковые модели обучаются на существующем контенте, словах и фразах — и что может быть лучше для этого, чем онлайн?

Однако OpenAI — одна из компаний, которая не уточняет, откуда именно она получила свои данные, которые могут варьироваться от работ, защищенных авторским правом, до личных публикаций пользователей Интернета. Теперь разработчик ChatGPT объявил, что он позволит пользователю заблокировать трекер, отвечающий за сбор пользовательских данных.

Читать далее:

  • ChatGPT получает шесть новых функций; проверить
  • Как загрузить и использовать ChatGPT на телефоне Android
  • ChatGPT Code Interpreter: что это такое и как использовать AI-плагин

Блокировщик для чего?

OpenAI опубликовал в своем блоге, что разработчики веб-сайтов могут специально запретить трекер GPTPot, отвечающий за отслеживание веб-страниц, к которым обращается пользователь, или даже заблокировать их IP-адрес, что делает устройство своего рода трекером данных.

По данным компании, веб-страницы, просканированные с помощью этой функции, помогают обучать языковые модели ИИ.

Веб-страницы, просканированные с помощью пользовательского агента GPBTot, потенциально могут использоваться для улучшения будущих моделей и фильтруются для удаления источников, которые требуют платного доступа, о которых известно, что они собирают информацию, позволяющую установить личность (PII), или содержат текст, нарушающий наши политики.

OpenAI в их блоге

Также, по словам разработчика, если источник не соответствует критериям, изложенным выше, он позволяет «GPBTot получить доступ к вашему веб-сайту, что может помочь моделям ИИ стать более точными и улучшить их общие возможности и безопасность».

OpenAI позволил разработчикам веб-сайтов заблокировать трекер компании (Изображение: Rokas Tenys/Shutterstock)

Контекст

  • Предоставление данных для обучения ИИ стало спорным вопросом в социальных сетях, поскольку это разрешение не всегда предоставляется людьми в Интернете;
  • В соответствии с Граньтакие компании, как Reddit и Twitter, уже выступили против того, чтобы разработчики ИИ не использовали данные и сообщения своих пользователей для обучения технологии;
  • Однако в настоящее время OpenAI не сообщает, откуда она получила данные для обучения ChatGPT или других инструментов компании. Они могли быть получены из сообщений в социальных сетях, работ, защищенных авторским правом, или буквально из любой части Интернета, к которой компания получила доступ;
  • То есть невозможно узнать, использует ли ИИ то, к чему обращается пользователь, чтобы накормить его.

Текущие языковые модели были обучены на основе существующего контента (Изображение: Diego Thomazini/Shutterstock)

Что это означает для OpenAI

С возможностью блокировки бота, отвечающего за сбор данных о действиях пользователей, OpenAI может обойтись без этих данных.

Недавно компания объединилась с правительством США для разработки системы, которая будет наносить водяные знаки на контент, созданный искусственным интеллектом. Однако компания Сэма Альтмана не согласилась прекратить использование информации из Интернета для обучения.

Вы смотрели новые видео на YouTube цифрового взгляда? Подписывайтесь на канал!

Сообщение OpenAI может использовать вашу онлайн-активность; см., как эта блокировка впервые появилась в Olhar Digital.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *