OpenAI, разработчик ChatGPT, согласился заплатить за права на использование материалов Associated Press (AP) для обучения своих алгоритмов искусственного интеллекта.

Читать далее:

Это первая крупная сделка такого рода на фоне растущих споров о том, должны ли технологические компании компенсировать создателям контента, чья информация собирается из Интернета для создания инструментов искусственного интеллекта.

  • Согласно выпуску AP, OpenAI будет иметь доступ к архиву текстовых историй AP, начиная с 1985 года.
  • Помимо лицензионных сборов, AP также будет иметь доступ к технологии OpenAI для проведения экспериментов и улучшения собственной журналистской практики.
  • Новостная организация годами использовала автоматизацию для подготовки местных спортивных репортажей и отчетов о финансовых доходах.
  • По данным AP, он не использует «генеративные» технологии, такие как, например, чат-боты, для написания своих историй.

Такие компании, как OpenAI, Google и другие, работающие в сфере искусственного интеллекта, использовали миллиарды фраз, взятых из Интернета, для создания своих «общих языковых моделей», на которых работают их чат-боты.

Новости, статьи в Википедии, комментарии в социальных сетях и сообщения в блогах — все это встроено в эти шаблоны без надлежащего разрешения их владельцев. Технологические компании часто утверждают, что они могут свободно использовать общедоступные данные.

Проведенный Washington Post анализ базы данных веб-сайтов, использовавшейся для обучения одной из старых моделей искусственного интеллекта OpenAI, показал, что главный новостной веб-сайт AP занял 68-е место среди наиболее цитируемых в базе данных.

Бунт против практики

Растущая группа авторов, музыкантов, новостных организаций и социальных сетей выступила против этой практики. Их аргумент заключается в том, что использование их контента для обучения ИИ представляет собой масштабный сдвиг в том, как работает Интернет, особенно если учесть, что некоторые из инструментов ИИ, обученных с использованием человеческого контента, уже заменяют людей-работников.

За последние две недели против отрасли был подан ряд исков о неправомерном использовании данных, в том числе коллективные иски против OpenAI и Google, а также иски против OpenAI, поданные комиком Сарой Сильверман и двумя известными писателями-фантастами.

В прошлый четверг газета Washington Post сообщила, что Федеральная торговая комиссия начала расследование того, как OpenAI использовала данные о потребителях для обучения своих моделей.

ЧатGPT
(Изображение: Даниэль Четрони / Shutterstock)

Чат-боты, такие как ChatGPT, обучаются на пуле информации и не могут постоянно обновляться без перенастройки с нуля. Это означает, что они менее полезны для предоставления последних новостей и актуальной информации.

Технологические компании пытались решить эту проблему, позволяя чат-ботам искать в Интернете или задавать вопросы в отдельной, постоянно обновляемой базе данных. Сделка с AP дает OpenAI доступ только к своему архиву новостей, но этот архив регулярно пополняется последними новостями.

В прошлом технологические компании платили напрямую за новостной контент для других целей. Google и Facebook платят новостным компаниям за прямой доступ к их контенту, показывая его на своих платформах в некоторых странах. В Австралии правительство приняло закон, требующий такой практики, и аналогичный закон скоро вступит в силу в Канаде.

Вы смотрели новые видео на YouTube цифрового взгляда? Подписывайтесь на канал!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *