OpenAI объявила о выпуске модели o1, которая представляет собой важную веху в ее поисках более совершенного искусственного интеллекта (ИИ). o1, известная внутри компании как Strawberry, описывается как модель рассуждения, которая выделяется своей способностью решать сложные вопросы и предлагает две версии: o1-preview и o1-mini.

Оба будут доступны подписчикам ChatGPT Plus и Team начиная с этого четверга (12), а пользователи версий Enterprise и Edu получат доступ на следующей неделе.

Экран чата, показывающий модель o1, которая теперь доступна
(Изображение: OpenAI)

Новые возможности OpenAI o1

Одной из инноваций o1 является ее способность «думать», прежде чем давать ответы, что, по мнению OpenAI, помогает модели уменьшить распространенные ошибки рассуждения в искусственном интеллекте. Он использует процесс рассуждения, называемый «цепочкой мыслей», который имитирует пошаговый человеческий анализ для решения проблем. Эта функциональность делает его особенно эффективным при решении сложных задач, таких как программирование и математика.

Модель была разработана в рамках внутреннего проекта OpenAI под названием Q*, который фокусируется на расширенных рассуждениях. Помимо предоставления ответов, o1 может осуществлять самопроверку, просматривая собственные решения, чтобы минимизировать ошибки.

Экран чатгпт показывает, что модель ИИ думает, прежде чем ответить
Модель o1 «думает», прежде чем предложить демонстрационный ответ. (Изображение: OpenAI)

Ограничения OpenAI o1

  • Модель o1 содержит новые функции, но также и некоторые ограничения.
  • Несмотря на свои расширенные возможности, o1 в некоторых случаях может работать медленнее своих предшественников, и для ответа на более сложные вопросы ему требуется до 10 секунд.
  • Более того, по-прежнему существует риск того, что модель генерирует «галлюцинации» — неправильные ответы, но представленные с уверенностью — проблема, которую, как признает OpenAI, она не решила полностью.
  • Он не имеет таких функций, как просмотр веб-страниц или обработка файлов и изображений.
  • Кроме того, у пользователей есть еженедельный лимит сообщений: 30 для o1-preview и 50 для o1-mini.
  • Высокая стоимость также является важным фактором: o1-preview стоит 15 долларов за миллион входных токенов и 60 долларов за миллион выходных токенов — в три и четыре раза выше соответственно по сравнению с GPT-4o.

Читать далее:

Обучение с подкреплением и практическим применением

В обучении o1 используется новый алгоритм оптимизации и обучение с подкреплением — метод, который обучает систему посредством поощрений и наказаний. Это позволяет o1 самостоятельно решать проблемы.

Этот метод включает использование данных, ориентированных на рассуждения, таких как научная литература, что делает модель идеальной для задач, включающих несколько этапов, таких как анализ конфиденциальных электронных писем или формулирование маркетинговых стратегий.

o1 диаграмма улучшений
Улучшения моделей o1 по сравнению с их предшественниками в нескольких областях. (Изображение: OpenAI)

Тесты показывают, что o1 превосходит GPT-4o в таких задачах, как анализ судебных исков и логических игр, а также исключительно хорошие результаты на экзаменах по математике. По данным компании, в тесте на Международной олимпиаде по математике o1 получил 83% правильных ответов, а GPT-4o — 13%.

Будущее моделей искусственного интеллекта

OpenAI ориентирован на расширение мыслительных способностей o1 за пределы его текущих возможностей. Компания планирует разработать будущие версии, способные рассуждать в течение более длительных периодов времени — часов, дней или даже недель — с целью создания автономных систем, которые будут еще более эффективны в сложных задачах и в таких областях, как медицина и инженерия.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *