Команда технологических экспертов запустила глобальную инициативу под названием «Последний экзамен человечества», цель которой — поставить сложные вопросы перед системами искусственного интеллекта, которые теперь способны с легкостью превосходить обычные тесты. Информация предоставлена ​​агентством Reuters.

Конкурс, организованный Центром безопасности ИИ (CAIS) и стартапом Scale AI, направлен на оценку уровня сложности специализированного ИИ, обеспечивая его актуальность даже с учетом будущих достижений.

По словам Дэна Хендрикса, исполнительного директора CAIS, эта инициатива возникла после запуска модели OpenAI o1, которая превзошла популярные эталоны рассуждения.

Хендрикс, соавтор исследований по тестированию ИИ, подчеркнул эволюцию ответов, которые раньше были случайными, а теперь стали значительно лучше.

купол IA
Идея теста — оценить уровень сложности, которого уже достигли самые мощные модели ИИ (Изображение: Gorodenkoff/Shutterstock.com)

Читать далее:

Хотя модели искусственного интеллекта, такие как Claude от Anthropic, улучшили результаты экзаменов, эффективность общих тестов подвергается сомнению. Исследования показывают, что эти модели неэффективны в менее частых тестах, таких как абстрактное мышление и визуальные головоломки.

Подробности «Последнего экзамена человечества»

  • Организаторы заявляют, что «Последний экзамен человечества» будет включать в себя не менее тысячи вопросов, а срок сдачи будет назначен на 1 ноября.
  • Вопросы, которые будут рассмотрены экспертами, не могут касаться оружия, учитывая связанные с этим риски.
  • Победители смогут стать соавторами экзамена и получить призы на сумму до 5000 долларов США. Цель состоит в том, чтобы создать более строгие тесты для измерения быстрого развития ИИ, как подчеркнул Александр Ванг, генеральный директор Scale AI.
Иллюстрация мозга на технологической доске для демонстрации концепции искусственного интеллекта
Около тысячи вопросов будут включены в окончательный тест для измерения мудрости ИИ. Изображение: Gorodenkoff/Shutterstock.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *