все последние новости искусственного интеллекта от Google –

Google инвестирует в искусственный интеллект уже более десяти лет, заявил Сундар Пичаи на Google I/O 2024 (Иллюстрация: Витор Падуа/).

Узнайте больше о Google на наш канал в WhatsApp

Google анонсировал новую версию искусственного интеллекта Gemini: Gemini 1.5 Flash легче и эффективнее для мультимодальных приложений, по словам технологического гиганта. И это не единственная новая функция Google I/O 2024, мероприятия, которое начнется во вторник (14 мая) в США.

В предыдущей беседе с журналистами, в которой я участвовал, генеральный директор Сундар Пичаи подчеркнул, что Google инвестирует в искусственный интеллект уже более десяти лет. «Перед нами открывается много возможностей», — сказал руководитель в то время, когда аналитики рынка задаются вопросом, сможет ли компания конкурировать с ChatGPT и другими новейшими технологиями.

Сундар Пичаи сообщает, что более 1,5 миллионов программистов используют Gemini (Изображение: Репродукция/Google)

На мероприятии Google также объявила, что в США на поиск будет отвечать ИИ, и представила Project Astra, ИИ, который все видит и запоминает.

Близнецы 1.5 Флэш

Google I/O 2024 является доказательством того, что Google стремится оправдать большие ожидания.

Настолько, что Gemini 1.5 Flash и Gemini 1.5 Pro имеют контекстное окно на 1 миллион токенов. Это число дает оценку способности модели обрабатывать сложные подсказки и задачи. Для сравнения: Claude достигает 200 тысяч токенов, GPT-4 — 128 тысяч токенов, а приложение Gemini — 32 тысяч токенов.

Gemini 1.5 Pro достигнет 2 миллионов токенов (Изображение: Репродукция/Google)

Сундар сообщил, что к концу года Gemini 1.5 Pro достигнет отметки в 2 миллиона токенов. Точную дату исполнитель не уточнил.

Различные модели способны выполнять задачи перевода, диалога, программирования, логики и письма. В случае Flash-версии предлагается проводить сводки, беседы (как в чат-боте), добавлять подписи к фотографиям и видео, а также извлекать длинные документы или таблицы. «Это возможно, потому что мы обучали Flash из Gemini 1.5 Pro с помощью процесса, называемого дистилляцией», при котором знания от более крупной модели (учителя) передаются меньшей модели (ученику), сохраняя наиболее важную информацию.

Другие вкусы Близнецов

Модель Gemini 1.5 Pro также была улучшена. Google особенно подчеркивает навыки программирования, логическое мышление и способность вести длинные разговоры. Сначала он будет доступен подписчикам Gemini Advanced — план, интегрированный с Google One, с большим количеством функций искусственного интеллекта.

Мультимодальный искусственный интеллект — один из ярких моментов мероприятия I/O 2024 (Изображение: Репродукция/Google)

Подписчики смогут отправлять файлы с Google Диска или прикреплять их со своего устройства, чтобы ИИ мог использовать контент и генерировать запрошенные ответы. В Google заявили, что файлы хранятся конфиденциально и не используются для обучения моделей искусственного интеллекта.

Gemini 1.0 Nano, считающаяся самой легкой моделью компании, также распознает изображения. В настоящее время он ограничивается обычным текстом. Новая функция сначала появится на мобильных телефонах Google Pixel. Нам нужно будет следить за тем, чтобы выяснить, будут ли более известные производители, такие как Samsung и Motorola, включать этот инструмент в свои смартфоны.

Джемма 2

Модели линейки Gemini являются запатентованными. Это означает, что заинтересованным в них компаниям и разработчикам необходимо соглашение с Google, которое обычно предполагает использование API в облачном сервисе. В свою очередь, Google поддерживает Gemma, открытую модель, по тем же принципам, что и Llama 3 (Meta), Phi-3 (Microsoft) и Grok (X/Twitter).

Во вторник Google представила обновление для Gemma 3, получившее новую архитектуру. Компания утверждает, что LLM быстрее и эффективнее. Он будет выпущен в различных размерах, подробности о которых изначально не были представлены.

Изображение 3 и я вижу

Изображение 3 представлено во время I/O 2024 (Изображение: Репродукция/Google)

Помимо языковых моделей, Google представила инструмент генерации видео Veo и новую версию инструмента генерации изображений Imagen.

Veo способен создавать видеоролики высокого разрешения (Full HD) длительностью более 1 минуты. По словам компании, инструмент соответствует разным визуальным стилям. Google обещает впечатляющее мастерство в понимании режиссёрского тона и творческого замысла. Частично это связано с более длинными подсказками.

По данным компании, Veo хорошо обрабатывает такие инструкции, как «таймлапс» или «аэрофотоснимки ландшафта», и генерирует людей, животных и объекты, которые «реалистично движутся на записях».

Инструмент Imagen нам уже знаком. Теперь он достигает третьего поколения с улучшением качества и точности формирования изображения. Google утверждает, что у пользователей будут изображения, одинаково соответствующие реальности. Imagen 3 даже сможет размещать слова и фразы на изображениях, что до сих пор было головной болью (любой, кто использует Dall-3, знает, о чем я говорю).

Gemini (чат)GoogleGoogle I/OИскусственный интеллектСундар ПичаиCEOUSAGoogle PixelGoogle OneGoogle DriveSamsungMotorolaGPT-4MicrosoftБольшая языковая модель

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *