Ключевой частью Android будет искусственный интеллект, а Gemini Nano будет мультимодальным –

Google выделяет небольшое место на I/O 2024, чтобы поговорить об Android и искусственном интеллекте (Изображение: Репродукция/YouTube)

Узнайте больше о Gemini (LLM) на сайте наш канал в WhatsApp

Самир Самат, президент подразделения экосистемы Android, представил планы Google по улучшению пользовательского опыта в ОС на Google I/O 2024. Руководитель выделил новый слоган для Android: «ИИ в основе» в прямом переводе. Другими словами, искусственный интеллект станет основой операционной системы, а мультимодальный Gemini Nano появится на смартфонах.

Одна из показанных функций уже была известна: функция кругового поиска. Однако теперь для него есть новости. Улучшение, представленное Samaat, заключалось в использовании инструмента для решения математических задач — что-то очень похожее на то, что OpenAI представил в прошлый понедельник.

Принцип его работы очень прост: вы ходите вокруг, ИИ определит уравнение/формулу/задачу и предложит решение. Эта новая функция, в отличие от упомянутых далее, уже доступна пользователям совместимых смартфонов.

Близнецы лучше распознают контекст подсказок

Приложение Gemini будет оценивать информацию на экране и в приложении, чтобы определить контекст подсказок (Изображение: Раскрытие информации/Google)

Дэйв Берк, вице-президент по разработке, представил другие улучшения Gemini для Android. Берк объяснил, что приложение AI можно будет активировать поверх других приложений, что позволит Gemini понять контекст вашего вопроса.

Например, у вас может быть открыт экран с описанием рецепта. Вы открываете приложение AI и задаете вопрос. Gemini оценит, что написано на экране и какое приложение вы используете.

Мультимодальная технология для Gemini Nano

В презентации Берк также пояснил, что мультимодальные технологии будут запущены для Gemini Nano, LLM, которая изначально работает на смартфонах. Эта мультимодальная технология позволяет использовать ИИ как для визуальных, так и для аудио задач.

Это может быть полезно для пользователей с ослабленным зрением, поскольку камеру смартфона можно использовать для объяснения обстановки и местоположения. Аудиофункции также помогают общаться, слушая окружающую среду. Эта технология впервые появится на смартфонах Pixel позже.

Берк также продемонстрировал функцию Gemini, которая может выявлять возможные мошенничества при звонках. Пример, использованный в презентации, был более «очевидным»: мошенник заявил, что для защиты аккаунта от несанкционированного доступа необходимо перевести деньги на более безопасный счет. Будет интересно увидеть, как Близнецы работают в более сложных случаях.

AndroidGemini (LLM)GoogleИскусственный интеллектСмартфонGemini (чат)Большая языковая модельOpenAIPixel

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *