Сесар Спончиадо, основатель и генеральный директор Tunad
Быстрая эволюция технологий генеративного искусственного интеллекта (ИИ), таких как используемые в ChatGPT, привела к тенденции включения голосовых интерфейсов и интерфейсов ИИ в приложения, изменяя способ нашего взаимодействия с технологиями. Популярные виртуальные помощники, такие как Alexa, Google Assistant и Siri, также сыграли ключевую роль в популяризации этих голосовых интерфейсов.
Читать далее:
Однако ранние реализации этих технологий часто разочаровывали пользователей из-за их неспособности правильно понимать контекст и давать точные ответы. Однако с развитием технологий генеративного искусственного интеллекта и обработки естественного языка (NLP) голосовое взаимодействие стало более сложным и точным, что может сделать работу пользователя очень приятной.
Практический пример
Популярность приложения для обмена сообщениями WhatsApp, особенно в Бразилии, значительно возросла после появления функции обмена голосовыми сообщениями. Отправка аудио позволяет пользователям общаться быстро и естественно, без необходимости вводить сообщения.
Проект Microsoft Copilot уже используется в Office 365, облегчая взаимодействие с такими приложениями, как Word, Excel и PowerPoint, с помощью голосовых команд. Пользователь может обратиться к «Github Copilot», который представляет собой искусственный интеллект, помогающий коду. Приложение имеет вспомогательную предпосылку с генерируемыми кодами на основе фрагментов кода или комментариев. Это может помочь отформатировать документ в Word, создать диаграммы в Excel или добавить определенный переход в PowerPoint.
Этот подход можно распространить на приложения для управления бизнесом, где «Copilot» можно использовать, чтобы помочь профессионалам получать доступ к информации и выполнять определенные задачи, используя только голосовые команды. Например, пользователь может спросить: «Каковы были общие продажи в прошлом квартале?» и система будет предоставлять запрошенную информацию без необходимости навигации по меню и отчетам.
А в повседневной жизни?
Одним из сегментов, который может выиграть от голосового взаимодействия, является поиск ресторанов. Используя голосовые команды, клиенты могли попросить приложение найти конкретное блюдо в известном ресторане. Например, пользователь может сказать: «Найдите ресторан, где подают вегетарианскую лазанью, стоит менее 70 реалов и имеет не менее четырех звезд». Благодаря развитию этих технологий система сможет понять контекст запроса и предоставить соответствующие результаты.
Эта стремительная эволюция взаимодействия человека с машиной обеспечивает более интуитивно понятный, естественный и эффективный пользовательский интерфейс, поскольку люди могут общаться с приложениями и запрашивать информацию или выполнять определенные задачи, используя только свой голос. Это устраняет барьеры и трудности, которые часто возникают при использовании текстовых или сенсорных интерфейсов, улучшая доступность и охват цифровыми технологиями.
Вы смотрели новые видео на YouTube цифрового взгляда? Подписывайтесь на канал!