Разработчики из Opera Software продолжают улучшать встроенный в браузер ИИ Aria. На этот раз нововведение затронуло самую естественную форму взаимодействия — голос.
В тестовой сборке Opera Developer появилась возможность взаимодействовать с ИИ Aria с помощью голоса. Теперь вы можете говорить и даже поддерживать разговор с Aria, запрашивать любую информацию, а также генерировать изображения на основе ваших словесных описаний.
Теперь Aria понимает, что вы говорите, и может взаимодействовать с вами посредством устного разговора. Кроме того, ИИ генерирует текстовый разговор в фоновом режиме, к которому вы сможете вернуться впоследствии. Это делает работу с ИИ проще, а для пользователей с ограниченными возможностями ещё и доступнее.
Возможности разговора в Aria, реализованы с помощью модели распознавания речи Whisper от OpenAI, а для голосового вывода используется Wavenet от Google.
Когда Aria слушает, в интерфейсе появится соответствующее уведомление. После получения команды она обработает запрос и выдаст ответ голосом. Если вы попросите создать изображение, оно появится в интерфейсе.
Голосовое взаимодействие — логичный шаг в развитии Aria, который делает работу с ИИ более естественной. Пока функция тестируется в Opera Developer, но в будущем появится и в стабильной версии браузера.
Если хотите попробовать её в деле — скачайте тестовую сборку браузера и начинайте разговор. Aria уже слушает!