Бесплатная голосовая запись с помощью ИИ «Edge Eloquent» в Google: работает на устройстве с Gemma, без подключения к сети, старт на iOS

動區BlockTempo

Google тайно разместила на iOS App Store бесплатное офлайн-приложение для ИИ-транскрибации «AI Edge Eloquent» на этой неделе: используется on-device модель Gemma ASR, аудио полностью не покидает устройство, и, что редкость, приложение появилось на платформе iOS раньше, чем на Android.
(Контекст: Google выпустила самые умные открытые модели Gemma 4! Полностью перешла на лицензию Apache 2.0, производительность вплотную приближается к крупным закрытым ИИ)
(Дополнение по фону: сломать монополию Nvidia? Самая сильная на Земле ИИ-модель Google «Gemma 3» с 1 H100 обходит DeepSeek, OpenAI)

Содержание статьи

Toggle

  • Говорите — и перевод в текст, можно пользоваться сразу
  • iOS впереди Android, а Google делает странный ход
  • Gemma приходит в повседневность: проверка реальных сценариев on-device ИИ

Без пресс-конференций и без каких-либо официальных объявлений Google так просто, чуть раньше на этой неделе, тихо вывела «AI Edge Eloquent» в iOS App Store. Это полностью бесплатное приложение для ИИ-транскрибации, ориентированное на офлайн-распознавание речи: в основе — собственная on-device ASR (автоматическое распознавание речи) модель Google Gemma. Все операции с аудио выполняются локально на устройстве, не требуется подключение к сети.

Говорите — и перевод в текст, можно пользоваться сразу

Логика работы «AI Edge Eloquent» очень интуитивна: откройте приложение, говорите в микрофон — на экране в реальном времени отображаются текст и форма звуковой волны. После остановки записи приложение автоматически фильтрует разговорные лишние слова вроде «мм», «ээ», исправляет разбиение на фразы, приводит сказанное в чистый, готовый к использованию текст и автоматически копирует его в буфер обмена.

Конфиденциальность — один из ключевых аргументов в пользу этого приложения. В режиме полностью офлайн аудиоданные не покидают iPhone пользователя и не отправляются ни на какие серверы. Google также предлагает опцию «облачного режима»: распознавание речи по-прежнему выполняется на устройстве, а в облачную модель Gemini отправляется только распознанный текст (а не исходное аудио) для дальнейшей очистки, что повышает качество.

Весь сервис полностью бесплатен: без подписки и без ограничений по объёму использования.

iOS впереди Android, а Google делает странный ход

Одновременно технологические медиа заметили редкое явление: продукты Google почти всегда выходят сначала на Android, особенно функции, связанные с on-device ИИ. Обычно они сначала появляются вместе с устройствами Pixel и моделью Gemini Nano. На этот раз «AI Edge Eloquent» пошла вразрез с правилами: в описании App Store прямо указано, что версия для Android уже скоро выйдет.

У аналитиков есть два объяснения. Первое — рыночное тестирование: Google, вероятно, намеренно выбирает iOS — «не свою основную площадку» — чтобы провести эксперимент, оценивая, насколько потребители принимают on-device ИИ для диктовки и как они будут пользоваться им, не вмешиваясь в экосистему Android.

Второе — техническая готовность: модель Gemma ASR для iOS, возможно, раньше достигла применимого стандарта по оптимизации, чем версия для Android. Поэтому Google выбрала публикацию сразу, а не ожидание синхронного выхода на обеих платформах.

Gemma приходит в повседневность: проверка реальных сценариев on-device ИИ

С технической точки зрения смысл «AI Edge Eloquent» — не только в том, что это инструмент для транскрибации. Gemma — это серия легковесных открытых ИИ-моделей от Google; изначальная задумка — обеспечить эффективную работу в средах с ограниченными ресурсами, таких как мобильные устройства. Edge AI — это то, как Google позволяет разработчикам выполнять ML-модели прямо на устройстве.

По сути, это приложение переносит возможности on-device вывода Gemma в повседневные сценарии использования для потребителей.

Для разработчиков AI Edge Eloquent тоже является показательной моделью: демонстрирует, как Gemma-модели внедряются в потребительские продукты, и как смешанная on-device/облачная архитектура позволяет находить баланс между приватностью и качеством.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев