Обзор СМИ

Google запустил ИИ-приложение для транскрипции надиктованного текста с редактированием

Вчера, 16:22Новости10

Цей матеріал також доступний українською

Приложение сохраняет историю сессий, позволяет искать в транскрипциях и показывает статистику – скорость речи и общее количество слов

  • Ссылка скопированаlink copied

Google тихо выпустила бесплатное приложение для диктовки Google AI Edge Eloquent на iOS, которое работает оффлайн. Он способен редактировать текст, убирая слова-паразиты, пишет TechCrunch.

Подробности

  • Новое приложение работает по принципу offline-first – после загрузки моделей распознавания речи на базе Gemma пользователь может диктовать текст без Интернета.
  • При диктовании сервис показывает транскрипцию в реальном времени, а после паузы автоматически очищает ее от е-е, мм и других вставных слов, формируя более структурированный текст.
  • Пользователи могут дополнительно трансформировать результат с помощью режимов типа «ключевые тезисы», «формальный», «короткий» или «длинный».
  • При включении облачного режима приложение использует модели Gemini для улучшения текста, но этот режим можно полностью отключить для локальной обработки.
  • Eloquent позволяет импортировать термины, имена и жаргон из Gmail, а также добавлять собственные слова.
  • Приложение сохраняет историю сессий, позволяет искать в транскрипциях и показывает статистику – скорость речи и общее количество слов.
  • В описании App Store Google отмечает, что сервис ориентирован на превращение естественной речи в «готовый к использованию профессиональный текст», в отличие от классических диктофонов, фиксирующих речь дословно.
  • Несмотря на то, что приложение доступно только на iOS, в описании упоминалась Android-версия с возможностью интеграции как системной клавиатуры и плавающей кнопки для быстрого доступа. Впоследствии эти упоминания компания удалила, добавив информацию о будущей клавиатуре для iOS.

Контекст

Спрос на ШИ-сервисы для транскрипции быстро растет вместе с развитием моделей распознавания речи. Google тестирует новый продукт в сегменте, где уже работают несколько специализированных стартапов, часто превосходящих универсальные решения по скорости, точности в реальном времени или дополнительным возможностям (audio intelligence):

Otter.ai – одна из самых популярных для встреч: автоматически подключается к звонкам, распознает спикеров, создает искательные заметки.

Deepgram – фокус на низкой задержке (150–300 мс) и реальном времени, популярный среди разработчиков.

AssemblyAI – сильный в понимании аудио (summarization, sentiment analysis, entity detection), подходит для enterprise с HIPAA.

Rev.ai, Sonix, Fireflies.ai, Descript (с акцентом на редактирование видео) и другие.

OpenAI Whisper (и его производные) – открытая модель, которая стала основой для многих сервисов благодаря высокой точности (до 98% на чистом аудио) и богатой языковой поддержке.

Глобальный рынок ИИ transcription в 2025 году составил $4,6 млрд, говорится в отчете Fortune Business Insights. По прогнозам объем рынка вырастет с $5,6 млрд в 2026 году до $25,3 млрд к 2034 году, демонстрируя среднегодовой темп роста (CAGR) на уровне 20,6% в течение прогнозируемого периода. В 2025 году Северная Америка доминировала на мировом рынке с долей 32,3%.

Не пропустите важное!
Подписывайтесь и получайте дайжест новостей

Ежедневно или еженедельно – выбираете вы!

Мнение эксперта

Хотите стать автором borg.expert?

Материалы по теме

Огляд ринків

Статьи • БОРГ-review
Суди все частіше оцінюють не форму правочину, а його реальний економічний зміст

Огляд ринків

Статьи • БОРГ-review
Верховний Суд зазначив, що під час формування земельної ділянки визначення її виду цільового призначення здійснюється розробником документації із землеустрою

Огляд ринків

Статьи • БОРГ-review
Як змінилися правила публічних закупівель під час війни, чому зросли ризики формальної конкуренції і що насправді заважає бізнесу працювати на рівних умовах

Огляд ринків

Статьи • БОРГ-review
Блокчейн стає нормою – як базовий шар, на якому будуються швидкі, зрозумілі та зручні для людини фінанси, доступні кожному

Огляд ринків

Статьи • БОРГ-review
У справах про банкрутство вирішальним є не лише виявити підозрілу операцію, а і встигнути зафіксувати актив до того, як він зникне з периметра спору

Огляд ринків

Статьи • БОРГ-review
Понад 99% активів на ринку становлять саме токени. Станом на 2025 рік їхня кількість оцінюється в ~36 млн, тоді як криптовалют – близько десяти тисяч