Deepgram — это современная площадка для работы с транскрибацией речи в текст с использованием искусственного интеллекта в работе. Также возможности сервиса позволяют проводить качественную аудиоаналитику загруженных файлов и интегрировать инструменты площадки на любые интернет-ресурсы с помощью API-ключа. Встроенная модель ИИ способна распознавать речь и текст любой сложности, начиная от медицинского и заканчивая сложными техническими формулировками, что делает сервис полностью универсальным и подходящим для пользователей разных сфер деятельности. Сегодня в обзоре рассмотрим основные возможности платформы, а также протестируем ее главные инструменты для работы со звуком.
Для своих клиентов Deepgram предлагает два основных направления инструментов для работы со звуком:
Возможности сервиса позволяют интегрировать данные инструменты на любой свой интернет-ресурс с помощью персонального API-ключа. Благодаря такому решению транскрибация будет доступна любому посетителю сайта и не только.
Среди полезных дополнений Deepgram для удобства и привлечения клиентов можно отметить:
В целом можно сказать, что Deepgram постоянно развивается и внедряет в свою работу множество современных технологий, форматов, языков и других полезных дополнений. Например, площадка поддерживает множество языков мира для расшифровки аудиофайлов, в том числе и русский. Однако сама платформа работает исключительно на английском языке.
У площадки есть специальная Deepgram API Playground — так называемая игровая площадка, где каждый пользователь сможет в полном объеме и за счет бесплатных кредитов не только воспользоваться любым инструментом, который в будущем хочет внедрить в свои интернет-ресурсы, но и посмотреть, как будет выглядеть итоговый результат интеграции. Решение идеально подходит для начинающих и уже практикующих разработчиков, владеющих такими языками программирования как Python, JavaScript, NET, Go, Node.js и Curl.
У Deepgram существует всего три тарифных плана, поэтому выбрать подходящий клиенту вариант будет проще. Однако стоит отметить, что по сравнению с конкурентами, стоимость данных подписок значительно выше, чем у похожих сервисов.
Лимиты и возможности распределяются таким образом:
Тариф |
Особенности |
Pas As You Go |
|
Growth |
|
Enterprise |
|
Стоит отметить, что первый тариф активируется при регистрации на платформе, а третий только после связи с отделом продаж. Оптимальный тариф Growth имеет начальную ставку для оплаты в 4 000$, однако есть возможность разового пополнения кредитов от 100$. Пополнить баланс можно с помощью банковских карт, American Express или JCB.
Чтобы воспользоваться услугами сервиса, необходимо завести личный аккаунт.
Deepgram требует ручного ввода данных (электронная почта и пароль) или авторизацию через Google, GitHub или Azure.
Дополнительного подтверждения регистрации с помощью перехода по специальным ссылкам не нужно.
После прохождения этапа регистрации, пользователь сразу попадает на рабочую панель сервиса.
На главной странице (Dashboard) доступна информация об оставшихся кредитах, кнопка для создания персонального API-ключа и инструменты для работы. После регистрации каждый пользователь разово получает до 200$, который не возобновляется. Эти кредиты бесплатны и ими можно пользоваться в любой момент, однако в дальнейшем необходимо будет подключить тарифный план или разово пополнять баланс профиля.
Раздел Help отвечает за перенаправление пользователя в специальный форум на GitHub, где можно ознакомиться с уже существующими вопросами от других клиентов. Если ответа не было найдено, можно написать техподдержке сервиса, однако сделать это можно с помощью формы обратной связи и только после авторизации в GitHub.
Раздел API Keys дублирует кнопку для создания собственного ключа для интеграции возможностей Deepgram в сторонние ресурсы, однако также содержит полезные советы и рекомендации по использованию инструмента.
Usage отвечает за аналитику всех совершенных действий внутри платформы и за ее пределами (при существующих интеграциях). Здесь отражаются количество созданных запросов, использованные лимиты и средства.
Последний раздел для работы — Settings. В настройках пользователь может добавить участника проекта, добавить банковскую карту для настройки и запоминания авто платежа, а также сменить тарифный план или разово пополнить баланс кредитов.
Теперь воспользуемся основными инструментами сервиса для транскрибации текста и речи.
Чтобы воспользоваться инструментом для транскрибации речи в текст, необходимо на главной странице выбрать второй вариант демо и нажать на него.
В открывшемся окне станет доступным микрофон для записи голоса в режиме реального времени и параметр для настройки определения языка записи. После того, как аудиоряд будет продиктован, запрос отправится в обработку и в окне справа станет доступен распознанные текст.
Для программистов и разработчиков разработаны пошаговые руководства по использованию инструментов сервиса, которые также находятся на главное рабочей панеле. Такой подход позволяет самостоятельно внедрить полученный результат в виде кода на выбранном языке программирования в любой интернет-ресурс.
Пользователи сети отмечают Deepgram как универсальное решение, которое подходит как для простых желающих расшифровать аудиофайлы в текст, так и для опытных разработчиков и программистов, которые способны внедрить и интегрировать инструменты в свои проекты с помощью кода.
Например пользователь форума G2 Джеффри отмечает, что за время использования сервиса площадка постоянно внедряет новые решения. Техподдержка работает стабильно, а интерфейс прост в эксплуатации:
Пользователь Феми отмечает хорошо написанную документацию, которая необходима для грамотной интеграции:
А вот пользователь Аднан в своем отзыве отмечает высокое качество итогового результата, но при этом отсутствие некоторых руководств:
Важно! Все отзывы взяты с англоязычного ресурса, поэтому могут иметь неточности в переводе.
Deepgram зарекомендовал себя не только среди новичков, но и среди опытных программистов и разработчиков. Благодаря наличию API-ключей, любой желающий сможет интегрировать инструменты ресурса на свои площадки, используя при этом популярные языки программирования и готовые коды.
Что касается транскрибации, то сервис поддерживает большинство популярных форматов и более 30 языков мира. Среди удобств и отличительных фишек для клиентов можно отметить реферальную программу, ежегодную подписку или разовое пополнение баланса, наличие бесплатной тестовой версии и кредитов для работы, большое количество полезных материалов и отдельную рабочую панель для программистов. Deepgram постоянно развивается и внедряет множество современных технологий и решений, что отмечают независимые пользователи сети в своих отзывах.
Качество транскрипции сопоставимо с другими сервисами, которыми я пользовался, но все еще далеко не настолько хорошее, чтобы надежно транскрибировать наши подкасты без БОЛЬШОГО редактирования. Функция "Ключевые слова" может немного помочь, но она не идеальна. Мне также пришлось пройти через множество препятствий, чтобы использовать целые фразы в качестве ключевых слов (например, название бренда или полное имя человека). Это официально не поддерживается (не знаю почему), но это настолько важно, что стоило обойти это ограничение.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.
Я участвовал в хакатоне, целью которого было обеспечить перевод в реальном времени в таких условиях, как церковная служба, для участников, которые не владели языком, на котором говорят. Мы довольно быстро поняли, что самым важным моментом в достижении этой цели было наличие точных расшифровок исходного аудиопотока — без этого проект был бы обречен. После небольшого исследования мы решили использовать Deepgram из-за простоты интеграции, настраиваемости и способности работать с несколькими языками ввода. Также было немало полезных примеров и руководств, которые помогут нам быстро начать работу. В итоге мы достигли наших целей с помощью Deepgram и выиграли хакатон со своим проектом.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.
Они предоставляют понятную документацию о различных услугах, которые они предлагают. В сочетании с игровой площадкой, позволяющей легко протестировать их перед интеграцией, это просто потрясающе.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.
Сервис предоставляет услуги преобразования речи в текстовые сообщения в режиме реального времени, которые довольно точны и очень быстры по сравнению с конкурентами.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.
Использую Deepgram для записи голоса через веб-сокеты. Мне нравится стабильность, простота и качество API. Качество транскрипции близко к идеальному. Цены также очень хороши для наших сценариев.
Что нужно улучшить? Хотелось бы гендерного анализа и большего количества экспериментальных функций — пользовательских моделей машинного обучения и тому подобного — для большей расширяемости.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.
Это действительно отличный союзник, он поддерживает множество языков, API-интерфейсы просты, удобны в использовании, точность очень хорошая, он быстрый, есть большая поддержка. Я очень рад использовать Deepgram, он действительно мощный и простой в использовании, несложный и, прежде всего, очень прозрачный.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.
API Deepgram быстрый и многофункциональный. Я использовал его для создания прототипов интерактивных голосовых систем и часто удивлялся тому, как разработчики предусмотрели потребности моего варианта использования. Документация и примеры кода также очень хороши, что позволяет легко начать работу. На самом деле я указываю на документы Deepgram API и SDK как на образцовые; они очень логически организованы, просты для понимания и просты в навигации. Удивительно, как даже очень хорошие сервисы с трудом справляются с этой задачей.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.
Deepgram является бесценным партнером Insight Health. Я протестировал несколько других продуктов преобразования речи в текст, и Deepgram имеет самую низкую задержку, меньше ошибок и хорошо документированные API. Мы быстро подписали HIPAA BAA и уже через неделю все было запущено в производство. С Deepgram легче вести бизнес как со стартапом. У них есть отличная программа для стартапов, с помощью которой можно начать работу и масштабироваться вместе с ними.
Они быстро совершенствуются, выпуская новые модели, функции и продукты — примеры Nova 2 и Aura. Если вы стартап на ранней стадии и ищете надежные, эффективные и инновационные решения НЛП, Deepgram трудно не заметить.
Этот отзыв отражает субъективное мнение пользователя, а не официальную позицию редакции.