Deepgram推出新的实时文本转语音API——Aura

摘要: Deepgram成为语音识别的首选启动之一。今天,这家资金充足的公司宣布推出Aura,

Deepgram推出新的实时文本转语音API——Aura

Deepgram推出新的实时文本转语音API——Aura

Deepgram作为语音识别领域的知名初创公司,宣布推出其全新的实时文本转语音API——Aura。Aura结合了高度逼真的语音模型和低延迟API,使开发者能够构建实时对话式人工智能代理。这些代理可以替代呼叫中心和其他客户服务场景中的客服代理。

Deepgram的联合创始人兼首席执行官Scott Stephenson表示,过去虽然可以获得优秀的语音模型,但成本高昂且计算时间长。而低延迟模型往往听起来机械化。Deepgram的Aura结合了逼真的人类语音模型,渲染速度极快(通常不到半秒),并且价格低廉。

Deepgram声称,Aura的定价目前在每1000个字符0.015美元,几乎击败了所有竞争对手。虽然与Google的WaveNet声音和亚马逊Polly的神经声音的价格相当,但更便宜。亚马逊的最高级别则显著更昂贵。

Aura目前提供大约十几种语音模型,所有模型均由Deepgram与配音演员共同创建的数据集进行训练。Aura模型以及公司的其他模型均在内部训练。你可以在这里试用Aura的演示。

我已经测试了一段时间,尽管有时会遇到一些奇怪的发音,但速度是最突出的,除此之外还有Deepgram现有的高质量语音转文本模型。Deepgram强调了生成响应的速度,模型开始说话的时间(通常不到0.3秒)以及LLM完成生成响应的时间(通常不到一秒)。

© 版权声明

相关文章

暂无评论

暂无评论...
TAB栏自定义颜色

背景颜色

文字颜色