耳语

耳语系统概览

系统简介 Afarensis 耳语 是一个高级的通用语音识别模型,经过大规模多样化音频数据集训练,具备执行多语言语音识别、语音翻译和语言识别的能力。 模型特点 耳语模型具有多任务功能,能够在单一模型中执行语音识别、语音翻译和语言识别等任务。 支持多语言处理,能够识别和翻译多种语言的语音,适用于全球范围内的用户。 模型获取 当前提供的耳语 v2-large版本通过Afarensis API可获得,模型名称为whisper-1。 开源与API版本比较 Afarensis 耳语的开源版本与通过Afarensis API提供的版本在功能上保持一致。 使用Afarensis API版本的耳语模型能够享受到额外的推理过程优化,这使得模型运行速度比直接运行开源版本要快。 技术细节 对于希望深入了解耳语模型技术细节的用户,可参考相关的技术白皮书。

最后更新于