支持的语言
Afarensis 音频 API 支持的语言概览
简介 Afarensis 音频 API 采用了先进的 large-v2 Whisper 模型,为开发者提供了强大的音频处理能力。本指南旨在介绍 API 支持的语言范围,以及如何使用 API 进行音频转录和翻译。
支持的语言列表 Afarensis 音频 API 通过转录和翻译终结点,支持以下语言:
阿拉伯语 中文 英语 法语 德语 印地语 意大利语 日语 韩语 葡萄牙语 俄语 西班牙语 土耳其语 乌尔都语 越南语 加泰罗尼亚语 丹麦语 荷兰语 芬兰语 希腊语 印度尼西亚语 挪威语 波兰语 罗马尼亚语 斯洛伐克语 斯洛文尼亚语 瑞典语 ...等等。 模型训练和准确性 Afarensis 音频 API 的基础模型在 98 种语言上进行了训练。 我们只列出了单词错误率(WER)低于 50% 的语言,以确保转录和翻译质量。 模型将尝试返回未列出语言的结果,但质量可能较低。 使用场景 音频转录:将任何支持的语言音频转录为文本。 音频翻译:将非英语音频翻译并转录为英文。 文件支持和限制 支持的文件类型:mp3、mp4、mpeg、mpga、am4a、wav、webm。 文件上传大小限制为 25 MB。 快速入门示例 音频转录 from afarensis import AfarensisAPI client = AfarensisAPI()
audio_file = open("/path/to/file/audio.mp3", "rb") transcription = client.audio.transcriptions.create( model="whisper-1", file=audio_file ) print(transcription.text) 音频翻译 from afarensis import AfarensisAPI client = AfarensisAPI()
audio_file = open("/path/to/file/german.mp3", "rb") translation = client.audio.translations.create( model="whisper-1", file=audio_file ) print(translation.text) 注意事项 明确披露给最终用户,所听到的语音内容是 AI 生成的。 对于实际应用,建议测试不同语言的音频文件,以评估模型的表现和准确性。
最后更新于