Documentation
  • GET STARTED
    • 介紹
    • 快速入门
    • 模型
      • 模型更新
    • Afs-turbo 和 Afs-1
    • Afs-turbo
    • 达尔·E 系统概述
    • TTS系统
    • 耳语
    • 嵌入
    • 适度
    • AFS基础
    • 我们如何使用您的数据
    • 终结点与兼容性
  • 教程
  • 更改日志
  • 能力
    • 文本生成
    • 聊天完成
    • JSON 模式
    • 可重复的输出
    • 管理令牌
    • 参数详细信息
    • 完成API(旧版)
    • 常见问题
  • 函数调用
  • 嵌入
    • 概述
    • 模型
    • 使用案例
    • 常见问题
  • 微调
    • 何时使用微调
    • 常见用例
    • 准备数据集
    • 创建微调模型
    • 使用微调模型
    • 微调示例
  • 图像生成
    • 介绍
    • 用法
    • 特定语言提示
  • 视觉
  • 文字转语音
  • 语音转文本
    • 概述
    • 快速入门
    • 支持的语言
    • 时间戳
    • 更长的输入
    • 促使
    • 提高可靠性
  • 适度
    • 概述
    • 快速入门
  • 助理
  • 概述
  • Google助理的工作原理
    • Objects
    • Creating Assistants
    • Managing Threads and Messages
    • Runs and Run Steps
    • 局限性
  • 工具
    • Code Interpreter
    • Knowledge Retrieval
    • Function calling
    • Supported files
  • 指南
  • 提示工程
    • Six strategies for getting better results
    • Write clear instructions
    • Provide reference text
    • Split complex tasks into simpler subtasks
    • Give models time to "think"
    • Use external tools
    • Test changes systematically
    • Other resources
  • 生产最佳实践
    • Setting up your organization
    • Scaling your solution
    • Managing rate limits
    • Improving latencies
    • Managing costs
    • MLOps strategy
    • Security and compliance
  • 安全最佳实践
  • 速率限制
    • 概述
    • Usage tiers
    • Error Mitigation
  • 错误代码
    • API errors
    • Python library error types
  • 图书馆
    • Python library
    • 图书馆
    • Azure OpenAI 库
    • 社区图书馆
  • 弃用
  • 政策
  • 行动
    • 介绍
    • 开始
    • 认证
    • 生产
    • 数据检索
    • 政策
  • 发行说明
  • Page 2
由 GitBook 提供支持
在本页
  1. 语音转文本

支持的语言

Afarensis 音频 API 支持的语言概览

简介 Afarensis 音频 API 采用了先进的 large-v2 Whisper 模型,为开发者提供了强大的音频处理能力。本指南旨在介绍 API 支持的语言范围,以及如何使用 API 进行音频转录和翻译。

支持的语言列表 Afarensis 音频 API 通过转录和翻译终结点,支持以下语言:

阿拉伯语 中文 英语 法语 德语 印地语 意大利语 日语 韩语 葡萄牙语 俄语 西班牙语 土耳其语 乌尔都语 越南语 加泰罗尼亚语 丹麦语 荷兰语 芬兰语 希腊语 印度尼西亚语 挪威语 波兰语 罗马尼亚语 斯洛伐克语 斯洛文尼亚语 瑞典语 ...等等。 模型训练和准确性 Afarensis 音频 API 的基础模型在 98 种语言上进行了训练。 我们只列出了单词错误率(WER)低于 50% 的语言,以确保转录和翻译质量。 模型将尝试返回未列出语言的结果,但质量可能较低。 使用场景 音频转录:将任何支持的语言音频转录为文本。 音频翻译:将非英语音频翻译并转录为英文。 文件支持和限制 支持的文件类型:mp3、mp4、mpeg、mpga、am4a、wav、webm。 文件上传大小限制为 25 MB。 快速入门示例 音频转录 from afarensis import AfarensisAPI client = AfarensisAPI()

audio_file = open("/path/to/file/audio.mp3", "rb") transcription = client.audio.transcriptions.create( model="whisper-1", file=audio_file ) print(transcription.text) 音频翻译 from afarensis import AfarensisAPI client = AfarensisAPI()

audio_file = open("/path/to/file/german.mp3", "rb") translation = client.audio.translations.create( model="whisper-1", file=audio_file ) print(translation.text) 注意事项 明确披露给最终用户,所听到的语音内容是 AI 生成的。 对于实际应用,建议测试不同语言的音频文件,以评估模型的表现和准确性。

上一页快速入门下一页时间戳

最后更新于1年前