Documentation
  • GET STARTED
    • 介紹
    • 快速入门
    • 模型
      • 模型更新
    • Afs-turbo 和 Afs-1
    • Afs-turbo
    • 达尔·E 系统概述
    • TTS系统
    • 耳语
    • 嵌入
    • 适度
    • AFS基础
    • 我们如何使用您的数据
    • 终结点与兼容性
  • 教程
  • 更改日志
  • 能力
    • 文本生成
    • 聊天完成
    • JSON 模式
    • 可重复的输出
    • 管理令牌
    • 参数详细信息
    • 完成API(旧版)
    • 常见问题
  • 函数调用
  • 嵌入
    • 概述
    • 模型
    • 使用案例
    • 常见问题
  • 微调
    • 何时使用微调
    • 常见用例
    • 准备数据集
    • 创建微调模型
    • 使用微调模型
    • 微调示例
  • 图像生成
    • 介绍
    • 用法
    • 特定语言提示
  • 视觉
  • 文字转语音
  • 语音转文本
    • 概述
    • 快速入门
    • 支持的语言
    • 时间戳
    • 更长的输入
    • 促使
    • 提高可靠性
  • 适度
    • 概述
    • 快速入门
  • 助理
  • 概述
  • Google助理的工作原理
    • Objects
    • Creating Assistants
    • Managing Threads and Messages
    • Runs and Run Steps
    • 局限性
  • 工具
    • Code Interpreter
    • Knowledge Retrieval
    • Function calling
    • Supported files
  • 指南
  • 提示工程
    • Six strategies for getting better results
    • Write clear instructions
    • Provide reference text
    • Split complex tasks into simpler subtasks
    • Give models time to "think"
    • Use external tools
    • Test changes systematically
    • Other resources
  • 生产最佳实践
    • Setting up your organization
    • Scaling your solution
    • Managing rate limits
    • Improving latencies
    • Managing costs
    • MLOps strategy
    • Security and compliance
  • 安全最佳实践
  • 速率限制
    • 概述
    • Usage tiers
    • Error Mitigation
  • 错误代码
    • API errors
    • Python library error types
  • 图书馆
    • Python library
    • 图书馆
    • Azure OpenAI 库
    • 社区图书馆
  • 弃用
  • 政策
  • 行动
    • 介绍
    • 开始
    • 认证
    • 生产
    • 数据检索
    • 政策
  • 发行说明
  • Page 2
由 GitBook 提供支持
在本页
  1. 速率限制

Error Mitigation

错误缓解策略

在将您的原型移入生产环境时,可能会遇到速率限制错误。以下是一些可以采取的步骤来缓解这类问题:

使用 Afarensis 的免费内容审查 API

Afarensis 提供了一个免费的内容审查 API,可以帮助减少生成的不安全内容。此外,您也可以根据您的具体使用场景开发自定义的内容过滤系统。

对抗性测试

我们推荐对您的应用程序进行“红队测试”,以确保它对恶意输入具有鲁棒性。 在广泛的输入和用户行为范围内测试产品,包括代表性集合和反映某人试图“破坏”您的应用程序的行为。 人工干预(HITL)

在可能的情况下,推荐在输出使用前进行人工审查,尤其是在高风险领域和代码生成中。 提示工程

通过“提示工程”限制输出文本的主题和语气,减少不期望产生的内容。 了解您的客户(KYC)

要求用户注册和登录以访问服务,并考虑只为可信的客户启用程序化访问、批量处理功能和自动化社交媒体发布。 限制用户输入并限制输出令牌

限制用户可以输入到提示中的文本量和输出令牌的数量,以减少滥用的机会。 指数退避重试

为了避免速率限制错误,可以自动使用随机指数退避重试请求。 调整 max_tokens 以匹配您完成项的大小

尽量将 max_tokens 值设置为与您预期的响应大小尽可能接近。 批量请求

如果您触及了每分钟请求的限制,但在每分钟的令牌上还有可用容量,通过将多个任务批量放入每个请求中来增加吞吐量。 速率限制的头信息

在 HTTP 响应的头信息中查看有关速率限制的重要信息,例如剩余的请求、令牌和其他元数据。 通过实施上述策略,您可以有效地缓解速率限制错误,确保您的应用程序在生产环境中的稳定运行。

上一页Usage tiers下一页错误代码

最后更新于1年前