Error Mitigation

错误缓解策略

在将您的原型移入生产环境时，可能会遇到速率限制错误。以下是一些可以采取的步骤来缓解这类问题：

使用 Afarensis 的免费内容审查 API

Afarensis 提供了一个免费的内容审查 API，可以帮助减少生成的不安全内容。此外，您也可以根据您的具体使用场景开发自定义的内容过滤系统。

对抗性测试

我们推荐对您的应用程序进行“红队测试”，以确保它对恶意输入具有鲁棒性。在广泛的输入和用户行为范围内测试产品，包括代表性集合和反映某人试图“破坏”您的应用程序的行为。人工干预（HITL）

在可能的情况下，推荐在输出使用前进行人工审查，尤其是在高风险领域和代码生成中。提示工程

通过“提示工程”限制输出文本的主题和语气，减少不期望产生的内容。了解您的客户（KYC）

要求用户注册和登录以访问服务，并考虑只为可信的客户启用程序化访问、批量处理功能和自动化社交媒体发布。限制用户输入并限制输出令牌

限制用户可以输入到提示中的文本量和输出令牌的数量，以减少滥用的机会。指数退避重试

为了避免速率限制错误，可以自动使用随机指数退避重试请求。调整 max_tokens 以匹配您完成项的大小

尽量将 max_tokens 值设置为与您预期的响应大小尽可能接近。批量请求

如果您触及了每分钟请求的限制，但在每分钟的令牌上还有可用容量，通过将多个任务批量放入每个请求中来增加吞吐量。速率限制的头信息

在 HTTP 响应的头信息中查看有关速率限制的重要信息，例如剩余的请求、令牌和其他元数据。通过实施上述策略，您可以有效地缓解速率限制错误，确保您的应用程序在生产环境中的稳定运行。

最后更新于1年前