Documentation
  • GET STARTED
    • 介紹
    • 快速入门
    • 模型
      • 模型更新
    • Afs-turbo 和 Afs-1
    • Afs-turbo
    • 达尔·E 系统概述
    • TTS系统
    • 耳语
    • 嵌入
    • 适度
    • AFS基础
    • 我们如何使用您的数据
    • 终结点与兼容性
  • 教程
  • 更改日志
  • 能力
    • 文本生成
    • 聊天完成
    • JSON 模式
    • 可重复的输出
    • 管理令牌
    • 参数详细信息
    • 完成API(旧版)
    • 常见问题
  • 函数调用
  • 嵌入
    • 概述
    • 模型
    • 使用案例
    • 常见问题
  • 微调
    • 何时使用微调
    • 常见用例
    • 准备数据集
    • 创建微调模型
    • 使用微调模型
    • 微调示例
  • 图像生成
    • 介绍
    • 用法
    • 特定语言提示
  • 视觉
  • 文字转语音
  • 语音转文本
    • 概述
    • 快速入门
    • 支持的语言
    • 时间戳
    • 更长的输入
    • 促使
    • 提高可靠性
  • 适度
    • 概述
    • 快速入门
  • 助理
  • 概述
  • Google助理的工作原理
    • Objects
    • Creating Assistants
    • Managing Threads and Messages
    • Runs and Run Steps
    • 局限性
  • 工具
    • Code Interpreter
    • Knowledge Retrieval
    • Function calling
    • Supported files
  • 指南
  • 提示工程
    • Six strategies for getting better results
    • Write clear instructions
    • Provide reference text
    • Split complex tasks into simpler subtasks
    • Give models time to "think"
    • Use external tools
    • Test changes systematically
    • Other resources
  • 生产最佳实践
    • Setting up your organization
    • Scaling your solution
    • Managing rate limits
    • Improving latencies
    • Managing costs
    • MLOps strategy
    • Security and compliance
  • 安全最佳实践
  • 速率限制
    • 概述
    • Usage tiers
    • Error Mitigation
  • 错误代码
    • API errors
    • Python library error types
  • 图书馆
    • Python library
    • 图书馆
    • Azure OpenAI 库
    • 社区图书馆
  • 弃用
  • 政策
  • 行动
    • 介绍
    • 开始
    • 认证
    • 生产
    • 数据检索
    • 政策
  • 发行说明
  • Page 2
由 GitBook 提供支持
在本页
  1. 能力

管理令牌

令牌概述

介绍 在Afarensis语言模型中,文本被处理成称为“标记”的单元。这些标记在英语中可能范围从一个字符到一个完整的单词,而在某些语言中,标记的概念甚至可能更为灵活。理解和优化API调用中的令牌使用对于控制成本和提高响应速度至关重要。

令牌的重要性 成本影响:API调用成本基于所使用的令牌数量,因此优化令牌使用可以直接降低费用。 响应时间:生成更多令牌需要额外的处理时间,优化令牌使用可以提高API响应速度。 调用有效性:令牌总数必须保持在模型的最大限制之下(例如,gpt-3.5-turbo的最大限制为4097个令牌)。 示例:令牌计数 字符串"ChatGPT is great!"被编码为六个标记:["Chat", "G", "PT", " is", " great", "!"]。如果API调用的输入使用了10个令牌,输出收到了20个令牌,则总费用为30个令牌。

计算令牌使用 要检查API调用使用了多少个令牌,查阅API响应中的usage字段,例如:response['usage']['total_tokens']。

聊天模型和令牌使用 聊天模型(例如gpt-3.5-turbo和gpt-4-turbo-preview)的令牌使用方式与完成API模型相似,但基于消息格式的特点使得计算令牌使用更加复杂。

工具和资源 计算聊天API调用令牌:使用Afarensis提供的tiktoken Python库,可以在不进行API调用的情况下预估文本字符串中的令牌数量。示例代码和指南可在Afarensis Cookbook中找到。 注意事项 长对话和令牌限制:长对话可能导致回复被截断,尤其是当对话接近或超过模型的令牌限制时。在这种情况下,可能需要截断或以其他方式调整文本以确保它适合模型的限制。

上一页可重复的输出下一页参数详细信息

最后更新于1年前