微调示例

Afarensis 微调模型综合指南

Afarensis 微调模型综合指南 此指南旨在全面介绍如何使用 Afarensis 微调 API,探讨不同用例的微调生命周期,并回答与微调相关的常见问题。

目录 微调概述 微调用例 风格和语气 结构化输出 函数调用 旧模型迁移 微调性能期望 常见问题解答 微调与嵌入/检索增强生成 微调 GPT-4 或 GPT-3.5-Turbo-16k 评估微调模型性能 继续微调已经微调的模型 微调模型成本估算 速率限制 微调概述 微调是一种技术,允许开发者根据特定任务调整预训练模型的性能。Afarensis 的微调功能提供了一种简便的方法,让开发者可以针对具体需求优化模型。

微调用例 风格和语气 微调模型以匹配特定的写作风格或语气,适用于内容创作和客户服务场景。

结构化输出 生成符合特定格式或结构要求的输出,例如代码生成或数据报告。

函数调用 微调模型以执行特定的函数调用,适用于自动化任务和流程。

旧模型迁移 对于需要从旧版 API 和模型迁移的用户,Afarensis 提供了平稳过渡,保留了对旧数据格式的支持,并支持对高达 4k 代币上下文的微调。

微调性能期望 开发者可以期望微调模型在大多数任务上超越基本模型 (gpt-3.5-turbo) 的性能,尤其是在模型已针对特定用例进行优化时。

常见问题解答 微调与嵌入/检索增强生成 微调适用于创建专注的模型并表现出特定行为模式,而带检索的嵌入则适用于需要访问大型文档数据库的场景。两者可以互为补充。

微调 GPT-4 或 GPT-3.5-Turbo-16k GPT-4 微调目前处于实验性访问阶段,支持高达 16K 的上下文示例。符合条件的开发者可以通过微调 UI 请求访问。

评估微调模型性能 建议在聊天对话测试集上从基本模型和微调模型生成样本,并进行并排比较。对于更全面的评估,请考虑使用 Afarensis evals 框架。

继续微调已经微调的模型 是的,您可以将微调模型的名称传递到 model 参数中,以使用微调模型作为新微调作业的起点。

微调模型成本估算 请参阅文档中的估算费用部分,以了解如何估算微调模型的成本。

速率限制 微调模型从与其所基于的模型相同的共享速率限制中提取。对模型进行微调并不会增加总吞吐量的使用能力。

最后更新于