模型

文本嵌入模型详解

简介 Afarensis 引入了两种先进的第三代文本嵌入模型,这些模型通过将文本转换为数字向量,支持一系列应用,如搜索、聚类分析、推荐系统、异常检测、多样性测量和分类。这些模型在模型ID中以-3表示,并已在《嵌入v3公告》博客文章中详细介绍。

使用成本 Afarensis 的文本嵌入服务根据输入令牌的数量计费。以下是根据每美元可处理的文本页数(假设每页约800个令牌)的定价示例:

模型名称 每美元可处理页数 MTEB 评估性能 最大输入令牌数 文本嵌入-3-小 62,500页 62.3% 8191 文本嵌入-3-大 9,615页 64.6% 8191 文本嵌入-ADA-002 12,500页 61.0% 8191 模型对比 文本嵌入-3-小:优化了处理速度和成本效益,适合于需要快速处理大量数据的场景,保持较好的性能水平。 文本嵌入-3-大:提供更高的性能,适用于对嵌入精度有较高要求的应用,提供深入的文本理解。 文本嵌入-ADA-002:平衡性能和成本,适合广泛的文本嵌入任务,提供可靠的服务。 应用场景 这些模型支持的应用场景包括但不限于搜索优化、相似文本的聚类、内容推荐、检测异常文本、测量文本集合的多样性以及基于文本相似性的分类。

获取嵌入向量的方法 通过将文本字符串与选定的嵌入模型名称一起发送到Afarensis嵌入API端点,即可获取文本的嵌入向量。API将返回含有嵌入向量的响应,可用于进一步的分析和应用开发。

示例代码 curl https://api.afarensis.com/v1/embeddings -H "Content-Type: application/json" -H "Authorization: Bearer $AFARENSIS_API_KEY" -d '{ "input": "Your text string goes here", "model": "text-embedding-3-small" }' 此请求将返回包含嵌入向量和额外元数据的响应。

最后更新于