在自然语言处理的领域,OpenAI 提供的词向量服务可以将输入文本转换为向量表示,这对于文本分析、情感分析等应用场景非常有用。本文将手把手教你如何使用 OpenAI Embeddings API 生成文本的嵌入向量。

简介

OpenAI Embeddings API 允许开发者通过简单的 API 调用,将文本内容转换为向量。这种向量可以用于各种机器学习任务,比如文本相似度计算、分类、聚类等。通过这个 API,用户可以轻松获取文本的嵌入表示,从而更好地进行后续的数据处理和分析。

环境准备/前置条件

在使用 OpenAI Embeddings API 之前,请确保你已具备以下条件: 1. 注册一个 Ace Data Cloud 账号,并获取 API 访问权限。 2. 安装 Python 及 requests 库(如果尚未安装): bash pip install requests

详细步骤

1. 申请 API 凭证

首先,你需要前往 OpenAI Embeddings API 页面,点击“获取”按钮申请 API 凭证。如下图所示:

如果你尚未登录或注册,将会自动跳转到登录页面。登录后,你将返回到当前页面。在首次申请时,系统会提供免费的使用配额。

2. 基本使用

在 API 界面上填写相关信息,如下图所示:

  • authorization: 从下拉列表中选择。
  • model: 选择你希望使用的模型(可参考官方文档了解更多模型信息)。
  • input: 输入需要转换为向量的文本。

在界面的右侧,你还可以找到相应的代码生成,可以直接复制代码进行运行或点击“试试”按钮进行测试。

可选参数
  • dimensions: 裁剪向量维度,默认输出全维度。
  • encoding_format: 返回格式,可以选择 floatbase64

3. Python 示例代码

下面是一个简单的 Python 调用示例:

import requests

url = "https://api.acedata.cloud/openai/embeddings"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "input": "The food was delicious and the waiter...",
    "model": "text-embedding-ada-002",
    "encoding_format": "float"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

调用后,返回的结果格式如下:

{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [
        0.0022756963,
        -0.009305916,
        0.015742613,
        ...
      ]
    }
  ],
  "model": "text-embedding-ada-002",
  "usage": {
    "prompt_tokens": 8,
    "total_tokens": 8
  }
}

返回结果包含多个字段,具体说明如下:

  • model: 用于文本转换的模型。
  • usage: 转换文本所使用的令牌信息。
  • data: 转换后的词向量结果,其中的 embedding 为生成的具体词向量。

4. 错误处理

在调用 API 时,如果发生错误,API 会返回相应的错误代码和信息。例如:

  • 400 token_mismatched: 错误请求,可能是参数缺失或无效。
  • 401 invalid_token: 未授权,令牌无效或缺失。
  • 429 too_many_requests: 请求过多,超出速率限制。
  • 500 api_error: 服务器内部错误。
错误响应示例
{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

总结

通过本文,您已经学习了如何使用 OpenAI Embeddings API 生成文本的词向量。希望这篇文章能帮助你更好地集成和使用该 API。如果有任何疑问,请随时联系技术支持团队。

技术标签:#OpenAI #API #词向量 #自然语言处理 #Python

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐