POST
/v1/chat/completions对话补全 API
创建对话补全响应。支持流式输出、多轮对话、Function Calling、视觉理解等功能。
请求端点
POST https://nexusflow.hk/v1/chat/completionsAuthorization: Bearer <API_KEY>Content-Type: application/json请求参数
代码示例
from openai import OpenAI
client = OpenAI(
api_key="sk-air-your-key",
base_url="https://nexusflow.hk/v1",
)
response = client.chat.completions.create(
model="claude-sonnet-4-6",
messages=[
{"role": "system", "content": "你是一个有帮助的助手。"},
{"role": "user", "content": "什么是机器学习?"}
],
temperature=0.7,
max_tokens=1000
)
print(response.choices[0].message.content)响应结构
响应示例
{
"id": "chatcmpl-abc123xyz789",
"object": "chat.completion",
"created": 1709123456,
"model": "claude-sonnet-4-6",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "机器学习是人工智能的一个分支..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 28,
"completion_tokens": 256,
"total_tokens": 284
}
}注意事项
- 不同模型
max_tokens上限不同,参考 模型列表 temperature和top_p建议只使用其中一个- 流式输出时最后一个 chunk 的
finish_reason才表示完成 - 图像理解仅支持 Claude 和 Qwen-VL 系列模型
- Function Calling 推荐使用 Claude 或 Qwen 系列