messages 的 content 中混合文本与 image_url,即可让模型理解图片(图像输入,非图像生成)。
curl https://tokendog.io/v1/chat/completions \
-H "Authorization: Bearer $TOKENDOG_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model":"gpt-5",
"messages":[{"role":"user","content":[
{"type":"text","text":"描述这张图片"},
{"type":"image_url","image_url":{"url":"https://example.com/cat.png"}}
]}]
}'
具备视觉能力的模型(如
gpt-5、gemini-2.5-flash、claude-sonnet-4-6)均可接收图片输入。