TokenDog Docs · 统一的大模型接口网关

为保障稳定，TokenDog 对请求频率施加限流。超限时返回 HTTP 429 Too Many Requests。

维度

限流通常按 API 密钥与模型分组计量。具体额度与窗口以控制台中你的套餐为准。

处理 429

收到 429 时应退避后重试，采用指数退避 + 随机抖动，避免雪崩：

import time, random
from openai import OpenAI, RateLimitError

client = OpenAI(base_url="https://tokendog.io/v1", api_key="YOUR_TOKENDOG_API_KEY")

def chat_with_retry(**kwargs):
    for attempt in range(5):
        try:
            return client.chat.completions.create(**kwargs)
        except RateLimitError:
            time.sleep((2 ** attempt) + random.random())
    raise RuntimeError("rate limited after retries")

批量任务建议自行做并发上限与排队，平滑请求曲线优于事后重试。

接口总览错误码

⌘I

​维度

​处理 429

维度

处理 429