模型与价格
以百万 tokens 为单位计量计费。Token 是模型处理自然语言文本的最小单位。
模型参数
| deepseek-v4-flash | deepseek-v4-pro | |
|---|---|---|
| API 地址 (OpenAI) | https://api.deepseek.com | |
| API 地址 (Anthropic) | https://api.deepseek.com/anthropic | |
| 模型版本 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
| 思考模式 | 非思考 / 思考(默认) | |
| 上下文窗口 | 1,000,000 tokens | |
| 最大输出 | 384,000 tokens | |
功能支持
| 功能 | v4-flash | v4-pro |
|---|---|---|
| JSON 输出 | 支持 | 支持 |
| 工具调用 | 支持 | 支持 |
| 前缀续写 (Beta) | 支持 | 支持 |
| FIM 补全 (Beta) | 仅非思考模式 | 仅非思考模式 |
价格明细
| 计费项(每百万 tokens) | v4-flash | v4-pro |
|---|---|---|
| 输入(缓存命中) | 0.02 元 | 0.025 元 |
| 输入(缓存未命中) | 1 元 | 3 元 |
| 输出 | 2 元 | 6 元 |
并发限额
| 模型 | 并发上限 |
|---|---|
| deepseek-v4-flash | 2,500 |
| deepseek-v4-pro | 500 |
* deepseek-chat 与 deepseek-reasoner 将于 2026/07/24 弃用,分别映射至 v4-flash 的非思考与思考模式。并发详情见限速文档。
计费说明
透明、按量、无隐藏费用
费用 = token 消耗量 × 单价。优先从赠送余额扣减,再扣充值余额。
- 费用按实际 token 消耗计算,精确到千分之一元
- 赠送余额优先扣除,充值余额随后
- 价格可能调整,请定期查看本页获取最新信息
DeepSeek 保留对产品价格进行调整的权利。请依据实际用量按需充值。