从今天开始,SiliconCloud 平台正式向用户推出 DeepSeek-R1 和 V3API 的批量推理功能。这一新功能允许用户通过批量 API 向平台发送请求,从而突破实时推理速率的限制,实现大规模数据处理任务的高效完成,且整个处理过程预计在 24 小时内完成。
此次更新最引人注目的变化是价格的显著下降。DeepSeek-V3 的批量推理价格相比实时推理降低了 50%。更令人兴奋的是,在 3 月 11 日至 3 月 18 日期间,DeepSeek-R1 的批量推理价格更是迎来了 75% 的大幅优惠,输入价格仅为 1 元 / 百万 Tokens,而输出价格为 4 元 / 百万 Tokens。
批量推理功能的上线,是为了帮助用户更高效地应对生成报告、数据清洗等大批量数据处理任务,以更经济的方式享受 DeepSeek-R1 和 V3API 服务。这一功能特别适合那些不需要实时响应的数据分析、模型性能评估等应用场景。
需要指出的是,此前 DeepSeek-R1 和 V3API 已经陆续支持了 Function Calling、JSON Mode、Prefix、FIM 等功能。此外,Pro 版 DeepSeek-R1 和 V3API 的 TPM(每分钟处理的 Token)上限也从 1 万提升至 100 万,这进一步增强了平台的处理能力,为用户提供了更强大的支持。