在科技与人工智能飞速发展的当下,AI芯片领域又迎来了新的突破。2月21日,SambaNova公司正式宣布在其自主研发的SN40L RDU处理器云平台上推出了DeepSeek-R1 671B模型推理云服务。据官方介绍,这项服务的token输出速度达到了惊人的每prompt每秒198个,堪称目前市场上最快的推理服务之一。
这一成就的背后,是SambaNova在芯片技术上的深厚积累。其SN40L RDU芯片采用了台积电先进的5nm制程工艺,BF16算力高达638 TFLOPS。更令人瞩目的是,该芯片采用了独特的三层存储结构:520MB的片上SRAM缓存、2.5D封装集成的64GB HBM内存以及片外1.5TB的超大容量DDR DRAM内存。这种设计使得单芯片能够容纳的参数数量远超其他同类产品,为大规模模型的高效运行提供了强大的硬件支持。
除了硬件配置的卓越,SN40L RDU芯片在结构设计上也展现了极高的灵活性。它能够动态重新配置硬件资源和数据流,从而大幅提升计算与访存效率。这种灵活性不仅优化了芯片的性能表现,还为未来的升级和扩展提供了更多的可能性。
在部署方面,SambaNova表示,仅需一台容纳16个SN40L RDU芯片的机架,即可轻松完成DeepSeek-R1 671B模型的部署。这一高效的部署方案不仅降低了硬件成本,还大大提高了系统的可扩展性和灵活性,使其能够更好地适应不同规模的业务需求。
随着人工智能在各个领域的广泛应用,高性能AI芯片的需求也在不断增长。SambaNova此次推出的DeepSeek-R1 671B模型推理云服务,无疑为行业树立了新的标杆。它不仅展示了SambaNova在AI芯片领域的强大实力,也为未来人工智能的发展提供了更多的想象空间。我们有理由相信,随着技术的不断进步,AI芯片将为我们的生活和工作带来更多的便利和惊喜。