在杭州,一家名为DeepSeek的AI公司近期成为了业界焦点。该公司推出了其最新力作——V3大型语言模型,这一开源模型在众多基准测试中的表现令人瞩目,与OpenAI的4o以及Anthropic的Claude3.5Sonnet几乎不相上下,让整个行业为之侧目。更令人惊叹的是,在成本方面,DeepSeek的V3模型总成本仅为560万美元,相较于美国同行动辄数亿美元的投资,这一差距之大令人咋舌。
图源备注:图片由AI生成,图片授权服务商Midjourney
对于外界关注的资金问题,DeepSeek首席执行官梁文峰回应称,资金从未是他们所担忧的。尽管V3是基于H800芯片训练的,但DeepSeek团队凭借出色的智慧与能力,在有限的资源下,依然展现出了强大的研究与工程实力,成功打造出了这一令人瞩目的模型。
AI领域的知名专家Andrej Karpathy对DeepSeek的投资预算表示惊讶,称其“简直是个笑话”,然而最终呈现的成果却是“在资源受限的情况下,完成了一项高度令人印象深刻的研究与工程壮举”。
AGI(通用人工智能)一直被视为AI研究的终极目标,犹如一座高不可攀的“圣杯”。它具备在解决问题和执行任务上超越人类的能力。众多专家预测,一旦AGI技术真正成熟,首个实现AGI的国家将在经济、科学以及安全等诸多关键领域占据无可比拟的巨大优势,引领全球发展的新潮流。