随着国庆假期的落幕,人工智能领域似乎也迎来了一丝凉意。这种冷感并非来自季节的更迭,而是源自于经济和精神层面的多重压力。尽管人工智能本身可能还未能感知到这份寒意,但现实世界的复杂性远远超出了基于Transformer架构的大语言模型(LLM)所能理解和应对的范围。
技术上,本轮人工智能的热潮起源于Transformer架构。然而,这一架构,尽管让OpenAI的估值飙升至1570亿美元,却也面临着诸多质疑。批评者认为,Transformer架构的缺陷与其优点一样显著,而基于此的大语言模型并不是通往人工通用智能(AGI)的桥梁。
这些质疑声也波及到了生成式人工智能(GenAI)。自从GenAI问世以来,它所引发的版权、安全等问题,以及与经济、社会、政治层面的冲突,都成为了人们批判的焦点。
投资界对大语言模型的悲观态度也日益明显。高盛等投资机构认为,尽管投入巨大,但GenAI的回报却微乎其微。Mighty Capital在过去两年中未对AI领域进行任何投资,认为当前的创业项目估值过高。Next Round Capital Partners更是预测,未来三年内,85%的AI初创公司将因资金耗尽或被收购而倒闭。
在国内,知名投资人朱啸虎也表达了对大模型公司的悲观看法,认为五年后可能不再有独立的大模型公司。这一观点暗示了大模型公司最终可能都会被收购,而二、三线大模型创业项目已经在寻求出售。
关于LLM是否能够通往AGI的问题,2023年3月,未来生命研究所(FLI)发布了一封公开信,呼吁所有AI实验室暂停训练比GPT-4更强大的AI系统至少6个月。这封信得到了包括马斯克在内的1000多名科技领袖和研究人员的支持。然而,这封信似乎并未引起足够的重视,反而让更多的人坚信LLM能够实现AGI。
但也有观点认为,LLM与AGI的距离非常遥远,甚至有人认为OpenAI的研究将AGI的进展倒退了5到10年。Meta的首席AI科学家杨立昆认为,LLM永远无法达到人类的智能水平,它们在通往人类水平智能的道路上,只是一种干扰和死胡同。
OpenAI的CEO Sam Altman也表达了对LLM在实现AGI方面的潜力持保留态度。因此,未来GPT-5是否会继续采用Transformer架构,还是一个未知数。
目前,主流的AI模型和产品,如ChatGPT、Sora、Bard等,都基于Transformer架构。但RWKV论文的作者彭博认为,现实世界的运转并不基于Transformer逻辑,而是更类似于RNN结构。麻省理工学院教授Daron Acemoglu也对AI的前景持保留态度,预测未来十年内,只有大约四分之一的AI任务能够实现成本效益的自动化。
高盛的策略师团队报告称,科技巨头在AI领域的大量投资尚未产生相应的收入和利润,可能导致估值贬值。红杉资本合伙人则认为,按照当前的投资成本,要保证50%的利润,需要赚到6000亿美元。
尽管如此,大模型项目的未来并非一片黯淡。OpenAI虽然面临巨额亏损,但其发布的模型一直是行业领先,并且得到了大客户的重视。如果能够在两年内转型为盈利性企业并完成上市,将有可能获得更多投资。
国内的大模型项目,如果能够在某个垂直领域领先,为特定用户群体提供稳定、高效的应用服务,也有可能获得更多的融资机会。此外,开发非Transformer架构的模型,用小体量模型完成大模型的任务,也是一个值得探索的方向。
今年以来,国内大模型项目基本都已获得新一轮融资。例如,月之暗面在完成新一轮腾讯投资的3亿美元融资后,估值已达33亿美元。这些项目的融资成功,不仅为它们提供了动力,也助力它们完善生态和获取更多行业资源。
虽然基于Transformer架构的LLM可能不是通往AGI的最终桥梁,但它在当前阶段的发展空间远未触顶,将创造足够的商业和社会价值。而那些大模型项目,无论最终是被收购还是独立发展,它们的努力和创新都将为国产大模型的发展贡献力量。
高盛的报告虽然担心AI投入过多收益太少,但也预测未来数年内将有约1万亿美元的投资用于生成式AI及相关基础设施。摩根士丹利则对微软在AI货币化方面的商业回报增长持信心。朱啸虎认为,生成式AI可能是一个长周期的机会,大模型迭代速度放缓将带来更多应用创新的机会。
在日常生活中,大模型的应用已经开始显现。无论是年轻人使用Kimi搜索资料,还是长辈们手机上安装的豆包,都预示着大模型应用的良好开端。