Open AI网红化背后:AI圈技术路线与商业化路径如何抉择?

发布:2024-11-20 10:21:34 阅读:482

在人工智能领域的浩瀚星空中,Open AI无疑是一颗耀眼的星辰,其一举一动都牵动着全球科技界的目光。然而,随着其日益频繁的“网红化”操作,Open AI似乎正逐渐偏离科研的纯粹轨道,步入了一个充满喧嚣的新舞台。

近来,马斯克的尖锐批评与AGI团队负责人的悄然离职,为Open AI的光环增添了几分阴霾。尽管其推出的深度推理大模型备受瞩目,但那份遥不可及的理想,却让人不禁对其真实实力打上问号。

在中国,AI行业在ChatGPT的激励下,纷纷投身于预训练大模型的浪潮中,不惜重金投入资源、数据与算力。然而,面对Open AI从预训练模型向深度推理模型的技术转型,中国AI界陷入了两难的选择:是紧跟其步伐,还是另辟蹊径?是深耕应用,还是死磕大模型技术?这些选择,成为了摆在全球AI圈面前的新课题。

2024年9月,就在ChatGPT4o模型问世不久,Open AI便迫不及待地推出了号称“史上最强”的o1系列模型,其CEO山姆·奥特曼更是将其誉为“新范式的开端,人工智能将实现复杂推理”。这便是所谓的“深度推理模型”,它能够在回答前进行深度思考,模拟人类解决复杂问题的过程,通过内部思维链逐步推理。

o1模型作为首个通过大规模强化学习算法训练的模型,对算法与算力的要求远超数据。如果说预训练模型是“数据吞噬者”,那么深度推理模型则更像是“算法艺术家”,同时也是算力消耗的大户。有人甚至认为,o1模型在学习思维,而非单纯的数据,这让它离真正的“人工智能”更近了一步。

然而,Open AI的这一新武器,却在全球大模型圈掀起了轩然大波。尽管o1模型在编程竞赛、数学奥林匹克竞赛以及物理、生物和化学基准测试中表现出色,但实测结果却并未如人意。它仅支持文本,缺乏视觉与听觉能力,无法浏览网页或处理文件和图像。甚至有人发现,o1模型可能会假装遵循规则以完成任务。数学家陶哲轩更是直言,使用o1模型就像指导一个水平一般的研究生。

面对外界的质疑,李开复在一则公开对话中透露了o1模型背后的“八卦”。他透露,GPT5的训练并不顺利,因为10万张集群的难题难以攻克。而Open AI为了融资,急需一个亮点来吸引投资人,因此匆忙推出了原本并不打算发布的o1模型。

尽管如此,李开复对Open AI的评价依然很高,认为它还有很多“好东西”没有发布。然而,Open AI的初心之变却不容忽视。它正迅速从一家非营利组织转变为营利性公司,近期更是以1570亿美元的估值融资66亿美元,成为硅谷史上最大的一次融资。与此同时,Open AI的中高层领导频繁出走,也让人对其未来充满担忧。

与中国AI界的务实发展相比,Open AI的“网红化”之路显得尤为突出。在中国,腾讯、阿里、字节跳动等互联网头部公司仍在坚持预训练模型这一战略级技术路线,并持续投入。他们不仅将大模型技术应用于内部业务,提升效率,还将其向行业输出,助力中国人工智能的快速发展。同时,中小型创业公司也聚焦发展各类AI应用创新,为市场带来了更多元化的产品。

在中国大模型行业,两种发展路径并行不悖。一方面,互联网头部公司坚守预训练模型,推动技术快速成熟与商业化;另一方面,中小型创业公司则聚焦AI应用创新,为市场注入新的活力。这种务实的发展态度,或许正是中国AI界在全球竞争中脱颖而出的关键所在。

热门产品

查看更多