智谱AI布局广泛却陷两难,B端C端市场如何平衡?

发布:2024-12-11 11:40:48 阅读:286

在2024年的冬季,国产AI领域迎来了一次震撼性的变革。11月29日,智谱AI在其技术开放日上创造了一个历史性的时刻:AI首次成功发出了红包。

公司CEO张鹏仅通过简单的三句语音指令,便指挥智能体AutoGLM跨越微信、支付宝等多个平台,为现场和在线观众派发了红包。这一举动不仅令人瞩目,更标志着AI Agent技术的重大突破。

传统AI助手通常局限于被动响应和单一场景交互,而智谱AI的AutoGLM却能够主动理解复杂指令,跨应用协同,并精准执行用户意图。除了发红包,AutoGLM还能自如应对多个复杂操作的长任务,如跨APP比价订外卖。

2024年,智谱AI在多个方向上取得了显著进展。7月,其代码生成大模型CodeGeeX第四代正式发布,支持代码补全、注释、修复和翻译等功能。月末,视频生成模型“智谱清影”面世,能生成6秒长、清晰度达1440×960的视频。

10月,智谱推出并开源了端到端语音模型GLM-4-Voice,具备实时语音对话功能,在情绪表达、多语言等方面实现突破,且支持随时打断。这一系列技术布局展示了智谱AI在追赶全球AI巨头方面的坚定决心。

然而,在广泛的技术覆盖背后,也引发了人们对智谱是否能在各领域深耕的担忧。与OpenAI等巨头相比,智谱在体量和资本上均处于劣势。多线并进是否会影响其在各领域的专注度和深度,成为了一个值得思考的问题。

智谱AI今年的表现相对“平均”,其产品方向更趋向于跟随,缺乏独创性的突破。以旗舰大模型GLM-4-Plus为例,该模型定位为深度推理模型,虽在深度推理、长文本处理和指令遵循等方面表现出色,但与智谱本身的生态定位存在错位。智谱AI的B端客户更需要性价比高、易集成且灵活的模型,而非高算力支持的深度推理大模型。

在多模态方向上,智谱AI的布局也反映了其定位迷失。智谱AI发布的多模态语音助手功能,试图在C端应用领域拓展新场景,但与科大讯飞和字节跳动等竞争对手相比,其表现并不突出。智谱AI的视频通话功能虽然支持低延迟、更自然的交互,但智力水平表现与文本状态下存在较大差距。

智谱AI在文生视频领域也展现了雄心,但其最新发布的CogVideoX v1.5模型和开放平台“清影”的表现,与字节、快手等大厂的文生视频大模型相比仍有较大差距。智谱AI生成的视频存在古怪、扭曲和运动错误等问题,如生成的视频中机器人数量错误、行走方式奇怪,以及猫的器官发生换位等。

智谱AI的“博而不精”现象反映出其在B端与C端两个方向上出现了摇摆。为了应对同行的价格压制,智谱AI将模型调用价格降低到行业最低水平,导致利润空间进一步被压缩。为了生存,智谱AI不得不依靠融资,并试图通过发布一系列技术热点来吸引市场关注。

然而,在AI行业,即使面临商业化困难的瓶颈期,除了“多线出击”外,仍有企业选择了专注于特定方向并取得突破。例如,OpenAI的劲敌Anthropic就明确聚焦于机制可解释性和AI对齐问题,通过高度集中的研究目标吸引了长期投资。

智谱AI等国产大模型厂商普遍面临的“追热点”困境,本质上是中国技术创新生态的产物。在激烈的市场竞争和资本压力下,企业不得不选择更激进的策略。然而,这也反映出中国技术创新生态尚未形成对“慢变量”的充分理解和尊重。

热门产品

查看更多