AI创业公司的进化之路:从工具到智能体

2025年底,Meta宣布以25亿美元收购AI智能体公司Manus,这个消息在AI圈引起了不小的震动。Manus总部位于新加坡,创始团队为华人,专注于AI智能体领域。这次收购或许只是AI行业整合浪潮的开始,但更重要的是,它标志着AI产品正在从简单的工具向更智能的自主代理演进。

多元化的AI产品生态

月之暗面推出的Kimi助手,以其强大的长文本处理能力著称,能够处理20万汉字的输入。在2025年,月之暗面发布了Kimi K2模型,采用MoE架构,总参数达到1T。随后推出的Kimi K2Thinking在”人类终极考试”(HLE)中取得了不错的成绩。除了基础对话能力,Kimi还在探索AI医疗、Agent等产品方向,并开源了Kimi CLI命令行工具,为开发者提供了更多可能性。

MiniMax则选择了全模态布局的策略。这家公司已建立起覆盖文本、视频、语音、音乐的全模态技术矩阵,核心产品包括Talkie(虚拟恋人陪伴)、星野(社交娱乐平台)、海螺AI(视频生成工具)以及MiniMax Audio(音频创作工具)。MiniMax采用”模型—多模态—应用”一体化技术路线,从数据清洗、算法研发到模型部署完全自研。据报道,MiniMax已凭借海外产品Talkie取得了不错的商业化成果。

快手推出的可灵AI是视频生成领域的佼佼者。作为快手自研的视频生成大模型,可灵AI生成的视频分辨率高达1080p,时长最高可达2分钟。截至2025年,可灵AI在全球拥有超过4500万创作者,累计生成视频超过2亿个。快手还开放了可灵AI的API服务,并针对AI创作领域的C端用户推出了独立App。可灵AI已经从单一工具发展为新一代AI创意生产力平台。

字节跳动的即梦AI则专注于AI创作领域。作为字节跳动旗下的AI创作平台,即梦AI已经在多个场景展开应用,比如与风语筑合作,作为独家AIGC技术支持方深度参与非遗数字化与新文旅业务。字节跳动在AI领域的布局显示出其对内容创作生态的重视。

智谱AI在Agent智能体领域也有重要布局。除了智谱清言助手,智谱还推出了AI输入法,并发布了AutoGLM沉思Agent产品。这是首个集深度研究能力和操作能力于一体的Agent,能够一边进行复杂思考,一边执行操作。智谱在AI智能体生态的全栈布局,显示出其对AI自主决策能力的重视。

AI智能体:从工具到代理的演进

2025年被业界普遍视为”Agent元年”。AI Agent技术正在从概念走向实际应用,从实验室走向生产线。与传统的AI工具不同,AI Agent具备自主决策和执行能力,能够理解复杂任务并将其分解为可执行的步骤。

在企业办公场景中,AI Agent已经能够自主分析数千份财报、生成风险报告并推送给决策层。在日常生活场景中,AI Agent可以作为智能日程与家庭助理,自动规划日程、整理会议纪要、分类邮件、提醒任务。比如,家庭成员的日程可以由AI Agent自动整合到共享日历中,遇到课外班冲突时还能智能推荐解决方案。

Manus被Meta收购,正是因为其在AI智能体领域的技术积累。Manus能够将用户的自然语言需求拆解成具体的任务步骤,然后自动执行,这个技术难度不小,涉及到自然语言理解、任务规划、工具调用等多个方面。Meta收购Manus,可能是看中了其在企业级应用场景的潜力。

AGI的渐进之路

通用人工智能(AGI)一直是行业关注的焦点。随着高性能AI芯片、深度推理、测试时计算、数据合成、多模态模型、空间智能等技术的发展,AGI的技术突破正在逐步接近。

但AGI的实现不会是一蹴而就的。从当前的发展趋势来看,AI能力的提升会沿着几个维度渐进:一是模型规模的持续扩大,二是推理能力的不断增强,三是多模态融合的深入发展,四是应用场景的不断拓展。

月之暗面的Kimi K2Thinking模型在推理能力上的提升,智谱的AutoGLM沉思在深度研究和操作能力上的突破,MiniMax在全模态技术上的布局,都显示出AI正在向更通用、更智能的方向发展。

行业整合与生态重构

Manus被Meta收购,只是AI行业整合的一个缩影。随着AI技术的成熟和商业化进程的加速,行业整合将成为常态。大型科技公司通过收购AI创业公司,可以快速获取技术能力和人才储备;而创业公司则可以通过被收购获得更好的资源支持和商业化路径。

但行业整合并不意味着创业机会的消失。相反,AI应用场景的广阔性为创业公司提供了大量机会。从内容创作到企业服务,从教育医疗到智能制造,AI技术的应用场景几乎覆盖了所有行业。

快手可灵AI在视频生成领域的成功,MiniMax Talkie在海外市场的突破,都证明了垂直领域和细分市场的价值。创业公司可以通过深耕特定场景,建立自己的竞争优势。

未来的应用场景展望

AI技术的应用场景正在快速扩展。在创意领域,AI可以帮助创作者生成图像、视频、音乐等内容,降低创作门槛,提升创作效率。可灵AI累计生成2亿视频的案例,说明AI在创意生产领域的潜力。

在企业服务领域,AI Agent可以自动化处理大量重复性工作,比如数据分析、报告生成、客户服务等。智谱的AutoGLM沉思已经展现出在复杂任务处理上的能力。

在个人生活领域,AI可以作为智能助理,帮助用户管理日程、规划旅行、学习知识等。Kimi的长文本处理能力,MiniMax的多模态能力,都可以为个人用户提供更好的服务。

AI硬件的探索与反思

AI软件的蓬勃发展,也带动了AI硬件的探索。但这条道路并非一帆风顺,早期的AI硬件产品经历了不少挫折。

Humane AI Pin是第一个引发广泛关注的AI硬件产品。这款可穿戴设备由前苹果软件工程总监和设计师联合开发,售价699美元,号称是”智能手机杀手”,支持语音指令操作,无需手机就能实现拍照、录像、问答等功能。然而,AI经常给出错误答案、响应时间过长、电池容易过热等问题,使得产品上市前就被打上”智商税”的标签。最终,惠普以”骨折价”收购了Humane的AI团队,而AI Pin则沦为废铁。

Rabbit R1是另一款备受关注的AI硬件。这款售价199美元的橙色小方块,在2024年CES展会上首次亮相,首批1万台在一天内售罄,号称要”取代所有App”。但后来,Rabbit被曝停薪数月、员工罢工,产品体验也未能达到预期。

这些失败案例给行业带来了深刻的教训。AI硬件不能只是简单地将AI技术嫁接到传统硬件上,而是需要找到真正的用户场景和需求。AI电脑性能过剩却无场景,AI耳机在降噪之外难有新价值,这些问题都说明,技术本身并不是答案,用户需求才是关键。

进入2025年,AI硬件领域出现了新的探索方向。阿里巴巴推出了首款自研AI硬件——夸克AI眼镜S1,搭载通义千问大模型,首次实现”AI走出屏幕、进入物理世界”,用户通过眼镜即可实时调用语音助手。光帆科技发布了Lightwear AI全感穿戴设备,这是一个由AI耳机、智能手表等组成的套装。深圳的Plaud Note是一款可吸附于手机背面的AI硬件,全球销量已突破100万台,年营收突破1.8亿美元。

AI眼镜和AI耳机等品类,是在原有主流硬件里加入AI功能,同时聚焦于某类用途。AI眼镜大多专注于拍照识物、拍照翻译、快速支付、实时视觉分析与语音交互、实时翻译、提词器、物体识别及声纹识别等功能。AI耳机则侧重于实时翻译、AI音效、AI降噪等。

但AI硬件也面临着用户体验的挑战。一个好的AI个人硬件应该全天触手可及,但当前流行的AI智能眼镜在搭配镜片后重量普遍失控,无法说服用户全天佩戴。这说明,AI硬件不仅需要技术创新,还需要在便携性、舒适度、实用性之间找到平衡。

从用户场景需求来看,AI硬件的价值在于能够无缝融入用户的日常生活,提供即时、便捷的AI服务。比如,在会议中通过AI眼镜实时翻译和提词,在旅行中通过AI耳机实时翻译和导航,在工作中通过AI硬件快速记录和整理信息。这些场景都需要AI硬件具备强大的感知能力、交互能力和执行能力。

“硬件购买+订阅付费”的复合模式正在展现商业潜力。用户购买硬件设备后,通过订阅服务获得持续的AI能力更新和功能扩展,这种模式既保证了硬件厂商的持续收入,也为用户提供了更好的体验。

2025年,端侧AI迎来加速发展契机,或将出现一波AI硬件创业浪潮。但与第一轮AI Pin、Rabbit R1等AI原生硬件的炒作不同,新一轮的AI硬件爆发更加注重实用性和用户需求。

技术与商业的平衡

AI创业公司面临的最大挑战之一,是如何在技术创新和商业价值之间找到平衡。纯技术驱动的公司可能难以实现商业化,而过度追求商业化的公司可能失去技术优势。

从目前的发展来看,成功的AI公司通常具备几个特点:一是明确的应用场景,二是可持续的商业模式,三是持续的技术创新能力。MiniMax通过C端产品获得收入,同时保持技术投入;快手可灵AI通过开放API和独立App实现商业化,同时持续提升视频生成质量。

对于AI硬件来说,这个平衡更加重要。硬件产品的研发成本高、周期长,一旦失败损失巨大。因此,AI硬件公司需要更加谨慎地选择切入点,找到真正有用户需求的场景,而不是盲目追求技术噱头。

2026年的预测

展望2026年,AI行业可能会出现以下几个趋势:

AI Agent将更加普及,从企业级应用向个人级应用延伸。更多用户将拥有自己的AI智能体,帮助处理日常事务。

多模态AI将成为标配,单一模态的产品将难以竞争。用户期望AI能够同时处理文本、图像、视频、音频等多种形式的内容。

AI的推理能力将大幅提升,能够处理更复杂的任务。从简单的问答到复杂的推理,AI将展现出更强的思维能力。

AI应用将更加垂直化和场景化,通用型AI和垂直型AI将并存。通用型AI提供基础能力,垂直型AI针对特定场景优化。

行业整合将继续,但不会形成垄断。AI技术的多样性和应用场景的广泛性,将保证市场的竞争活力。