一、现象:智能体浪潮来袭
不知道你有没有想过,要是有个超级助手,能独立思考、规划并执行复杂任务,直接给你交付完整成果,那该多好?如今,这样的场景正逐渐成为现实。在 2025 年 3 月 6 日凌晨,科技圈被一个名为 Manus的产品刷屏了,很多人彻夜蹲守邀请码,二手平台上一个邀请码甚至被炒至 5 万元。这是来自中国创业公司 Monica发布的全球首款通用型 AI Agent 产品。从官网展示的案例来看,它能操作电脑完成报告撰写、表格制作等工作,最后导出符合用户需求的产品。
除了 Manus,国内还有不少智能体产品和框架崭露头角。2025 年 4 月,房地产行业全国首个垂直领域 AI 智能平台——克而瑞 AI Agent 公开内测,能为房地产从业者提供专业工作成果。
二、矛盾:理想与现实的差距
乐观视角
从积极的方面看,智能体的发展前景十分广阔。金沙江创投主管合伙人朱啸虎表示,过去 6 个月,中国涌现出大量创业公司,每周环比增长率超 10%,月环比增长率超 20%,增长速度堪比当年团购早期。多数机构认为,AI 应用爆发将至,随着开源模型、算力成本不断降低,国内头部模型与海外差距日益缩小。海通证券研报指出,Manus 的发布再次印证我国 AI 研发能力已达世界顶尖水平,AI Agent 目前已达到爆发的临界点,2025 年有望成为真正的 AI Agent 商业爆发元年。
悲观视角
然而,也有人对此持谨慎态度。朱啸虎认为所有的 AI 应用都是套壳应用,关键是如何建立长期壁垒,而所有 AI 应用的长期壁垒都在技术之外,要在非 AI 能力上建立壁垒。也就是说,目前的智能体产品可能在技术上存在一定的局限性,难以形成真正的核心竞争力。
三、解构:智能体的多维度剖析
技术维度
从技术原理上看,现在的 AI Agent 基本都是基于大语言模型的(LLM Based Agent)。2023 年 7 月,OpenAI的翁丽莲发表的博文中介绍的基于大语言模型的 AI Agent 技术架构,包括基础规划、工具使用等模块,再加上大语言模型共四个模块,通过使用工具最后采取行动。复旦大学 NLP 团队认为 AI Agent 主要分为感知、规划和行动三部分,感知后开始规划,做出决策,然后行动。
从算法效率来讲,以 Manus 为例,它在GAIA 基准测试中取得了 SOTA(State-of-the-Art)的成绩,显示其性能超越 Open AI 的同层次大模型。但在实际应用中,不同的智能体产品在处理复杂任务时的算法效率可能存在差异。
工程约束方面,智能体的开发需要考虑数据存储、网页抓取等问题。在打造商用 AI Agent 时,需要进行需求梳理、软件选型、提示工程、数据库构建、UI 界面设计、测试评估和部署发布等一系列步骤。
哲学维度
从认识论基础来看,智能体的自主性、持续性和适应性挑战了传统的人机交互观念。传统的 AI 系统更多是被动响应,而智能体能够主动感知环境、制定决策并采取行动。但这也引发了伦理困境,比如智能体的决策过程可能不透明,当出现错误决策时,责任难以界定。
经济维度
商业价值上,智能体在多个领域展现出巨大潜力。在房地产领域,克而瑞 AI Agent 能为从业者提供专业报告、文章等,提高工作效率。在教育、医疗、科研等领域,智能体也有广阔的应用前景。
市场渗透率方面,目前虽然有不少创业公司涌入,但整体市场还处于发展阶段。据相关报道,国内智能体产品的市场规模还相对较小,但增长速度较快。
替代成本上,企业要引入智能体产品或框架,需要考虑软件购买成本、数据迁移成本、员工培训成本等。对于一些小型企业来说,这些成本可能是一个不小的负担。
时间维度
历史演进上,早期的 AI 依靠固定规则,后来借助机器学习处理数据,如今则通过大模型实现自主决策与行动,成为“会思考的工具”。2023 年 3 月 AutoGPT 横空出世,人们开始接触 AI Agent。
现状分析来看,国内已经有不少企业和产品在智能体领域进行探索,如 Monica 的 Manus、克而瑞 AI Agent 等。同时,赛迪顾问评选出 2025 年中国大模型 20 强企业,这些企业在智能体技术研发和应用方面也有一定的实力。
趋势预测方面,随着技术的不断进步和市场需求的增加,智能体有望在更多领域得到应用,市场规模也将不断扩大。但同时也需要解决技术、伦理、经济等方面的问题。
系统维度
社会影响上,智能体的出现可能会改变人们的工作和生活方式。在工作中,它可以提高工作效率,减轻人们的负担;在生活中,它可以为人们提供更加个性化的服务。但也可能会导致一些人失业,尤其是一些重复性、规律性的工作岗位。
生态位关系上,智能体与其他 AI 技术、传统软件等存在竞争与合作的关系。它可以与其他技术结合,形成更加完善的解决方案。
涌现特性方面,当大量智能体相互协作时,可能会产生一些新的特性和功能,比如更高效的问题解决能力、更精准的决策等。
四、整合:国内智能体产品与框架盘点
产品
- Manus:全球首款通用型 AI Agent 产品,性能强大,能独立完成复杂任务。
- 克而瑞 AI Agent:专注于房地产垂直领域,为从业者提供专业工作成果。
- 小美同学:新开普推出的智慧校园智能体服务 AI 产品。
- 如意 AI 导购智能体:返利科技在华为鸿蒙系统发布的“返利”APP 中包含的功能。
框架
目前关于国内具体的智能体框架信息相对较少,但在打造商用 AI Agent 时,可选择的软件有 Coze、Dify、LangGraph 等。
五、预测:未来之路
未来,国内智能体市场有望迎来快速发展。随着技术的不断成熟,智能体的性能将不断提升,应用领域也将不断拓展。但同时,也需要关注技术伦理、数据安全等问题。政府和企业需要加强合作,制定相关的政策和规范,引导智能体市场健康发展。
认知校验点:你可以思考一下,如果智能体在某个关键领域(如医疗诊断)出现错误决策,应该由谁来承担责任?
为了让大家更及时了解智能体领域的学术研究动态,下面为你介绍 arXiv 上最新发布的 10 篇与人工智能(cs.AI)相关的论文:
-
《GENMO: A GENeralist Model for Human MOtion》:传统的人体运动建模将运动生成和估计分为不同任务,使用专门的模型。本文提出了 GENMO,一个统一的人体运动通用模型,将运动估计和生成在一个框架中结合起来。通过将运动估计重新表述为受限运动生成,并利用回归和扩散之间的协同作用,实现了准确的全局运动估计和多样化的运动生成。论文链接:http://arxiv.org/pdf/2505.01425v1
-
《SIME: Enhancing Policy Self-Improvement with Modal-level Exploration》:机器人系统的自我改进面临挑战,因为机器人在交互中往往重复现有能力,难以生成新的有价值的数据。本文提出了模态级探索和数据选择的方法,通过在策略执行过程中引入模态级探索机制,使机器人产生更多样化和多模态的交互,并选择最有价值的试验和高质量的片段进行学习。论文链接:http://arxiv.org/pdf/2505.01396v1
-
《Multimodal Doctor-in-the-Loop: A Clinically-Guided Explainable Framework for Predicting Pathological Response in Non-Small Cell Lung Cancer》:该研究提出了一种结合多模态深度学习和可解释人工智能技术的新方法,用于预测非小细胞肺癌患者在新辅助治疗后的病理反应。通过引入中间融合策略和将临床医生的领域知识嵌入到训练过程中,提高了预测的准确性和可解释性。论文链接:http://arxiv.org/pdf/2505.01390v1
-
《FalconWing: An Open-Source Platform for Ultra-Light Fixed-Wing Aircraft Research》:介绍了 FalconWing,一个用于自主研究的开源超轻型固定翼平台。通过开发和部署基于视觉的自主着陆控制策略,展示了该平台的能力。采用了新颖的从真实到模拟再到真实的学习方法,在硬件平台上实现了 80%的基于视觉的自主着陆成功率。论文链接:http://arxiv.org/pdf/2505.01383v1
-
《Evaluating Explanations: An Explanatory Virtues Framework for Mechanistic Interpretability – The Strange Science Part I.ii》:机械可解释性旨在通过因果解释来理解神经网络,但缺乏通用的评估解释的方法。本文引入了一个多元的解释美德框架,从科学哲学的四个视角系统地评估和改进解释。发现紧凑证明考虑了许多解释美德,是一种有前途的方法。论文链接:http://arxiv.org/pdf/2505.01372v1
-
《Differentiable Nonlinear Model Predictive Control》:讨论了使用隐函数定理和内点法处理的平滑最优性条件来计算一般非线性规划的解灵敏度。详细介绍了在顺序二次规划方法中进行灵敏度计算的过程,并提供了一个高效的开源实现,在一般最优控制问题上实现了比现有求解器 mpc.pytorch 超过 3 倍的加速。论文链接:http://arxiv.org/pdf/2505.01353v1
-
《BalancEdit: Dynamically Balancing the Generality-Locality Trade-off in Multi-modal Model Editing》:大型多模态模型随着时间推移会过时,传统的微调方法因模型规模和复杂性而不实用。本文引入了多模态模型编辑中的通用性 - 局部性权衡概念,开发了新的模型编辑数据集 OKEDIT,并提出了 BalancEdit 方法,动态平衡通用性和局部性。论文链接:http://arxiv.org/pdf/2505.01343v1
-
《Constrained Network Adversarial Attacks: Validity, Robustness, and Transferability》:机器学习在网络入侵检测系统中取得了进展,但模型容易受到对抗攻击。现有对抗攻击方法存在违反特定领域约束的问题,导致大量对抗示例无效。本文强调了在评估和设计安全关键的物联网和网络应用的机器学习/深度学习模型时,考虑领域约束和模型架构的重要性。论文链接:http://arxiv.org/pdf/2505.01328v1
-
《Helping Large Language Models Protect Themselves: An Enhanced Filtering and Summarization System》:大语言模型容易受到对抗攻击、操纵性提示和恶意输入的影响。本文提出了一种无需重新训练或微调的防御范式,通过提示过滤模块和总结模块,使大语言模型能够识别、过滤和防御对抗或恶意输入。实验结果表明,该方法在识别有害模式方面有 98.71%的成功率。论文链接:http://arxiv.org/pdf/2505.01315v2
-
《Enhancing SPARQL Query Rewriting for Complex Ontology Alignments》:SPARQL 查询重写是在链接数据网络中统一查询异构本体的基本机制,但本体对齐的复杂性和 SPARQL 复杂的语法给这一过程带来了挑战。本文提出了一种基于自然语言表达的用户需求,自动将 SPARQL 查询从源本体重写到目标本体的创新方法,能够有效处理复杂的对齐。论文链接:http://arxiv.org/pdf/2505.01309v1
这些论文涵盖了人体运动建模、机器人自我改进、医疗预测、飞行器研究、模型可解释性、控制理论、多模态模型编辑、网络安全、大语言模型防御和本体查询等多个领域,反映了人工智能领域的前沿研究方向。如果你对其中某个主题感兴趣,可以点击链接查看论文详情。