麦肯锡:《超级智能体:赋能人们释放人工智能的全部潜力》
以下文章来源于欧米伽未来研究所2025,作者欧米伽未来研究所
“欧米伽未来研究所”关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。(点击这里查看欧米伽理论)
麦肯锡的《超级智能体:赋能人们释放人工智能的全部潜力》报告是一份深入剖析企业在人工智能时代转型路径的研究成果。该报告基于对3,613名员工和238名C级高管的全面调查,探讨了企业在AI采用过程中的技术准备度和业务准备度,旨在帮助企业领导者理解如何释放AI的全部潜力,同时平衡速度与安全的关系。
报告前言
几乎所有公司都在投资人工智能,但只有 1% 的公司认为自己在人工智能应用方面已经成熟。我们的研究发现,推广人工智能的最大障碍并非员工 —— 他们已经做好了准备 —— 而是领导者,他们的引领速度不够快。
人工智能已进入职场,其变革潜力堪比 19 世纪工业革命时期的蒸汽机。随着 Anthropic、Cohere、谷歌、Meta、Mistral、OpenAI 等公司开发出强大且功能多样的大语言模型(LLMs),我们进入了一个新的信息技术时代。麦肯锡的研究表明,从企业应用案例来看,人工智能在长期内有望带来 4.4 万亿美元的额外生产力增长。
但挑战也随之而来:人工智能的长期潜力巨大,但短期回报尚不明确。在未来三年,92% 的公司计划增加人工智能投资。然而,尽管几乎所有公司都在投资人工智能,但只有 1% 的领导者认为他们公司在部署方面 “成熟”,这意味着人工智能已完全融入工作流程并带来显著的业务成果。关键问题在于企业领导者如何配置资金,引导他们的组织更接近人工智能成熟阶段。
本研究报告受里德・霍夫曼(Reid Hoffman)所著的《超级智能体:我们的人工智能未来可能会怎样》一书启发,提出了一个类似的问题:公司如何利用人工智能来增强人类能动性,释放职场新的创造力和生产力水平?人工智能能够推动巨大的积极变革,也可能带来颠覆性变化。这种转变需要一些时间,但领导者不能因此而退缩。相反,他们现在必须大胆推进,以免在未来失去竞争力。重大经济和技术变革的历史表明,这样的时刻往往能决定公司的兴衰。40 多年前,互联网诞生。从那时起,包括 Alphabet、亚马逊、苹果、Meta 和微软在内的公司市值达到了万亿美元。更深远的是,互联网改变了工作模式和信息获取方式。如今的人工智能就像多年前的互联网:对企业领导者来说,风险不在于目标定得太大,而在于定得太小。
报告简介
报告开篇即指出一个核心观点:人工智能已经进入工作场所,其潜在变革力量堪比19世纪工业革命中的蒸汽机。麦肯锡的研究估计,企业应用AI的长期生产力增长潜力高达4.4万亿美元。然而,尽管长期潜力巨大,短期回报却不明确。调查显示,92%的企业计划在未来三年增加AI投资,但仅有1%的领导者认为他们的公司在AI部署方面已达到"成熟"阶段——即AI完全集成到工作流程中并产生实质性业务成果。
报告的核心发现之一是:员工比领导者想象的更加准备好拥抱AI。实际上,C级领导者对员工使用生成式AI的程度估计远低于实际情况。领导者估计只有4%的员工在日常工作中将生成式AI用于至少30%的任务,而事实上这一比例是三倍多,达到13%。更令人惊讶的是,有47%的员工相信他们会在一年内使用生成式AI完成超过30%的日常任务,而只有20%的领导者持同样观点。
员工们不仅已经开始使用AI,而且渴望获得更多培训和支持。近一半的员工表示正式培训是提升AI采用率的最佳方式,他们也希望能够参与AI工具的试点项目,并认为激励机制如财务奖励和认可能提高使用率。然而,超过五分之一的员工报告他们获得的支持微乎其微或根本没有。这表明企业领导者需要增加对员工AI能力培养的投入。
报告特别指出了千禧一代在AI变革中的关键角色。研究发现,千禧一代比其他年龄组更熟悉生成式AI工具,并且更有可能预期工作流程在一年内发生变化。由于许多千禧一代已经担任管理职位,他们可以支持团队成员更熟练地使用AI。数据显示,三分之二的管理者每周至少接收一次团队关于如何使用AI工具的问题,类似比例的管理者会向团队推荐AI工具来解决问题。
在速度与安全的平衡方面,报告揭示了一个有趣的悖论:虽然47%的C级高管认为他们的公司开发生成式AI工具的速度太慢,但员工和领导者都高度关注AI的安全性和可信度。约一半的员工担心AI的不准确性和网络安全风险。值得注意的是,员工对自己公司正确部署AI的信任度比对其他机构高出1.3倍。71%的员工信任雇主以负责任、安全和符合道德的方式部署AI工具,这一比例高于他们对大型科技公司(61%)、初创公司(51%)甚至大学(67%)的信任度。
麦肯锡的报告强调,企业要想在AI竞赛中脱颖而出,领导者必须设定大胆的目标。随着AI热潮逐渐消退,企业应该更加关注能够赋能员工日常工作的实用应用,这些应用可以创造竞争壁垒并产生可衡量的投资回报。报告分析了超过250个AI应用案例,发现大多数公司仍处于AI之旅的早期阶段,大多数AI应用仍是局部性的试点项目。然而,创造变革性价值的AI应用需要更大的勇气和远见,如制造业中的机器人技术、可再生能源中的预测AI、生命科学中的药物开发以及教育领域的个性化AI辅导。
对于企业领导者,报告特别强调几个关键方面需要关注。首先是适应性——AI技术进步如此迅速,组织必须快速采用新的最佳实践才能保持竞争力;其次是联邦治理模型——在赋予团队开发新AI工具自主权的同时,集中控制风险;第三是预算灵活性——鉴于技术的快速发展,企业应保持灵活的预算以优化AI部署的成本和性能;第四是AI基准——这些工具可作为定量评估不同AI模型、算法和系统的强大手段;第五是弥补AI特定技能差距——46%的领导者认为工作队伍中的技能差距是AI采用的重大障碍;最后是以人为本——为确保公平和公正,企业领导者应在AI开发过程中尽早并经常纳入多元化视角,并与团队保持透明沟通。
报告还探讨了AI在个人生活中的潜力。研究分析了77项个人活动中AI的潜在影响,发现虽然人们对自动化某些个人活动如休闲、睡眠和健身的欲望有限,但数据显示AI与其他技术结合可以在家务或劳动密集型任务方面提供显著帮助。到2024年,研究已确定每天约有一小时的此类活动具有技术自动化潜力。到2030年,随着用例的扩展和AI安全性的持续改进,自动化潜力可能增加到每天三小时。
麦肯锡的报告最终得出结论:员工已经准备好迎接AI。成功的最大障碍是领导力。随着AI热潮消退,领导者需要关注实际应用,这些应用不仅能增强现有工作流程,还可以成为解决更大业务和人类挑战的催化剂。早期的AI实验主要关注通过狭窄用例证明技术可行性,比如自动化常规任务。现在视野已经转变:AI有望释放前所未有的创新并推动产生真正价值的系统性变革。
报告以一个提问结束:领导者如何在颠覆性变革中定义战略优先事项并有效引导公司?员工如何确保他们为即将到来的AI转型做好准备?这些问题将塑造公司的AI未来。报告建议企业采用自下而上和自上而下相结合的方法来推动AI采用:自下而上的行动帮助员工通过黑客马拉松和学习会议等举措试验AI工具;自上而下的技术则将高管聚集在一起,彻底重新思考AI如何改善欺诈管理、客户体验和产品测试等主要流程。
总的来说,麦肯锡的这份报告展现了一个清晰的信息:AI不仅仅是一种提高生产力的工具,而是有潜力成为变革性超能力的合作伙伴,增强人类的能动性。那些能够用可能性的想象替代对不确定性的恐惧的领导者,将发现AI的新应用不仅能优化现有工作流程,还能成为解决更大业务和人类挑战的催化剂。这份报告为企业领导者提供了一个全面的框架,帮助他们理解如何在AI时代引领企业变革,并最终释放AI的全部潜力。
21世纪AI如同蒸汽机般强大的创新
提示:这部分内容是报告的第一章,主要综述了21世纪以来AI的快速发展,为企业未来可能的变革奠定基础。
“科学发现和技术创新是人类进步大教堂的基石。”—— 里德・霍夫曼(Reid Hoffman),领英(LinkedIn)和 Inflection AI 联合创始人、格雷洛克合伙公司(Greylock Partners)合伙人、《超级智能体:我们的人工智能未来可能会怎样》作者
想象一个世界,机器不仅能从事体力劳动,还能思考、学习并自主决策。在这个世界里,人类也参与其中,人与机器共同协作,形成一种 “超级智能体” 状态,提升个人生产力和创造力(见 “人工智能超级智能体” 侧边栏)。这就是人工智能的变革潜力,这项技术的潜在影响甚至可能超过过去从印刷机到汽车等最重大的创新。人工智能不仅能实现任务自动化,还能进一步实现认知功能自动化。与以往任何发明不同,人工智能驱动的软件能够适应、规划、引导甚至做出决策。这就是为什么人工智能可以成为推动经济实现前所未有的增长,以及几乎在生活各个方面引发社会变革的催化剂。它将重塑我们与技术以及彼此之间的互动方式。
许多突破性技术,包括互联网、智能手机和云计算,已经改变了我们的生活和工作方式。人工智能从这些发明中脱颖而出,因为它不仅提供信息获取途径,还能进行总结、编码、推理、对话和做出选择。人工智能可以降低技能门槛,帮助更多人在任何语言环境下、任何时间,更熟练地掌握更多领域的知识。人工智能有潜力改变人们获取和使用知识的方式,从而更高效地解决问题,推动惠及每个人的创新。
在过去两年里,人工智能取得了飞速发展,由于成本降低和功能获取更加便捷,企业层面的应用也在加速。许多引人注目的人工智能创新不断涌现。例如,我们见证了上下文窗口(即大语言模型的短期记忆)的迅速扩展。上下文窗口越大,大语言模型一次能够处理的信息就越多。举例来说,谷歌的 Gemini 1.5 在 2024 年 2 月能够处理 100 万个标记,而同年 6 月推出的 Gemini 1.5 Pro 则可以处理 200 万个标记。总体而言,我们看到有五项重大创新正在推动人工智能的下一波影响:增强的智能和推理能力、智能体人工智能、多模态、改进的硬件创新和计算能力,以及更高的透明度。
人工智能超级智能体
人工智能将对人类产生何种影响?里德・霍夫曼和格雷格・比托所著的《超级智能体:我们的人工智能未来可能会怎样》(Authors Equity,2025 年 1 月)一书探讨了这个问题。该书强调了人工智能如何能够增强人类能动性,提升我们的潜力。它设想了一种以人类为主导、面向未来的人工智能发展方式。
“超级智能体” 这一术语由霍夫曼提出,描述了一种状态:个人在人工智能的赋能下,极大地激发创造力、提高生产力,并产生积极影响。即使那些没有直接接触人工智能的人,也能从人工智能对知识、效率和创新的广泛影响中受益。
人工智能是一系列变革性超级工具中的最新成员,包括蒸汽机、互联网和智能手机,这些工具通过增强人类能力重塑了我们的世界。与之前的工具一样,人工智能可以实现知识普及并实现任务自动化,前提是人类能够安全、公平地开发和部署它。
智能和推理能力正在提升
人工智能正变得越来越智能。一个指标是大语言模型在标准化测试中的表现。OpenAI 在 2022 年推出的 Chat GPT - 3.5 在高中水平考试中表现出色(例如,在 SAT 数学考试中得分处于第 70 百分位,在 SAT 语言考试中得分处于第 87 百分位)。然而,它在更广泛的推理方面常常遇到困难。如今的模型智能水平已接近拥有高等学位的人。GPT - 4 能够轻松通过美国律师资格统一考试,成绩排名在前 10%,并且在美国医学执照考试中,它能正确回答 90% 的问题。
推理能力的出现代表着人工智能的又一次重大飞跃。推理增强了人工智能进行复杂决策的能力,使模型能够超越基本理解,实现更细致的理解,并具备制定逐步计划以实现目标的能力。对于企业来说,这意味着他们可以微调推理模型,并将其与特定领域的知识相结合,从而更准确地提供可操作的见解。像 OpenAI 的 o1 或谷歌的 Gemini 2.0 Flash 思维模式等模型,能够在回应中进行推理,这为用户提供了一个类似人类思维的伙伴,而不仅仅是一个信息检索和合成引擎。
智能体人工智能正在自主行动
推理能力的不断提升,使模型能够自主采取行动,并在工作流程中完成复杂任务。这是一个意义深远的进步。例如,在 2023 年,一个人工智能机器人可以通过合成和总结大量数据(包括语音消息、文本和技术规范)来支持呼叫中心代表,为客户查询提供建议回复。到 2025 年,一个人工智能智能体可以与客户进行对话,并在之后规划其行动,比如处理支付、检查欺诈行为和完成发货操作。
“我一直认为人工智能是人类正在研究的最具深远意义的技术…… 比火、电或我们过去所做的任何事情都更具深远意义。”—— 桑达尔・皮查伊(Sundar Pichai),Alphabet 首席执行官
“人工智能,就像大多数变革性技术一样,是逐渐发展的,然后突然到来。”—— 里德・霍夫曼(Reid Hoffman),领英(LinkedIn)和 Inflection AI 联合创始人、格雷洛克合伙公司(Greylock Partners)合伙人、《超级智能机构:我们的人工智能未来可能会怎样》作者
软件公司正在将智能体人工智能能力嵌入其核心产品中。例如,Salesforce 的 Agentforce 是其现有平台上的一个新层级,使用户能够轻松构建和部署自主人工智能智能体,以处理跨工作流程的复杂任务,如模拟产品发布和协调营销活动。Salesforce 联合创始人、董事长兼首席执行官马克・贝尼奥夫(Marc Benioff)将其描述为提供了一支 “数字劳动力”,人类和自动化智能体共同协作以实现客户目标。
多模态、AI硬件与AI透明性
如今的人工智能模型正朝着能够更先进、更多样化地处理文本、音频和视频数据的方向发展。在过去两年里,我们看到了每种模态质量的提升。例如,谷歌的 Gemini Live 提高了音频质量并降低了延迟,现在能够进行带有情感细微差别和表现力的类人对话。此外,OpenAI 的 Sora 展示了将文本转换为视频的能力。
硬件创新以及由此带来的计算能力提升,不断增强人工智能的性能。专用芯片使模型能够更快、更大规模地运行,并且功能更加多样化。企业现在可以采用需要高处理能力的人工智能解决方案,实现实时应用和可扩展性。例如,一家电子商务公司可以通过部署由人工智能驱动的聊天机器人显著改善客户服务,这些聊天机器人利用先进的图形处理单元(GPU)和张量处理单元(TPU)。通过使用分布式云计算,该公司可以在流量高峰期确保最佳性能。通过集成边缘硬件,公司可以部署能够分析受损产品照片的模型,从而更准确地处理保险理赔。
人工智能的风险正在逐渐降低,但它仍然缺乏更高的透明度和可解释性。这两者对于提高人工智能安全性、减少潜在偏差至关重要,而这对于企业大规模部署人工智能来说是必不可少的。虽然还有很长的路要走,但新的模型和迭代正在迅速改进。斯坦福大学基础模型研究中心(CRFM)报告称,模型性能有了显著提升。其透明度指数(采用 1 - 100 的评分标准)显示,在 2023 年 10 月至 2024 年 5 月期间,Anthropic 的透明度得分提高了 15 分,达到 51 分,亚马逊的得分增长了两倍多,达到 41 分。
除了大语言模型,其他形式的人工智能和机器学习(ML)也在提高可解释性,使得支持重大决策(例如信用风险评估)的模型输出能够追溯到提供信息的数据。通过这种方式,关键系统可以几乎持续地进行测试和监测,以发现偏差,以及因模型漂移和数据输入变化(即使是在部署前校准良好的系统中也会发生)而产生的其他常见危害。
所有这些对于检测错误、确保符合法规和公司政策至关重要。公司已经改进了解释性实践,并建立了必要的制衡机制,但它们必须不断发展,以跟上不断提升的模型能力。