哈佛商业评论:如何利用生成式人工智能技术

 
 
 
 
 
 
 

 

来源:点滴科技资讯

 

 

概括。企业领导者正在努力了解他们应该如何认真对待生成式人工智能。它已经显示出创建新内容的惊人能力,并用于编写软件、转录医生与患者的互动等。
商界领袖正在努力了解他们应该如何认真对待人工智能领域的最新现象:生成式人工智能。一方面,它已经显示出创建音乐、语音、文本、图像和视频等新内容的惊人能力,并且目前用于编写软件、转录医生与患者的互动以及允许人们与客户关系管理系统进行对话。另一方面,它远非完美:它有时会产生扭曲或完全捏造的输出,并且可能会忽视隐私和版权问题
生成式人工智能的重要性是否被夸大了?它的风险值得潜在的回报吗?公司如何找出最好的应用场景?他们的第一步应该是什么?为了提供指导,本文借鉴了我们的研究成果,包括对特定生成式人工智能项目的研究以及对该技术将如何影响整个经济中的任务和就业的广泛分析。
我们中的一位(Erik)与麻省理工学院的 Lindsey Raymond 和 Danielle Li 一起研究的一家大型企业软件公司表明,有多种方法可以既获得生成式人工智能的好处,又可以控制其风险。该公司通过在线聊天为人们提供帮助的客户服务代理面临着一个共同的挑战:新员工需要几个月的时间才能快速掌握如何回答技术问题和应对困惑的客户,但许多人在熟练之前就辞职了。该公司将生成式人工智能视为一种解决方案。它聘请了生成式人工智能初创公司 Cresta(Erik 一直为其提供建议)来实施两种人工智能。第一个是大型语言模型(LLM)——旨在用人类自己的话来理解和回应——“监听”聊天。它经过微调,可以识别在各种情况下带来良好客户服务结果的短语。但由于存在虚构的风险,或者听起来看似合理但不正确的反应,该系统还使用了一种称为上下文学习的机器学习技术,该技术从相关的用户手册和文档中得出答案。
大语言模型监控特定短语的在线聊天,当其中一个短语发生时,它会根据上下文学习系统中的信息做出响应。作为额外的保护措施,它不直接响应查询。相反,人类代理人可以自由地运用他们的常识来决定是使用还是忽略大语言模型的建议。
经过七周的试点后,该系统已向 1,500 多名客服人员推广。两个月之内,多重好处就显现出来了。每小时平均解决的问题数和客服人员可以同时处理的聊天数量均增加了近 15%;平均聊天时间减少近10%;对聊天记录的分析表明,新系统实施后,客户满意度立即提高。例如,沮丧的表情减少了,全大写打字的情况也减少了。
特别有趣的是,技能最低的工种(通常也是最新的)受益最多。例如,在引入新系统之前,速度最慢 20% 的客服人员每小时的解决率增加了 35%。生成式 AI 系统是一种快速作用的技能提升技术。它向所有员工提供了以前只能通过经验或培训获得的知识。更重要的是,员工的流动率下降了,尤其是那些经验不足六个月的员工——也许是因为当人们拥有强大的工具来帮助他们更好地完成工作时,他们更有可能留下来。
鉴于生成式人工智能有可能提高许多其他功能(实际上是任何涉及认知任务的功能)的生产力,称其为革命性的并不夸张。商业领袖应该将其视为一种类似于电力、蒸汽机和互联网的通用技术。但是,尽管这些其他技术的全部潜力需要几十年才能实现,但生成式人工智能对整个经济的绩效和竞争的影响将在短短几年内显现出来。
这是因为过去的通用技术需要大量互补的物理基础设施(电力线、新型电机和电器、重新设计的工厂等)以及新的技能和业务流程。生成式人工智能的情况并非如此。许多必要的基础设施已经就位:云、软件即服务、应用程序编程接口、应用程序商店和其他进步不断减少获取和开始使用所需的时间、精力、专业知识和费用新的信息系统。因此,公司部署几乎任何数字技术都变得越来越容易。这是 ChatGPT 用户在 60 天内从零增长到 1 亿的一个重要原因。随着微软、谷歌和其他技术提供商将生成式人工智能工具纳入其办公套件、电子邮件客户端和其他应用程序中,数十亿用户将迅速获得访问权限,成为其日常生活的一部分。
生成式人工智能也将快速部署,因为人们通过与这些系统进行交互,就像与其他人一样。这降低了某些类型工作的进入门槛(想象一下通过在日常演讲中向大模型解释您想要完成的任务来编写软件)。此外,这些系统不一定要求公司改变整个业务流程;起初它们将仅用于离散任务,这将使它们更容易采用。例如,利用技术重新设计公司与客户互动方式的各个方面是一项重大任务;使用它来向客户服务代理建议更好的聊天响应则不然。然而,随着时间的推移,生成式人工智能将为公司如何开展最重要的工作带来巨大而深刻的变化。
因此,企业领导者不应袖手旁观,等待生成式人工智能的使用如何发展。他们不能让竞争对手抢先一步。

生成式人工智能将如何影响您公司的工作?

关于将被生成人工智能取代的工作种类和数量的预测比比皆是。但实际上,考虑技术可以执行或帮助执行的认知任务会更有帮助。
我们中的一位(丹尼尔)、OpenResearch 的 Sam Manning、OpenAI 的 Tyna Eloundou 和 Pamela Mishkin 进行的研究就采用了这种方法。他们的起点是 O*NET 数据库,该数据库自 1998 年以来一直由美国政府维护和更新。O*NET 包含近 1,000 个职业,并将每个职业分解为其组成任务——通常为 20 到 30 个。例如,根据 O*NET,放射科医生有 30 项不同的任务,包括“执行或解释诊断成像程序的结果”和“为放射科患者制定治疗计划”。
研究人员在 OpenAI 选定人员的帮助下解决了两个问题:在生成式 AI 的帮助下,每项 O*NET 工作的哪些任务可以以至少两倍的速度完成,而质量不会显着下降?对于那些“公开”的任务,除了生成式人工智能之外,还至少需要一个系统才能获得生产力提升?研究团队还向 OpenAI 的 GPT-4 LLM 询问了同样的两个问题,并将其答案与人们的答案进行了比较。答案是相似的。
称生成式人工智能为革命性的,一点也不夸张。商业领袖应该将其视为一种类似于电力、蒸汽机和互联网的通用技术。
这项工作表明,80% 的美国工人至少有 10% 的任务受到生成式人工智能的冲击19% 的工人有一半以上的任务冲击。但“冲击”并不意味着这些任务将会或应该自动化。在许多情况下,生成式人工智能的最佳用途是提高人类工人的生产力或创造力,而不是取代他们。程序员就是一个很好的例子。他们已经大量使用像 GitHub Copilot 这样的大模型来编写代码初稿,但他们仍然需要纠正错误;与管理、工程和技术人员协商,明确计划的意图;培训下属;并执行许多其他不适合生成式人工智能的任务。随着大模型越来越擅长编写代码,程序员将有更多的时间和精力投入到其他任务中。(有关生成式人工智能如何帮助而不是取代工人的更多信息,请参阅“生成式人工智能如何增强人类创造力”,哈佛商业评论,2023 年 7 月至 8 月。)
领导者可以采用这种研究方法的一个版本,以了解生成式人工智能在其组织中的哪些应用可能最有效。每个董事会都应该期望其首席执行官制定可行的游戏计划。这样做的过程分为三部分。
首先,粗略地盘点一下知识型工作:你们中有多少人主要以写作为生?你们有多少名数据分析师、经理、程序员、客服代理等?
接下来,针对每个角色提出两个问题。第一个是,“担任这个职位的员工如果有一个有能力但天真的助理——一个擅长编程、写作、准备数据或总结信息但对我们公司一无所知的人,会有多大好处?”今天公开的大模型就像这样的助手。例如,他们可以编写代码,但他们不知道您的软件开发或系统集成需求是什么。他们可以创建项目计划或批评现有计划,但他们不知道您正在从事哪些项目。
第二个问题是,“担任此职位的员工如果拥有一位经验丰富的助理(在公司工作了足够长的时间,能够吸收公司的专业知识),会受益多少?”本文开头描述的软件公司不需要天真的客户服务代理;他们需要的是可靠的客户服务代理。它需要代理商知道其产品出现了哪些类型的问题,并且能够有效地与客户合作解决这些问题。这就是为什么它将面向客户的大模型与情境学习相结合。正如这个例子所示,当一家公司需要访问其特定的内部知识时,它通常必须将“现成的”生成式人工智能与另一个系统结合起来。
最后,一旦清查了公司的知识工作角色并回答了这两个问题,就可以优先考虑最有前途的生成人工智能工作。这项任务很简单:选择效益成本比最大的。要估算福利,请查看公司为每个职位支付的薪酬总额。目的不是确定要淘汰的职位;相反,它是为了寻找大幅提高生产力的机会——新的数字助理将在其中发挥最大的价值。

 
与其他数字化转型工作的情况一样,生成式人工智能项目的成本是金钱、时间和失去机会的组合——您不会追求这些项目,因为生成式人工智能具有更高的优先级。现成的 LLM 工作相对便宜且快速,而需要将生成式 AI 与另一个系统集成的项目则需要更长的时间且更昂贵(尽管与许多其他 IT 工作相比)。
目前,大多数生成式人工智能项目都专注于改进特定任务。这是合适的,因为存在很多以这种方式使用该技术的机会。但随着它的成熟和公司积累经验,生成式人工智能的工作将涵盖整个业务流程,而不是单个任务。例如,它们将用于改变公司与客户互动的各个方面,而不仅仅是改善在线故障排除聊天。生成式人工智能仍然是一项新兴技术,我们无法准确预测它将如何在未来几年发挥作用。但我们可以自信地预测,它将在成功公司的数字战略中发挥重要作用。

解决“闲聊”问题

考虑到生成式人工智能有望在不久的将来对各种企业产生重大影响,对其最大缺点之一——它可以伪造信息——的反应不应该是回避这项技术。相反,它应该是防范这种危险。以下是实现此目的的方法。

建立多层次的大模型或将一个系统与另一个系统相结合。

建立大模型的公司很清楚这些系统会相互混淆,并且正在研究如何最大限度地减少问题。一种技术是识别用户的请求何时不适合大模型的标准方法,即根据受过训练的所有单词和句子之间的关联来制定答案。对于此类请求,系统采取不同的策略。例如,为了响应具有单一正确答案的查询,Google 的 Bard 现在实际上编写了一种算法来生成该答案,并将其报告给用户(以及代码)。例如,当被要求反转单词“Lollipop”时,它编写了几行代码来完成任务并返回“popilloL”。如上所述,改善客户服务的项目聘请了大模型来监控在线聊天并了解客户问题,但上下文学习系统决定了其响应。

用人类来补充大模型

用户应该对大模型的输出持保留态度。例如,使用大模型为网站或社交媒体活动生成文案的营销人员可以查看系统提供的内容并快速评估其是否达到目标。软件工程师可以查看生成式人工智能生成的代码是否运行并完成所需的任务。工程师们表示,即使没有,它使用的方法也可以帮助他们解决手头的任务。使用大模型来记录和总结同意患者的就诊的医生报告说,记录这些就诊所需的时间大大减少。一位医生告诉《纽约时报》的史蒂夫·洛尔(Steve Lohr ),大模型将他每天花在这项任务上的时间从两个小时缩短到了 20 分钟左右。医生仍然需要查看人工智能生成的摘要,但他们不再需要同时与患者互动并尝试记录互动记录。因此,另一位医生告诉 Lohr:“作为一名医生,人工智能让我能够 100% 为患者服务。” 同样,在客户服务示例中,座席自己的判断审查了人工智能答案的合理性。

不要使用 LLM。

有些任务对于生成式人工智能来说风险太大,根本无法参与。例如,一个系统在 90% 的情况下都能准确开出正确的药物,但在十分之一的情况下会出现混淆,单独使用是不安全的。它也不会在任何时候拯救医生,因为他们必须仔细检查其所有建议,然后再将其传递给患者。即使对于安全不是问题的任务,大模型的闲聊倾向也可以排除它们。当我们中的一个人(安迪)为他最近的书整理尾注时,他很高兴地得知 ChatGPT 可以获取书籍、文章和网站的列表,并为它们生成一组格式正确的参考文献。但在检查其输出后,他沮丧地发现一些参考文献是错误的。当他向它提供一篇文章的 URL 时,它有时会生成一个带有看似合理但虚构的标题的引用,给出错误的发布日期,或者将文章归因于错误的作者。他发现手动创建所有参考文献比检查大模型生成的参考文献的各个方面更快。

减少侵犯隐私、知识产权问题和偏见

如果您使用机密报告来帮助训练生成式人工智能系统,则该报告的部分内容可能会在稍后出现在对不应访问该信息的人的提示的响应中。因此,明确您正在使用的任何生成人工智能的隐私政策非常重要。好消息是和严格的隐私并非完全不相容。例如,梅奥诊所 (Mayo Clinic) 宣布努力部署内部大模型,帮助其医疗保健提供者跨来源搜索信息,包括网页、内部文档和患者记录。如果医生要求“显示所有患者今天的测试结果”,大模型将向电子健康记录系统生成查询并显示结果。为了使系统符合健康保险流通与责任法案 (HIPAA) 关于患者信息隐私和机密性的要求,梅奥将指定其员工有权访问受保护的健康信息。
针对生成式人工智能最大的缺点之一——它可以伪造信息——的应对措施不应该是回避该技术,而应该是防范这种危险。
除了虚构和隐私问题之外,一些大模型还面临侵犯知识产权 (IP) 的风险。ChatGPT 接受过大量文本的训练,其中一些文本仍受版权或其他知识产权保护。Stable Diffusion 和 Midjourney 等新的图像生成人工智能系统也是如此,这两个系统都因侵犯版权而被起诉。如果公司使用的生成式人工智能生成的图像被发现违反知识产权法,公司可能会承担法律责任(请参阅“生成式人工智能存在知识产权问题”,hbr.org,2023 年 4 月 7 日)。因此,许多组织在涉足生成人工智能之前都在等待法庭案件如何裁决。但为了鼓励立即采用,这些系统的一些创建者正在保护客户免受知识产权风险。例如,Adobe 宣布将赔偿其图像生成人工智能 Firefly(未接受受版权图像训练)的用户免遭法律索赔。
与大多数其他类型的人工智能一样,生成式人工智能的最后一个问题是偏见。“垃圾进,垃圾出”是计算机时代最古老的格言之一,现在比以往任何时候都更是如此。如果机器学习系统接受有偏见的数据训练,它生成的结果将反映这种偏见。例如,如果一家公司只雇用大学毕业生作为程序员,并利用其工作经历来训练一个有助于做出招聘决策的系统,那么该系统很可能会拒绝没有上过大学或没有完成大学学业的高素质程序员。因此,在使用生成式人工智能时要保持警惕。问问自己,“我们是否希望这个系统提供的结果比它所训练的数据偏差更小?”如果答案是肯定的,请重新考虑该项目。

准备好进行实验

在过去的几十年里,领先的组织已经采用敏捷方法来成功开发和采用新的信息系统(参见“拥抱敏捷”,HBR,2016 年 5 月)。他们通过反复试验而不是广泛的计划来管理他们的努力。他们将项目分解为短周期,可以在一两周内完成,有时甚至更短。项目团队成员在开始下一个周期之前跟踪进度并反思他们所学到的知识。事实上,整个周期通常都是一个实验:目标并不是构建某种东西,而是检验假设并获得理解。
生成式人工智能非常适合这种迭代方法。它的优点和缺点与任何早期系统都不同。您必须弄清楚如何表达提示才能获得最有用的答复。您还经常需要告诉系统重试并给出如何做得更好的注释。要求它扮演一个角色或指导它改变其语气或风格通常是有效的。以这种方式与法学硕士进行互动被称为“即时工程”——一门年轻的学科,与其说是科学,不如说是一门年轻的学科。弄清楚如何防止胡言乱语也是如此。开始学习这些艺术的最佳方法是找到一个具有有吸引力的效益成本比和低风险的项目并开始尝试。同样的方法应该用于更雄心勃勃的努力来与生成人工智能合作,例如将大模型与其他技术相结合。快速迭代是学习和进步的最佳方式。组织越快地完成观察形势、指导行动、决定做什么、然后采取行动的重复 OODA 循环,它学到的东西就越多,生产力的提高和其他好处就越快出现。

. . .

生成式人工智能有望对企业的运营方式产生重大影响——而且是在几年内,而不是几十年后。它的捏造倾向及其隐私、知识产权和偏见风险都是合理的担忧,但它们是可以控制的。领导人不能采取观望态度。他们现在应该开始探索该技术的潜力。

 

 

 
 
 
 
 
 

免责声明:本号所载内容均为原创、投稿、授权转载或网络公开资料搜集整理,仅供读者交流学习使用,版权归原作者所有,且仅代表作者个人观点,与本号立场无关。若所引用的图片、数据、文字等来源标注有误或涉及侵权,烦请及时联系删除。

欢迎扫码关注

 

 

 

 

 

首页    行业动态    科技前沿    哈佛商业评论:如何利用生成式人工智能技术
创建时间:2023-11-16 09:05
浏览量:0