欧盟发布关于人工智能系统定义的法律调整范围指南

来源:清华大学智能法治研究院
欧洲人工智能法案下人工智能系统定义的指南翻译
一、指南的目的
(1)《欧洲人工智能法》(Regulation (EU) 2024/1689)于2024年8月1日生效。该法案为在欧盟内开发、投放市场、投入使用和使用人工智能(AI)制定了统一规则。其目标是促进AI的创新与采用,同时确保欧盟内健康、安全及基本权利(包括民主和法治)的高水平保护。
(2)《欧洲人工智能法》并不适用于所有系统,而仅适用于符合该法案第3(1)条中“AI系统”定义的系统。因此,AI系统的定义是理解《欧洲人工智能法》适用范围的关键。
(3)根据《欧洲人工智能法》第96(1)(f)条,委员会需制定关于该法案第3(1)条中AI系统定义应用的指南。通过发布这些指南,委员会旨在帮助提供者及其他相关人员(包括市场和机构利益相关者)确定一个系统是否构成《欧洲人工智能法》意义上的AI系统,从而促进该法案的有效应用和执行。
(4)AI系统的定义于2025年2月2日与其他条款(特别是《欧洲人工智能法》第一章和第二章中的条款,如第5条关于禁止的AI实践)一同生效。由于AI系统的定义对于理解《欧洲人工智能法》的范围(包括禁止的实践)至关重要,因此本指南与委员会关于禁止的人工智能实践指南同时发布。
(5)本指南考虑了利益相关者咨询和欧洲人工智能委员会咨询的结果。
(6)考虑到AI系统的多样性,本指南不可能提供所有潜在AI系统的详尽列表。这与《欧洲人工智能法》第12条相一致,该条明确“AI系统”的概念应明确界定,同时“提供灵活性以适应该领域快速的技术发展”。AI系统的定义不应机械地应用;每个系统都必须根据其具体特点进行评估。
(7)本指南不具有约束力。对《欧洲人工智能法》的任何权威解释最终只能由欧洲联盟法院(CJEU)作出。
二、AI系统定义的目标和主要要素
(8)《欧洲人工智能法》第3(1)条将AI系统定义为:“指一种基于机器的系统,旨在以不同程度的自主性运行,并在部署后可能表现出适应性,且为明确或隐含的目标,从其所接收的输入中推断出如何生成如预测、内容、建议或决策等输出,这些输出能够影响物理或虚拟环境。”
(9)该定义包含七个主要要素:(1)基于机器的系统;(2)旨在以不同程度的自主性运行;(3)在部署后可能表现出适应性;(4)为明确或隐含的目标;(5)从其所接收的输入中推断出如何生成输出;(6)如预测、内容、建议或决策等输出;(7)这些输出能够影响物理或虚拟环境。
(10)AI系统的定义采用了一种基于生命周期的视角,涵盖了两个主要阶段:系统的预部署或“构建”阶段和系统的后部署或“使用”阶段。该定义中列出的七个要素并不要求在这两个生命周期阶段中持续存在。
相反,该定义承认某些要素可能出现在一个阶段,但可能不会贯穿两个阶段。这种定义AI系统的方法反映了AI系统的复杂性和多样性,确保该定义与《欧洲人工智能法》的目标相一致,即容纳各种AI系统。
-
基于机器的系统
(11)“基于机器”一词指的是AI系统是在机器上开发和运行的。“机器”一词可以理解为包括使AI系统能够运行的硬件和软件组件。硬件组件指机器的物理元素,如处理单元、内存、存储设备、网络单元和输入/输出接口,它们为计算提供基础设施。软件组件包括计算机代码、指令、程序、操作系统和应用程序,它们处理硬件如何处理数据和执行任务。
(12)所有AI系统都是基于机器的,因为它们需要机器来使其功能得以实现,如模型训练、数据处理、预测建模和大规模自动化决策。先进AI系统的整个生命周期都依赖于可能包含许多硬件或软件组件的机器。AI系统定义中“基于机器”这一要素强调了AI系统必须是计算驱动的,并基于机器操作。
(13)“基于机器”一词涵盖了各种计算系统。例如,目前最先进的量子计算系统,尽管其独特的操作原理和量子力学现象的使用与传统计算系统存在显著差异,但只要它们提供计算能力,就构成基于机器的系统。同样,生物或有机系统也属于基于机器的系统,只要它们提供计算能力。
-
自主性
(14)定义的第二个要素是指系统“旨在以不同程度的自主性运行”。《欧洲人工智能法》第12条澄清,“不同程度的自主性”意味着AI系统被设计为以“一定程度的独立于人类参与和无需人类干预的能力”运行。
(15)自主性和推断能力密切相关:AI系统的推断能力(即其生成如预测、内容、建议或决策等输出,这些输出能够影响物理或虚拟环境的能力)是实现其自主性的关键。
(16)自主性的核心在于“人类参与”和“人类干预”,因此也在于人机交互。人机交互的一个极端是系统被设计为通过手动操作功能执行所有任务。另一个极端是能够在没有任何人类参与或干预的情况下运行的系统,即完全自主的系统。
(17)《欧洲人工智能法》第12条中关于“一定程度的独立行动能力”的表述排除了那些被设计为仅通过完全手动人类参与和干预运行的系统。人类参与和人类干预可以是直接的,例如通过手动控制,也可以是间接的,例如通过允许人类委托或监督系统操作的自动化系统控制。
(18)例如,一个需要手动提供输入以自行生成输出的系统是一个具有一定程度独立行动能力的系统,因为该系统被设计为具有生成输出而无需该输出被手动控制或由人类明确和精确指定的能力。同样,一个基于人类委托的过程自动化专家系统,能够根据人类提供的输入自行产生输出(如建议)也是一个具有一定程度独立行动能力的系统。
(19)《欧洲人工智能法》第3(1)条中关于“旨在以不同程度的自主性运行的基于机器的系统”的表述强调了系统与外部环境交互的能力,而不是开发系统所选择的特定技术(如机器学习)或模型架构。
(20)因此,自主性水平是确定一个系统是否符合AI系统定义的一个必要条件。所有被设计为以一定程度的独立行动能力运行的系统都满足AI系统定义中的自主性条件。
(21)在《欧洲人工智能法》附件I和附件III中确定的高风险领域等特定使用场景中,具有在有限或无人类干预下运行能力的系统,在某些条件下可能引发额外的潜在风险和人类监督考虑。自主性水平是提供者在设计系统(例如,系统的人类监督或风险缓解措施)时需要考虑的一个重要因素,需结合系统的预期用途进行考虑。
-
适应性
(22)第3(1)条定义的第三个要素是系统“在部署后可能表现出适应性”。《欧洲人工智能法》第12条澄清,“适应性”指的是自我学习能力,允许系统在使用过程中的行为发生变化。适应后的系统的新行为可能对于相同的输入产生与以前系统不同的结果。
(23)定义中关于这一要素的“可能”一词表明,一个系统可能但不一定在部署后具有适应性或自我学习能力以构成AI系统。因此,系统自动学习、发现新模式或在数据中发现超出其最初训练范围的关系的能力是一个选择性的,因此不是决定性的条件,用于确定系统是否构成AI系统。
-
AI系统目标
(24)定义的第四个要素是AI系统的目标。AI系统被设计为根据一个或多个目标运行。系统的目标可能是明确的或隐含的。明确的目标是指开发者直接编码到系统中的明确陈述的目标。例如,它们可能被指定为优化某个成本函数、概率或累积奖励。隐含的目标是指没有明确陈述但可以从系统行为或基本假设中推断出的目标。这些目标可能源于训练数据或AI系统与其环境的交互。
(25)《欧洲人工智能法》第12条澄清,“AI系统的目标可能与特定上下文中AI系统的预期用途不同”。AI系统的目标是系统内部的,指的是要执行的任务及其结果的目标。例如,一个企业虚拟AI助理系统可能有以高精度和低失败率回答用户关于一组文档的问题的目标。相比之下,预期用途是面向外部的,包括系统设计要部署的上下文以及必须如何操作。根据《欧洲人工智能法》第3(12)条,AI系统的预期用途是指“提供者打算使用AI系统的用途”。例如,在企业虚拟AI助理系统的情况下,预期用途可能是协助公司的某个部门执行某些任务。这可能要求虚拟助理使用的文档符合某些要求(例如,长度、格式),并且用户问题仅限于系统打算运行的领域。这一预期用途不仅通过系统的内部运行以实现其目标来实现,还通过其他因素来实现,如将系统整合到更广泛的客户服务工作流程中、系统使用的数据或使用说明。
-
使用AI技术推断如何生成输出
(26)AI系统的第五个要素是它必须能够从其接收的输入中推断出如何生成输出。《欧洲人工智能法》第12条澄清,“AI系统的关键特征是它们的推断能力。”该条进一步解释,AI系统应与“更简单的传统软件系统或编程方法相区别,并且不应涵盖仅由自然人定义的规则来自动执行操作的系统。”因此,推断能力是区分AI系统与其他类型系统的关键且必不可少的条件。
(27)第12条还解释说,“推断能力是指获得输出(如预测、内容、建议或决策)的过程,这些输出能够影响物理和虚拟环境,以及AI系统从输入或数据中推导模型或算法,或两者的能力。”对“推断”概念的这种理解并不与ISO/IEC 22989标准相矛盾,该标准将推断定义为“通过已知前提推导出结论的推理”,并且该标准包含了一个AI特定说明:“在AI中,前提要么是事实、规则、模型、特征或原始数据。”
(28)“获得输出(如预测、内容、建议或决策)的过程,这些输出能够影响物理和虚拟环境”是指AI系统(主要在“使用阶段”)基于输入生成输出的能力。“AI系统从输入或数据中推导模型或算法,或两者的能力”主要(但不限于)“构建阶段”的系统,并强调了用于构建系统的技术的重要性。
(29)《欧洲人工智能法》第3(1)条中使用的“推断如何生成输出”的表述比“从给定输入中推导出输出”的狭义理解更广泛,因此推断结果。因此,第3(1)条中使用的表述“推断如何生成输出”应理解为指“构建阶段”,在此期间,系统通过AI技术实现推断来推导输出。
5.1. 使推断成为可能的AI技术
(30)具体关注AI系统的构建阶段,《欧洲人工智能法》第12条进一步澄清,“在构建AI系统时,使推断成为可能的技术包括从数据中学习如何实现某些目标的机器学习方法和基于逻辑和知识的、从编码知识或要解决问题的符号表示中推断的方法。”这些技术应理解为“AI技术”。
(31)这一澄清明确指出,“推断”的概念应从更广泛的意义上理解,涵盖AI系统的“构建阶段”。第12条然后进一步指导了使AI系统能够推断如何生成输出的技术。因此,可能用于使推断成为可能的技术包括“从数据中学习如何实现某些目标的机器学习方法和基于逻辑和知识的、从编码知识或要解决问题的符号表示中推断的方法”。
(32)第12条中提到的第一类AI技术是“从数据中学习如何实现某些目标的机器学习方法”。这一类包括使系统能够“学习”的多种方法,如有监督学习、无监督学习、自监督学习和强化学习。
(33)在有监督学习中,AI系统从注释(标记数据)中学习,其中输入数据与正确的输出配对。系统使用这些注释来学习从输入到输出的映射,然后将其推广到新的、未见过的数据。一个基于AI的电子邮件垃圾邮件检测系统是一个有监督学习系统的例子。在其构建阶段,该系统在包含由人类标记为“垃圾邮件”或“非垃圾邮件”的电子邮件的数据集上进行训练,以从标记电子邮件的特征中学习模式。一旦训练完成并投入使用,该系统就可以分析新电子邮件,并根据其从标记数据中学习的模式将它们分类为垃圾邮件或非垃圾邮件。
(34)基于有监督学习的其他AI系统示例包括在图像数据集上训练的图像分类系统(其中每张图像都带有一组标签,如汽车等物体)、由医学专家标记的医学影像训练的医疗设备诊断系统,以及基于标记交易数据训练的欺诈检测系统。
(35)在无监督学习中,AI系统从未标记的数据中学习。模型在未定义任何预定义标签或输出的数据上进行训练。使用不同的技术(如聚类、降维、关联规则学习、异常检测或生成模型),系统被训练以在数据中发现模式、结构或关系,而没有关于结果应该是什么的明确指导。制药公司用于药物发现的AI系统是无监督学习的一个例子。AI系统使用无监督学习(如聚类或异常检测)对化学化合物进行分组,并根据它们与现有药物的相似性预测潜在的新治疗方法。
(36)自监督学习是无监督学习的一个子类,其中AI系统以监督的方式从未标记数据中学习,使用数据本身创建自己的标签或目标。基于自监督学习的AI系统使用各种技术,如自动编码器、生成对抗网络或对比学习。一个通过预测图像中缺失的像素来学习识别对象的图像识别系统是基于自监督学习的AI系统的一个例子。其他示例包括学习预测句子中下一个标记的语言模型或通过学习预测音频信号中下一个声学特征来识别口语单词的语音识别系统。
(37)基于强化学习的AI系统从它们自己的经验收集的数据中学习,通过“奖励”函数。与从标记数据(有监督学习)或模式(无监督学习)中学习的AI系统不同,基于强化学习的AI系统从经验中学习。系统没有明确的标签,而是通过试错学习,根据从环境中获得的反馈改进其策略。一个能够执行抓取物体等任务的基于AI的机器人手臂是基于强化学习的AI系统的一个例子。强化学习还可以用于优化搜索引擎中的个性化内容推荐和自动驾驶汽车的性能。
(38)深度学习是机器学习的一个子集,它利用分层架构(神经网络)进行表示学习。基于深度学习的AI系统可以自动从原始数据中学习特征,消除了手动特征工程的需要。由于层数和参数的数量,基于深度学习的AI系统通常需要大量数据进行训练,但在给定足够数据时,可以学习识别模式和做出高精度预测。基于深度学习的AI系统被广泛使用,并且是近期许多AI突破背后的技术。
(39)除了上述各种机器学习方法外,第12条中提到的第二类技术是“基于逻辑和知识的、从编码知识或要解决问题的符号表示中推断的方法”。这些AI系统不是从数据中学习,而是从人类专家编码的知识(包括规则、事实和关系)中学习。基于人类专家编码的知识,这些系统可以通过演绎或归纳引擎或通过排序、搜索、匹配、链接等操作进行“推理”。通过使用逻辑推断得出结论,这些系统将形式逻辑、预定义规则或本体论应用于新情况。基于逻辑和知识的方法包括知识表示、归纳(逻辑)编程、知识库、推断和演绎引擎、(符号)推理、专家系统和搜索优化方法。例如,基于语法知识和逻辑语义的经典语言处理模型依赖于语言的结构,识别句子的句法和语法成分以提取给定文本的含义。另一个基于逻辑和知识方法的AI系统的突出例子是用于医学诊断的早期专家系统,这些系统通过编码一系列医学专家的知识来开发,旨在根据患者的症状集得出结论。
5.2. 不属于AI系统定义范围的系统
(40)第12条还解释说,AI系统的定义应将AI系统与“更简单的传统软件系统或编程方法相区别,并且不应涵盖仅由自然人定义的规则来自动执行操作的系统。”
(41)一些系统虽然可能以狭义的方式具有推断能力,但由于其分析模式和自主调整输出的能力有限,因此可能不属于AI系统定义的范围。此类系统可能包括:用于改进数学优化的系统。
(42)用于改进数学优化或加速和近似传统、成熟的优化方法(如线性或逻辑回归方法)的系统不属于AI系统定义的范围。这是因为,尽管这些模型具有推断能力,但它们并未超越“基本数据处理”。表明一个系统未超越基本数据处理的一个迹象是,它已以巩固的方式使用了多年。这包括例如,在优化问题中近似函数或参数的基于机器学习的模型,同时保持性能。这些系统的目的是提高用于计算问题的优化算法的效率。例如,它们通过提供学习近似值、启发式方法或搜索策略来帮助加快优化任务的速度。
(43)例如,基于物理的系统可能使用机器学习技术来提高计算性能,加速传统的基于物理的模拟或估计参数,然后将这些参数输入到既定的物理模型中。这些系统将不属于AI系统定义的范围。在这个例子中,机器学习模型近似复杂的大气过程(如云微物理或湍流),从而实现更快且计算效率更高的预测。
(44)另一个不属于定义范围的系统示例是用于优化带宽分配和资源管理的卫星电信系统。在卫星通信中,传统优化方法可能难以应对网络流量的实时需求,尤其是在调整不同地区用户需求的不同水平时。机器学习模型(例如)可用于预测网络流量并优化卫星转发器的资源和功率分配,其性能与该领域的既定方法相似。
(45)虽然这些系统可能包含自动自我调整,但这些调整旨在通过提高计算性能来优化系统的运行,而不是例如以智能方式调整其决策模型。在这些条件下,它们可能被排除在AI系统定义之外。
基本数据处理
(46)基本数据处理系统是指遵循预定义的明确指令或操作的系统。这些系统被开发和部署以基于手动输入或规则执行任务,在系统生命周期的任何阶段都不进行“学习、推理或建模”。它们基于固定的人类编程规则运行,不使用AI技术(如机器学习或基于逻辑的推断)来生成输出。这些基本数据处理系统包括例如,用于根据特定标准(如“查找过去一个月内购买特定产品的所有客户”)对数据进行排序或过滤的数据库管理系统、不包含AI启用功能的标准电子表格软件应用程序,以及用于从调查中计算人口平均值并在一般环境中使用的软件。
(47)此外,仅用于描述性分析、假设检验和可视化的系统也不属于AI系统的定义范围。例如,在销售报告可视化软件中,可以使用统计方法来创建销售仪表板,显示总销售额、各区域平均销售额和销售趋势随时间的变化。借助统计方法,这些数据可以被汇总并以图表和图形形式可视化。然而,该系统不会建议如何改进销售或推广哪些产品。另一个例子是应用于民意调查或调查数据以确定其有效性、可靠性、相关性和统计显著性的软件系统。这些系统不“学习、推理或建模”,它们只是以信息丰富的方式呈现数据。
基于经典启发式的系统
(48)经典启发式是问题解决技术,依赖于基于经验的方法来有效地找到近似解。启发式技术在编程情况下很常见,其中找到精确解由于时间或资源限制而不切实际。经典启发式通常涉及基于规则的方法、模式识别或试错策略,而不是数据驱动的学习。与现代机器学习系统不同,后者根据输入输出关系调整其模型,经典启发式系统应用预定义规则或算法来推导解决方案。例如,使用带有启发式评估函数的最小化最大算法的国际象棋程序可以评估棋盘位置,而无需从数据中预先学习。尽管在许多应用中有效,但与从经验中学习的AI系统相比,启发式方法可能缺乏适应性和泛化能力。
简单预测系统
免责声明:本号所载内容均为原创、投稿、授权转载或网络公开资料搜集整理,仅供读者交流学习使用,版权归原作者所有,且仅代表作者个人观点,与本号立场无关。若所引用的图片、数据、文字等来源标注有误或涉及侵权,烦请及时联系删除。