关于人工智能的定义,哪些是正确的(人工智能的定义及特征是什么),本文通过数据整理汇集了关于人工智能的定义,哪些是正确的(人工智能的定义及特征是什么)相关信息,下面一起看看。

艾伦图灵对人工智能的定义如下:

这是一种非常独特的定义AI的方式。它没有直接涉及智力的概念,而是侧重于类似人类的行为。事实上,这个目标的范围甚至比纯粹的智能更广。从这个角度来说,AI不是指造一个能马上解决任何问题的超智能机器,而是造一个能模仿人类行为的机器。

然而,仅仅制造模仿人类的机器并不能# ;听起来没什么意思。从现代的角度来看,每当我们谈论AI时,它都是指能够执行以下一项或多项任务的机器:理解人类语言,执行涉及复杂操纵的机械任务,在短时间内解决可能涉及大量数据的复杂的基于计算机的问题,以类似人类的方式回复答案,等等。

电影《2001:太空漫游》中描述的超级计算机HAL非常接近现代AI的观点。它是一台机器,能够处理来自各种来源的大量数据,以极快的速度对其产生洞察和总结,并能以类似人类的交互方式(如语音对话)将这些结果传达给人类。

从人形行为来看,人工智能有两个方面。一方面,机器是智能的,可以和人类交流,但是没有运动功能。哈尔就是这种人工智能的一个例子。另一方面,它涉及到与人形的身体互动运动能力,涉及机器人领域。

术语 机器学习 ,简称ML(Machine Learning),是亚瑟塞缪尔(Arthur Samuel)于1959年在用机器解决跳棋的背景下提出的。该术语指的是可以学习产生行为的计算机程序,该行为不是由程序作者明确编程的。相反,它可以显示作者可能完全没有意识到的行为。

这种行为的学习基于三个因素:

程序使用的数据;量化当前行为和理想行为之间的误差或某种形式的距离;反馈机制,使用量化错误指导计划在后续事件中产生更好的行为。

可以看出,第二个和第三个因素很快使这个概念变得抽象,并强调其深刻的数学根源。机器学习理论的方法对于构建人工智能系统非常重要。

机器学习算法大致可以分为三种:

监督学习算法非监督学习算法强化学习算法。

让让我们进一步了解每一种类型。

为简单起见,让让我们把机器学习系统想象成一个黑匣子,当给定一些输入时,它会产生一些输出。如果我们已经有一个包含一组输入和一组输出的历史数据,基于这些数据的学习被称为监督学习。

监督学习的一个经典例子是分类。假设我们测量了三种不同类型的花(Setosa Mountain Iris、Versicolor Iris、Virginica Iris)的四种不同属性(尊重长度、尊重宽度、花瓣长度和花瓣宽度)。

我们测量了每种花的25个不同样品。然后,这些数据将被用作训练数据,其中有输入(4个测量的属性)和相应的输出(花的类型),可用于训练模型。然后用有监督的方式训练合适的机器学习模型。一旦模型被训练,任何花(在三种已知类型中)都可以根据萼片和花瓣的大小进行分类。

在无监督学习范例中,标记数据是不可用的。无监督学习的一个经典例子是 聚类 。考虑上一小节中描述的同一个例子,我们测量了三种花的萼片和花瓣的大小。然而,在这个例子中,我们不没有每组测量花的确切名称。我们只有一组测量值。此外,我们被告知,这些测量属于三种不同类型的花。

在这种情况下,无监督学习技术可以用于自动识别三组测量值聚类。但是,由于标签未知,我们所能做的就是将每个类簇称为flower-type-1、flower-type-2和flower-type-3。如果给定一组新的测量值,我们可以找到它们最接近的簇,并将其归类为其中之一。

强化学习是一种特殊的学习方法,需要与有监督和无监督方法分开对待。强化涉及到环境的反馈,所以不是完全无人监管的。但是它也没有一套可以用于训练的标记样本,所以不能算是有监督的。在强化学习方法中,系统不断地与环境交互,以寻求产生期望的行为并从环境中获得反馈。

机器学习方法的另一种划分方式是根据处理的数据类型进行分类。接收静态标签数据的系统称为静态学习方法。处理随时间变化的数据的系统称为动态方法。每种方法都可以有监督或无监督,但强化学习总是动态的。

静态学习是指学习作为单个快照获得的数据,并且数据的属性随着时间保持不变。一旦模型在数据上进行训练(使用监督学习或无监督学习),训练好的模型可以在未来的任何时间应用于类似的数据,模型仍然有效,并将按预期执行。一个典型的例子就是不同动物的图像分类。

这也称为基于时间序列的学习。这类问题中的数据是有时效性的,会随着时间而变化。因此,模型训练不是一个静态的过程,而是需要不断地(或者在每一个合理的时间窗口之后)对模型进行训练,以保持其有效性。

这类问题的典型例子是天气预报或股票市场预测。一年前训练的模型对预测明天将完全无用明天的天气或任何股票的价格。这两种类型的根本区别在于国家的概念。在静态模型中,模型的状态是不变的,而在动态模型中,模型的状态是时间的函数,是不断变化的。

在处理各种数据集时,维度通常是一个令人困惑的概念。从物理的角度来看,维度就是空间维度:长、宽、高。为了简单起见,我们不不要把时间当作深入研究物理的第四维。)在任何现实生活场景中,我们遇到的不外乎这三个维度。

但是,当我们处理数据进行机器学习时,通常会有几十个、几百个甚至更多的维度。为了理解这些高维,我们需要研究维度的基本性质。

定义尺寸时,每个尺寸都与其他两个尺寸垂直或正交。这种正交性对于三维空间中的所有点具有唯一的表示是必不可少的。如果维度互不正交,空间中的同一点可以有多种表示,基于此的整个数学计算都会失败。

比如我们设置三个坐标为长、宽、高,有任意原点(原点的确切位置只会改变坐标值,但不会影响唯一性属性,所以只要在整个计算过程中保持不变,就可以选择任意原点。)

坐标(0,0,0)标记原点本身的位置。坐标(1,1,1)将标记一个点空间,该点空间在每个维度上距离原点1个单位,并且是唯一的。没有其他坐标系可以代表空间中的相同位置。

现在,让让我们把这个概念扩展到更高的层面。在数学上增加更多的维度相对容易,但在空间上可视化却很难。如果我们加上第四维,它必须与前面所有的三维正交。在这样的四维空间中,原点的坐标是(0,0,0,0)。三维空间中的点(1,1,1)在四维空间中可以有坐标(1,1,1,0)。

只要保证正交性,就能保证坐标的唯一性。同样,我们可以有任意数量的维度,所有的数学计算仍然有效。

考虑前面描述的虹膜数据示例。输入4个特征:萼片和花瓣的长度和宽度。因为这四个特征是相互独立的,所以可以认为它们是正交的。所以在利用虹膜数据解决问题的时候,我们其实是在处理四维输入空间。

即使从数学的角度来看,增加任意数量的维度都是可能的,但还是有一个问题。随着维度的增加,数据的密度呈指数下降。

例如,如果我们在训练数据中有1000个数据点,并且该数据具有3个独特的特征。假设所有特性的值都在1到10之间。所有这1000个数据点都位于一个101010的立方体中。因此,密度为1000/1000或每单位立方体1个样本。如果有5个独特的特征而不是3个,那么数据的密度将很快下降到每单位5维立方体0.01个样本。

数据的密度很重要,因为数据密度越高,找到好模型的可能性就越大,模型准确性的置信度就越高。如果密度低,使用该数据的训练模型的置信度将会低。因此,虽然高维在数学上是可以接受的,但人们需要关注维数,以便开发出一个好的具有高置信度的机器学习模型。

在开发和应用机器学习模型的时候,总是有很多可能的解决方案,有很多可能的方法来得到答案。很多时候,哪种解决方案或方法比其他方法更好,并没有理论指导。在这种情况下,奥卡姆剃刀原则(有时称为简单性原则)可以有效地应用。该原则指出:

这个原理不完全是一个定理,不能作为一个定量的规则或等式来应用。但是,在现实生活中做出这样的决定时,却是一个有力有效的观念引导。

还应该注意的是,这一规则产生了一种折衷。一方面,我们以复杂的形式拥有更多的信息,而另一方面,我们以简单的形式拥有更多的信息。人们不应该把问题简单化,以至于失去一些核心信息。奥卡姆的另一个衍生方面剃刀原理是越简单的解往往越有泛化能力。

在设计机器学习系统时,另一个需要注意的有趣概念来自Wolpert和Macready的论文,以 天下没有免费的午餐 最优化中的定理或NFL定理。该定理本质上说明:

这个定理更需要作为一个指导原则而不是定律来使用,因为在所有可能的问题类别中,一个设计良好的算法完全有可能胜过其他设计不好的算法。但是,在实际情况中,从这个定理可以推断出,我们可以不要对所有问题都采用相同的解决方案,也不要期望它在所有情况下都能很好地工作。

收益递减规律通常出现在经济和商业场景中。它指出,随着现有员工数量的增加,增加更多员工来完成一项工作,产生的收入开始越来越少。

从机器学习的角度来看,这个规则可以应用到特征工程中。从给定的数据集中,人们只能提取一定数量的特征。之后性能增益开始降低,付出的努力就不值得了。在某些方面,这与奥卡姆的剃刀原理,并增加了更多的细节。

在机器学习开始真正意义上的商业化之前,很少有其他系统突破了常规计算的界限。一个显著的应用是专家系统。

艾伦图灵的定义标志着机器智能被认可的时代开始了,人工智能领域诞生了。然而,在早期(直到20世纪80年代),机器智能或机器学习的领域仅限于所谓的专家系统或基于知识的系统。专家系统领域的顶级专家之一,Edward Feigenbaum博士曾经这样定义专家系统:

这个系统可以代替某些领域的专家。这些机器被编程为基于复杂的逻辑运算来执行复杂的启发式任务。

虽然这些系统可以取代特定领域的专家,但如果我们将它们与人类的智能进行比较,我们会发现它们并不是真正的 智能 系统。原因是系统是 硬编码 只解决特定类型的问题。如果需要解决一个更简单但完全不同的问题,这些系统很快就会变得完全无用。

然而,这些系统非常受欢迎和成功,特别是在需要重复但高度精确的性能的领域,如诊断、检查、监测和控制。

更多关于人工智能的定义,哪些是正确的(人工智能的定义及特征是什么)相关信息请关注本站。