日期:2024/06/10   

Artificial Intelligence, Machine Learning, and Deep Learning: Are They All  the Same? — Journal of Young Investigators

人工智能、机器学习和深度学习

人工智慧(AI)或机器学习(ML)领域的运算时,GPU(图形处理器)和CPU(中央处理器)各自有其独特的功能和特性

1. 并行处理能力:
 - GPU: GPU具有大量的内核,专为同时执行多个操作而设计。因此,GPU在处理需要大量并行计算的任务时非常高效,如神经网络的训练和大规模数据处理。
 - CPU: CPU则拥有相对较少的内核,但每个内核的计算能力较强,更适合处理复杂的单线程(或少线程)任务。

2. 计算能力:
 - GPU:拥有高浮点运算能力,这对于需要大量矩阵运算的深度学习任务非常有用。 GPU能在深度学习任务中显著加速训练过程。
 - CPU: 虽然也能进行浮点运算,但在大范围矩阵运算或高度并行的任务中效率不如GPU。

3. 用途专业性:
 - GPU: 当初是为图形渲染设计的,但现在已广泛应用于AI计算。特别是NVIDIA的CUDA技术,使得开发者能够利用GPU进行通用计算。
 - CPU: 是通用计算的核心,能有效地执行大部分一般计算任务。适合运行操作系统、各类应用程式和处理多样化的计算需求。

4. 记忆体架构:
 - GPU:GPU内部的显存(VRAM)专门为快速数据传输设计,能加速深度学习数据的大规模处理。
 - CPU:使用标准的RAM,虽然在存取数据的速度上可能不如GPU的VRAM,但在处理开销较高和不同类型的资料时,CPU的内存架构更灵活。

5. 能耗和成本:
 - GPU:高性能GPU相比CPU耗电更多,成本也较高,但在深度学习、数据科学等领域效益非常显著,因为它可以大幅缩短训练时间。
 - CPU: 通常在能耗和价格方面更具优势。对于不需大量并行运算的任务,CPU是更经济的选择。

如果你从事的是需要大量并行运算的深度学习、图像处理或科学计算,GPU是不可或缺的工具。但对于一般应用和需要处理多样化任务的情况,CPU仍然是主要选择。

GPU和通用CPU在AI和機器學習領域的功能和特性上的差異。

1.平行处理能力的差异
 GPU 拥有大量核心(数千个),可以同时并行处理许多运算。 这使得它非常适合需要大量矩阵计算的任务,例如训练深度学习模型。

 CPU拥有少量的高效能核心(通常在数十个左右),擅长复杂的顺序处理。 它在多任务处理和顺序执行不同类型的任务方面非常有效率。

 例:
 - GPU:NVIDIA Tesla V100(拥有5120个CUDA核心,专门用于训练大规模AI模型)
 - CPU:Intel Core i9-11900K(8核心16执行绪高效能处理器,相容于从一般办公室到游戏​​的广泛用途)

 2.算力与使用量的差别
 GPU在浮点运算(尤其是单精度和半精度)方面极为强大,使其对于卷积神经网路(CNN)等深度学习任务极为强大。

 CPU 可以处理广泛的运算任务,具有快速快取和进阶分支预测功能,​​使其适合运行一般应用程式。

NVIDIA GeForce RTX 3080

 例:
 -
GPU:NVIDIA GeForce RTX 3080(强大的人工智慧推理和即时图形渲染功能)
 - CPU:AMD Ryzen 9 5900X(12 核心 24 线程,非常适合游戏、内容创建等)

Buy AMD Ryzen 9 5900X Processor online | PCCG

3. 记忆体差异
 GPU 的板载记忆体 (VRAM) 可实现高速资料传输,并且非常适合处理大型资料集。

 CPU使用标准 RAM,对于通用资料操作具有高度灵活性。

 例:
 - GPU:NVIDIA A100**(高达 40GB 快速 HBM2 记忆体)
 - CPU:Intel Xeon 可扩充处理器**(支援大量标准 RAM,用于大型资料中心)

 4.功耗与成本的差异
 GPU通常会消耗更多电力且成本更高,但它们被认为是在短时间内处理许多平行运算任务的投资。

 CPU功耗相对较低,成本较低,但对于平行运算任务的效能较差。

 例:
 - GPU:NVIDIA RTX 3090**(350W功耗)
 - CPU:英特尔酷睿 i5-11600K**(125W 功耗)


 - 特定于应用:GPU 专门用于平行处理,是深度学习和图形渲染的理想选择。 CPU 适合通用处理,擅长执行常见运算任务。
 - 成本和能源效率:GPU 昂贵且耗能,但适合需要高效能的特定任务。 CPU 具有成本效益且消耗更少的能量。 因此,根据所需计算任务的特性选择合适的处理器非常重要。

人工智能、机器学习和深度学习:它们都是一样的吗?

人工智能 (AI) 是计算机科学和计算机系统的一个领域,它强调执行传统上被认为需要人类认知和智能的任务的框架。这是一个通过我们使用的技术不断发展并融入我们日常生活的行业。随着最近的科学发展,机器学习 (ML) 和深度学习 (DL) 已成为与人工智能相关的著名名称。虽然它们之间有重叠,但它们并不相同。

什么是人工智能?

顾名思义,人工智能的目标是创造“人工”模拟人类智能的机器。为了理解这意味着什么,我们必须首先了解人类智能的构成。我们经常认为理所当然的能力,包括我们的推理能力、语言能力、解决问题、视觉和听觉感知以及我们的学习方式,都是构成我们智能的广泛分类。事实上,由于其复杂的计算性质和可转移性的局限性,这些在人工系统中很难模拟。

人工智能中有许多研究领域已经为公众提供了实际应用。自然语言处理 (NLP) 是人工智能的一个子集,它构建了用于分析和建模人类文本的计算工具,例如机器翻译、摘要和问答。NLP 在我们的日常实用程序中占有重要地位,包括电子邮件过滤器、搜索结果和预测文本。机器视觉是人工智能的另一个子集,旨在模拟人类智能的视觉感知组件。通过结合硬件和软件工具,机器视觉旨在分析图像并为人类指导提供预测见解。机器视觉的一个流行应用是自动驾驶汽车:自动驾驶汽车使用多个摄像头、激光雷达、雷达和超声波传感器来处理汽车周围的视野,以便做出驾驶决策。机器视觉的另一个主要应用是医疗保健。从生物医学图像分析到手术指导,机器视觉使医疗保健提供者能够更早地发现疾病并制定预防措施以优化健康结果。与机器视觉重叠的人工智能的一个子集是机器人技术。虽然我们认为机器人领域涵盖了像索菲亚这样的人形机器人,但机器人领域中还有许多其他子领域。例如,有独立于人类干预运行的自主机器人,如 iRobot 吸尘器,还有增强人类能力的增强型机器人,如机器人假肢。

什么是机器学习?

与上面讨论的 AI 子集一样,机器学习 (ML) 只是 AI 的另一个子集。因此,所有 ML 都可以被视为 AI,但并非所有 AI 都可以被视为 ML。简而言之,机器学习使用统计算法来理解大量数据并找到我们可以用来洞察整个数据的模式。任何数字信息都可以构成数据,因此可以通过机器学习算法来获得这些见解。我们今天使用的许多产品都在其工作流程中实施了某种形式的机器学习管道,包括 Netflix、YouTube、Spotify、Facebook,甚至 Siri 和 Alexa 等语音助手。ML 的独特之处在于我们能够教会机器学习,而无需明确的编程指令。数据是机器学习的基础。

数据对于学习很重要;因此,数据的质量和数量在可以提取的预测见解中都起着不可或缺的作用。我们可以使用数据子集来训练算法,我们将其称为“训练集”。一旦算法对训练集进行了一定次数的迭代,我们就可以使用未向机器显示的其余数据作为“测试集”。这类似于课堂上学习新科目的学生。老师教他们,学生吸收信息并在向他们呈现材料时尝试建立联系,然后通过考试测试他们对该科目的理解程度。同样,算法对训练集的学习就像学生在课堂上学习材料,而测试集就像考试。

我们将要介绍的主要 ML 类型是监督学习、无监督学习和强化学习。在监督学习中,数据被标记以告诉机器它需要注意的确切模式。假设你有一个分类问题。有一个数据集,其中苹果的图像标记为“苹果”,橙子的图像标记为“橙子”,算法的任务是正确地对与苹果和橙子相关的图像进行分类。这是一个监督学习示例,因为训练数据已经包含输入向量及其对应的目标。在无监督学习中,数据上没有标签,算法必须在没有这个附加支撑的情况下得出见解。假设现在数据包含没有任何标签的苹果、橙子和香蕉的图像。这可能是一个聚类问题,其中算法解析数据并在不同水果的图像中找到模式,然后将它们分组在一起。强化学习基于奖励最大化,因为算法会学习要做什么以及如何将情况映射到动作。在这种学习形式中,机器通过反复试验进行学习。代理随后根据答案获得奖励或惩罚。因此,随着模型获得更多奖励点,它会训练自己走上正确的道路。AlphaGo 是一个为与围棋游戏中的玩家竞争而创建的程序,它使用强化学习击败了最优秀的人类竞争对手。

什么是深度学习?

深度学习 (DL) 是机器学习的一个子集。与特定于任务的算法相比,它是一种严重依赖数据表示的方法。因此,计算机从经验中学习,并以概念层次结构的形式理解世界。受人脑的启发,深度学习主要利用人工神经网络(尽管深度学习中有多种不同的方法)从显示给它的数据中提取特征。上一节讨论了在机器学习中,我们必须告诉机器可以分离数据各个部分的特定特征。另一方面,神经网络会遍历数据并自动提取最能代表数据的特征。深度学习的美妙之处在于,随着我们文明的进步和对数据的更多访问,深度学习模型的性能也会提高。传统的机器学习通常在一定数量的数据后达到稳定状态,其性能趋于平缓。这是深度学习近年来流行的主要原因,技术推动了我们获取和存储的数据的改进。

深度学习的一个应用是语音识别,这超出了机器学习的范围。此外,深度学习在自动驾驶汽车中发挥了不可或缺的作用。除了使用机器学习原理外,随着这些汽车获得更多有关道路上驾驶行为的数据和跟踪措施,它们作为自动驾驶代理会得到改进并变得更加高效。因此,特斯拉汽车进行软件更新的原因是,该模型可以使用从特斯拉汽车在路上行驶时收集的额外数据进行训练,以提高整体性能。

影响和后续步骤

正如 Dong 等人在 2020 年的《人类智能与人工智能评论》中所写,“模拟人类操作智能的人工智能在计算速度、容量和准确性方面远远优于人类”,这将使人工智能“在更多领域和更深层次上帮助人类”。尽管人工智能、机器学习和深度学习仍处于萌芽阶段,但由于这些领域的进步,已经取得了许多进步,帮助人类过上了更好的生活。让更多人理解围绕这些原则的概念框架将使不同的观点能够接近该领域,从而被更多人更好地利用。我希望在这个系列讲座中至少介绍或使人工智能中的概念不那么令人生畏,更容易理解。