AI专家Hadelin de Ponteves解释了5条重要的强化学习原则

机械
2023-05-11

当人们提到人工智能时,有人将其视为机器学习,而另一些人则将其视为深度学习或强化学习等。虽然人工智能是涉及机器学习的广义术语,但强化学习是机器学习的一种类型,从而成为AI的一个分支。在本文中,我们将通过一些简单的示例来了解5个关键强化学习原理。

强化学习允许机器和软件代理自动确定特定上下文中的理想行为,以使其性能最大化。它被各种软件和机器所采用,以找到在特定情况下应采取的最佳行为或路径。

本文摘自Hadelin de Ponteves写的《AI速成课程》。在这本书中,Hadelin帮助您了解通过强化学习构建AI系统的真正需求。本书涉及描述性和实践性项目,以将思想付诸实践,并展示如何逐步构建智能软件。

尽管以某种方式进行强化学习是AI的一种形式,但是机器学习并不像人类一样,包括采取行动并与环境互动的过程。的确,作为聪明的人,我们一直在做的事情如下:

我们观察到一些输入,无论是我们用眼睛看到的东西,我们用耳朵听到的东西还是记忆中的记忆。

这些输入然后在我们的大脑中进行处理。

最终,我们做出决定并采取行动。

与环境交互的过程就是我们要在人工智能方面进行再现的过程。就此而言,从事此工作的AI分支是强化学习。这与我们的思维方式最接近。最先进的人工智能形式,如果我们将AI视为试图模仿(或超越)人类智能的科学。

强化学习原则在AI的业务应用中也具有最令人印象深刻的结果。例如,阿里巴巴利用强化学习在不增加广告预算的情况下将其在线广告的投资回报率提高了240%。

五项强化学习原则

让我们开始建立直觉的第一支柱,以了解强化学习的工作原理。这些是强化学习的基本原则,它将使您从正确的,扎实的AI基础入手。