当人们提到人工智能时,有人将其视为机器学习,而另一些人则将其视为深度学习或强化学习等。虽然人工智能是涉及机器学习的广义术语,但强化学习是机器学习的一种类型,从而成为AI的一个分支。在本文中,我们将通过一些简单的示例来了解5个关键强化学习原理。
强化学习允许机器和软件代理自动确定特定上下文中的理想行为,以使其性能最大化。它被各种软件和机器所采用,以找到在特定情况下应采取的最佳行为或路径。
本文摘自Hadelin de Ponteves写的《AI速成课程》。在这本书中,Hadelin帮助您了解通过强化学习构建AI系统的真正需求。本书涉及描述性和实践性项目,以将思想付诸实践,并展示如何逐步构建智能软件。
尽管以某种方式进行强化学习是AI的一种形式,但是机器学习并不像人类一样,包括采取行动并与环境互动的过程。的确,作为聪明的人,我们一直在做的事情如下:
我们观察到一些输入,无论是我们用眼睛看到的东西,我们用耳朵听到的东西还是记忆中的记忆。
这些输入然后在我们的大脑中进行处理。
最终,我们做出决定并采取行动。
与环境交互的过程就是我们要在人工智能方面进行再现的过程。就此而言,从事此工作的AI分支是强化学习。这与我们的思维方式最接近。最先进的人工智能形式,如果我们将AI视为试图模仿(或超越)人类智能的科学。
强化学习原则在AI的业务应用中也具有最令人印象深刻的结果。例如,阿里巴巴利用强化学习在不增加广告预算的情况下将其在线广告的投资回报率提高了240%。
五项强化学习原则
让我们开始建立直觉的第一支柱,以了解强化学习的工作原理。这些是强化学习的基本原则,它将使您从正确的,扎实的AI基础入手。
NBA2K如何将下一代体育迷和品
Mashroom的端到端租赁和物业
边缘的AI正在推动无缺陷工厂
AnaloguePocket预购将于8月3
吃豆人工作室使您可以在Twit
HuaweiMateXs的发布日期与价
这种芯片可以在几秒钟内下载
DeanBeat表示数字游戏活动并
声破天现在显示印度最受欢迎
演示与300mmSiCMOS技术兼容的
极品飞车热火不会再有战利品
印度的Byju公司以3亿美元的价
Startup推出创新产品每天向亚
三星将在即将举行的GalaxyNo
Instagram现在可让您通过布局
研究人员提出了使用合成面孔
Twitch为Mac用户推出了自己的
YCombinator演示日将保持虚拟
Netflix将开始取消长期休眠订
NetApp收购Spot以获取云基础
苹果的带无线充电盒的AirPod
iPad的Photoshop获取曲线和A
Snap推出为期13周的远程计划
SteamCloudPlay进入测试版并