设为首页收藏本站 关注微博 关注微信

全球新闻在线

全球新闻在线 首页 科技新闻 IT技术 查看内容

一个经过人类婴儿的举止来改进机器学习的技艺

2021-8-31 12:21| 发布者: wdb| 查看: 76| 评论: 0|原作者: [db:作者]|来自: [db:来源]

摘要: 一个经过人类婴儿的举止来改进机器学习的技艺 ,更多it技术新闻关注我们。

从它们寿命的开始几年最初,人类就具备不停学习的天生能力,并经过观看四周环境中的事物或人与它们互动来构建全球的心思模子。认知心思学探讨表达,人类广大运用这类先前得到的常识,特别是当它们碰到新的概况或做出打算时。

虽然最近在人力智能(AI)范畴取得了重要进展,但许多数虚拟代理依然须要数百小时的培训才能在若干任务中实现人类等级的功能,而人类可行在几小时或更短时间内学会达成这点任务。最近的探讨突出了人类得到常识的能力的两个要害要素 - 即直觉物理学和直觉心思学。

这点直觉模子曾经在人类从进行的早期阶段观看到,可能是未来学习的焦点推进者。鉴于这一想法,韩国高等科学技艺探讨院(KAIST)的探讨人士最近开发了一个内在奖励归一化方法,应允AI代理抉择最能改进其直觉模子的举止。在它们的论文中,预先发表在arXiv上,探讨人士特别提议了一种图形物理网站,它与深层强化学习相联合,遭到人类婴儿学习举止的启发。

探讨人士在它们的论文中解释说:“想象一种房间里的人类婴儿,玩具四周有可到达的距离。” “它们不停地抓住,投掷和对物体采用行动;有时,它们会观看它们举止的后果,但有时,它们会失去兴趣并调转方向另一种物体。”作为科学家的孩童看法表达,人类婴儿是内在动机发展本人的实验,发觉更多消息,并终归学会区别不同的对象,并缔造更丰富的里面表征。“

心思学探讨表达,在人生的开始几年,人类不停尝试四周环境,这使它们能够造成对全球的要紧了解。另外,当孩童观看到的结果不适合它们此前的希望时(称为预期违纪),它们经常被勉励进一步尝试,以更好地理解它们所处的概况。

KAIST的探讨小组试图运用强化学习方法在AI代理中重现这点举止。在它们的探讨中,它们起首导入了一种图形物理网站,可行提取对象之中的物理关连,并预测他们在三维环境中的延续举止。随后,它们将该网站与深度强化学习模子相联合,导入了内在奖励规范化技艺,勉励AI代理人探寻并辩别将不停改良其直觉模子的举止。

探讨人士运用三维物理引擎声明了它们的图形物理网站能够有用地推断出不同物体的位子和速度。它们还发觉,它们的方法应允深度强化学习网站不停改良其直觉模子,勉励它仅仅鉴于内在动机与对象发展交互。

在一系列估价中,由该团队的探讨人士设置的新技艺实现了非凡的明确性,AI代理执行了大批不同的探寻行动。在未来,它可行为机器学习用具的开发提供消息,这点用具可行更快,更有用地从往日的经历中学习。

探讨人士在它们的论文中解释说:“咱们曾经在各式情景中用固定和非固定难题测试咱们的网站,此中球形物体具备不同的品质和半径。” “咱们期望这点预先训练没有问题直觉模子将被用作其它指标导向任务的先验常识,如ATARI游戏或视频预测。”

更多IT技艺关心咱们。