首页 > 自考资讯 > 自考知识

OpenAI开课了!深度强化学习最全课程包,教程、代码、一网打尽

头条共创 2024-06-12



大数据文摘出品

作者:魏子敏、蒋宝尚

继谷歌和微软的人工智能实践课程后,Elon Musk和Sam Altman主导创立的OpenAI刚刚也发布了一门教学+练手的全能课程“Spinning Up in Deep RL”,希望将他们最擅长的技术——深度强化学习能力分享出来,让更多技术人掌握。

先上课程地址

OpenAI地址:

https://spinningup.openai.com/en/latest/index.html

GitHub地址:

https://github.com/openai/spinningup/blob/master/docs/user/running.rst

由OpenAI来上强化学习这门课再合适不过了。今年8月份,OpenAI率领的AI战队,就是凭借这一核心技术能力,在与人类高手对决的DOTA2比赛中,赢得了个人赛,并且在团战中表现不俗。

强化学习是目前最流行的教机器人玩游戏的方法之一,也是在复杂场景下,人工智能进行决策的重要技术。

简单来解释下强化学习,假设你交给机器人一个任务,比如拾取金币,强化学习会在机器人完成任务时给予适当的奖励。这样机器人下一次执行任务时,就更愿意采取“正确”行动。在经历数百次、数千次,甚至数百万次的尝试之后,机器就能逐渐学习到完成任务时所需的策略。

OpenAI人工智能研究实验室一直通过强化学习技术训练机器人玩游戏,也一直是这一技术的全球引领者。昨天,OpenAI发博客宣布了深度强化学习教学资源集的正式发布。“Spinning Up in Deep RL”项目内含教程、清晰的RL代码示例、课程习题、文档等同步学习资料,称旨在让任何人学习成为深度强化学习的熟练实践者。




在DEEP RL中迈出第一步


在博客中,OpenAI强调了深度强化学习的重要性,虽然市面上有非常多的资源帮助人们快速学习这些知识。但是深入下去还是会遇到非常多的困难。OpenAI发布的Spinning Up能够帮助人们学习使用这些人工智能技术并培养对人工智能的直觉。

据悉,这个项目的设计灵感,来自于和OpenAI学者和研究员计划的合作。OpenAI观察到,机器学习非常小白的玩家,如果在一开始能够获得正确的指导和资源,就会在短时间大幅度提升他的专业能力。

Spinning Up in Deep RL 还能够为一些跨学科的领域提供帮助,例如人工智能安全,不光需要强化学习,还需要其他学科技能的辅助。


OpenAI认为,了解RL算法最好的方法是在代码中运行一遍,通过借助Spinning Up,代码编写变得会更加简单:



代码示例:python -m spinup.run ppo --env CartPole-v1 --exp_name hello_world


Spinning Up实现了与Classic Control,Box2D或MuJoCo任务套件中的Gym环境兼容。OpenAI还为新手设计了Spinning Up的代码。简洁,友好,易于学习的设计使得小白更容易上手。OpenAI目标是避免通常存在于深度RL库中的抽象和混淆层。并且对代码进行了注释,以便编程者更加了解所使用的代码。

Spinning Up in Deep RL项目 主要由以下几部分组成:

RL术语,各种算法和基本理论的简短介绍。一篇关于如何成长为RL研究员的文章。按主题分类的重要论文的精选清单。详细记录了关键算法的文档、使用其可以独立实现代码,包括: Vanilla Policy Gradient (VPG), Trust Region Policy Optimization (TRPO), Proximal Policy Optimization (PPO), Deep Deterministic Policy Gradient (DDPG), Twin Delayed DDPG (TD3), and Soft Actor-Critic (SAC).当然,为了实践需要,还有一些必不可少的练习。


OpenAI开启全球教育计划

OpenAI也通过这一项目宣告了一个全球教育计划的开启,“Spinning Up in Deep RL只是OpenAI新教育计划的一部分,在一定程度上是对OpenAI愿景的延伸:创建一个全球的社区,共同应对AGI的挑战。OpenAI希望利用这个项目帮助迅速推进安全且广泛有益的人工智能。



2019年2月2日,在旧金山OpenA将会I举办一场关于Spinning Up in Deep RL的研讨会。研讨会将包括3小时的讲座和5小时的半结构化黑客攻击,项目开发和分组会议,研讨会期间OpenAI技术人员全程指导。

奉上工作坊报名链接,旧金山的读者可以顺路一看哦:

https://docs.google.com/forms/d/e/1FAIpQLSdWbG3H3JYC2Vp-bC1yeP1SL_DSi6laLNjW1RjvEEzlA1V6rg/viewform

OpenAI也欢迎更多人参与这一教育项目,并开放了相关工作职位

https://openai.com/jobs/

OpenAI称还将与其他组织合作,帮助他们开展教育计划,包括加州大学伯克利分校的人类兼容人工智能中心(CHAI)。


最后,附上这一课程项目的完整内容表



版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除

猜你喜欢

  • OpenAI开课了!深度强化学习最全课程包,教程、代码、一网打尽

    OpenAI开课了!深度强化学习最全课程包,教程、代码、一网打尽

    大数据文摘出品作者:魏子敏、蒋宝尚继谷歌和微软的人工智能实践课程后,Elon Musk和Sam Al

    来源:中国自考网 2024-06-12
  • 46级成绩按最新的来算?在网上仅保留2年?

    46级成绩按最新的来算?在网上仅保留2年?

    12月四六级成绩查询时间为:2月26号(正月十五)上午10点。随着成绩公布时间确定,小伙伴们也有了各

    来源:中国自考网 2024-06-12
  • 1.确定报考的思路 确定报考的思路

    1.确定报考的思路 确定报考的思路

    1.确定报考的思路确定报考的思路,提前准备好两个方案,分别是学校优先和专业优先等成,如果你的分数可以

    来源:中国自考网 2024-06-12
  • 免试专升本的条件和报名时间

    免试专升本的条件和报名时间

    免试专升本是一种特殊的升学途径,针对贫困家庭、技能大赛获奖学生、退役士兵等,实行免试或者优先录取的鼓

    来源:中国自考网 2024-06-12
  • 开放大学是什么大学,毕业后是什么学历?

    开放大学是什么大学,毕业后是什么学历?

    最近几年,开放大学逐渐进入人们的视野,开始成为在职者提升学历的首选学习形式。但开放大学是什么大学,开

    来源:中国自考网 2024-06-12
  • 长春早期教育职业学院奖学金多少钱

    长春早期教育职业学院奖学金多少钱

    今天,小编为大家带了长春早期教育职业学院奖学金多少钱 长春早期教育职业学院奖学金设置情况,希望能帮助到广大考生和家长,一起来看看吧!一、长春早期教育职业学院奖学金多少钱

    来源:中国自考网 2024-06-12
  • 宝鸡三和职业学院奖学金多少钱

    宝鸡三和职业学院奖学金多少钱

    今天,小编为大家带了宝鸡三和职业学院奖学金多少钱 宝鸡三和职业学院奖学金设置情况,希望能帮助到广大考生和家长,一起来看看吧!一、宝鸡三和职业学院奖学金多少钱:二、宝鸡三和

    来源:中国自考网 2024-06-12
  • 濮阳石油化工职业技术学院奖学金多少钱

    濮阳石油化工职业技术学院奖学金多少钱

    今天,小编为大家带了濮阳石油化工职业技术学院奖学金多少钱 濮阳石油化工职业技术学院奖学金设置情况,希望能帮助到广大考生和家长,一起来看看吧!一、濮阳石油化工职业技术学院

    来源:中国自考网 2024-06-12
  • 河南女子职业学院奖学金多少钱

    河南女子职业学院奖学金多少钱

    今天,小编为大家带了河南女子职业学院奖学金多少钱 河南女子职业学院奖学金设置情况,希望能帮助到广大考生和家长,一起来看看吧!一、河南女子职业学院奖学金多少钱: 高考 填报志

    来源:中国自考网 2024-06-12
  • 福建技术师范学院奖学金多少钱

    福建技术师范学院奖学金多少钱

    今天,小编为大家带了福建技术师范学院奖学金多少钱 福建技术师范学院奖学金设置情况,希望能帮助到广大考生和家长,一起来看看吧!一、福建技术师范学院奖学金多少钱: 高考 填

    来源:中国自考网 2024-06-12