详情

人工智能——Python强化学习算法与应用案例实践培训班

人工智能——Python强化学习算法与应用案例实践培训班

强化学习是近年来在人工智能技术中较高的一种研究方法，是一种接近人类及动物在大自然中所表现出的学习方式，通过人们不断实践和总结，形成了强化学习这一人工智能研究方法。

随着深度学习技术的流行，深度学习中的一些主流技术，如深度卷积神经网络、序列建模、记忆管理等与强化学习在许多应用场景上出现了结合点，例如使用DQN实现AI自动玩FlappyBird。强化学习技术目前仍面临训练环境与计算能力的瓶颈，相信随着科技的进一步发展，在未来十年它一定会成为人工智能领域的核心技术之一。本课程通过理论与案例实践相结合的方法，让学习者可以从最专业的角度来接触强化学习，学会使用这种先进的人工智能技术来应用于实际工作和学习中。

主办单位：北京市计算中心有限公司

参与方式：线上直播

课程安排：2022.9.1-2（周四-周五）上午9:30-11:30 下午13:30-17:00

日期

主题

内容

案例实践

第一天

上午

Python入门

1、Python基础

(1)Python下载

(2)Gym虚拟环境配置

(3)使用Gym搭建网格环境

强化学习入门

2、强化学习基本概念

3、强化学习与其他机器学习的关系

4、Gym实验环境基础知识

第一天

下午

强化学习算法入门

5、马尔可夫决策过程

6、动态规划

7、蒙特卡洛方法

8、时序差分

(4)使用策略迭代方法求解迷宫寻宝问题

(5)使用值迭代方法求解迷宫寻宝问题

(6)蒙特卡洛模拟Monty Hall(娱乐节目抽奖游戏)

(7)SARSA时序差分算法训练 CartPole

(8)Q-Learning算法求解复杂陷阱迷宫寻宝问题

第二天

上午

强化学习算法进阶

9、值函数逼近(DQN算法)

10、随机策略梯度(REINFORCE算法）

11、确定性策略梯度(DDPG算法）

12、AC算法及变种

(9)DQN实现“CartPole”平衡控制

(10)使用DQN实现AI自动玩FlappyBird

(11)REINFORCE训练小车爬坡

(12)DDPG算法训练机械臂抓取方块

(13)AC算法实现“CartPole”平衡控制

(14)Mario-Ai:使用A3C算法实现Mario

第二天

下午

强化学习综合实践

13、博弈强化学习

14、蒙特卡洛树搜索

15、AlphaGo基本原理

16、AlphaGo Zero原理

(15)PyGame实现“五子棋”游戏环境

(16)蒙特卡洛树搜索(MCTS)代码实现

(17)AlphaGo Zero算法实现人机对弈

注：内容以实际发生为准；若调，会提前通知。

【报名费用】

注册费：2800元/人（含当期听课费、资料费、证书费、考试费（如有））。提供当期视频回放以供复习使用（羽林学院平台）。

开具增值税发票，提供盖章通知、结业证书等相关材料。

注：本班可单报，亦可与本期推送其他班组合申报工信职业技术证书（“人工智能应用工程师”；高级）。

【报名优惠政策】

1、3人以上团体报名每人可减少300元；

2、4+1团报，可免费赠送一个名额；

3、上面优惠政策不能同时享受，只能享受其中一种；

老学员参加及推荐学员参加均可额外优惠200元。

【付费方式】

现金、支票、银行转账、银行汇款、现场刷卡

单位全称：北京市计算中心有限公司

账号：0200151819100023937

开户银行：中国工商银行股份有限公司北京自贸试验区永丰基地支行

（汇款信息备注：“智能计算——您的姓名”,个人汇款请备注单位名称）

注：款项支出后，请提供付款回执给工作人员，方便核实到账、开具发票。

【咨询请联系】

QQ号：3498448850

邮箱：bcc_peixun@163.com

张老师 18618295767（微信同号）

于老师 15621925881

【注】开始前三天会发送邮件通知；若未接到邮件通知，请电话咨询。

近期会议

联系我们

会务邮箱：
   bcc_peixun@163.com
会议网站：
   www.lvdouxuan.com
咨询电话：
   18618295767 （微信同号）
   15621925881
咨询QQ：
   3498448850

人工智能——Python强化学习算法与应用案例实践培训班

近期会议

联系我们

扫码关注更多会议

主页链接