• 首页
  • 宝藏大会员
  • OJ刷题
  • 积分商城
  • AI助教
  • 海贼题库
  • 潘多拉魔盒
    • Leetcode(在线刷面试算法)
    • 牛客网(面试真题测评)
    • C/CPP 参考手册(在线文档+运行环境)
    • ProjectEuler(英文原站)
    • ProjectEuler(中英对照)
  • 首页
  • 宝藏大会员
  • OJ刷题
  • 积分商城
  • AI助教
    • 海贼题库
    • 潘多拉魔盒
      • Leetcode(在线刷面试算法)
      • 牛客网(面试真题测评)
      • C/CPP 参考手册(在线文档+运行环境)
      • ProjectEuler(英文原站)
      • ProjectEuler(中英对照)
    • 登录
    • 注册
  • 登录
  • 注册

成为深度强化学习算法专家

简介
分类
AI 算法
课程标签: 项目实践 框架学习
查看课程

任务列表

  • 第1-1任务: 强化学习概论
  • 第1-2任务: 强化学习概论
  • 第2-1任务: 强化学习问题描述
  • 第2-2任务: 第二节课
  • 第3-1任务: 强化学习问题求解
  • 第3-2任务: 第三节课
  • 第4-1任务: 动态规划
  • 第4-2任务: 第四节课
  • 第5-1任务: 蒙特卡洛方法
  • 第5-2任务: 第五节课
  • 第6-1任务: 时间差分方法
  • 第6-2任务: 第六节课
  • 第6-3任务: 老师提的代码
  • 第7-1任务: 项目实战:OpenAI Gym 实现倒立摆
  • 第7-2任务: AI-intro-NN 2021
  • 第7-3任务: AI-intro-NN 2021_Papercritique 1
  • 第7-4任务: AI-intro-NN 2021_Papercritique 2
  • 第8-1任务: 深度学习
  • 第8-2任务: AI-intro-NN 2021
  • 第9-1任务: 深度Q-Learning
  • 第9-2任务: NN - Solutions_problem sets - ga and nn
  • 第9-3任务: NN - Solutions
  • 第9-4任务: NN - Solutions
  • 第10-1任务: 项目实战:基于深度强化学习的智能红绿灯控制
  • 第10-2任务: RL-tsc(1).zip
  • 第10-3任务: IEEE ITSC‘20 Tutorial
  • 第11-1任务: 策略梯度方法
  • 第11-2任务: 第十一节课
  • 第12-1任务: 策略梯度方法进阶
  • 第12-2任务: 第十二节课
  • 第13-1任务: 基于模型的强化学习
  • 第13-2任务: modelbasedRL.zip
  • 第14任务: 项目实战:基于深度强化学习的自动驾驶决策规划
Powered by EduSoho v22.3.2 ©2014-2025 课程存档
课程内容版权均归 海贼宝藏 所有
黑ICP备17003169号-1