强化学习必修课：引领人工智能新时代

强化学习必修课：引领人工智能新时代 - 果核剥壳

2024年6月19日下午12:12 • 学习视频

ch*tg*t的大火让很多人见识到了强化学习的强大,一个简单的rlhf原来可以做到这么牛逼!这恰恰就是强化学习的魅力了.本课程大家将了解到强化学习在机器人控制、自动驾驶、推荐系统等领域的应用和前景。同时，梗直哥瞿炜还将带领大家探讨强化学习与其他人工智能技术的结合，如自然语言处理、计算机视觉等，这些技术的结合将为智能时代带来更加广阔的发展空间

课程目录

强化学习必修课：引领智能新时代
├─ 1_1-1-课程内容和理念.mp4
├─ 1_10-1-基于模型的强化学习核心思想和原理.mp4
├─ 1_11-1模仿学习.mp4
├─ 1_12-1-项目实战：Gym游戏.mp4
├─ 1_2-1-线性代数.mp4
├─ 1_3-1-CUDA+Anaconda深度学习环境配置.mp4
├─ 1_4-1-序列建模与概率图模型.mp4
├─ 1_5-1-动态回归核心思想和原理.mp4
├─ 1_6-1-蒙特卡洛方法.mp4
├─ 1_7-1-深度Q网络核心思想和原理.mp4
├─ 1_8-1-策略梯度核心思想和原理.mp4
├─ 1_9-1-演员评论家算法核心思想和原理.mp4
├─ 2_1-2-认识强化学习.mp4
├─ 2_10-2-Dyna-Q算法.mp4
├─ 2_11-2-博弈论与强化学习.mp4
├─ 2_12-2-项目实战：大模型RLHF.mp4
├─ 2_2-2-微积分.mp4
├─ 2_3-2-conda使用命令.mp4
├─ 2_4-2-马尔可夫观测过程：学会“看”.mp4
├─ 2_5-2-策略迭代.mp4
├─ 2_6-2-时序差分方法.mp4
├─ 2_7-2-DQN-代码实现.mp4
├─ 2_8-2-蒙特卡洛策略梯度.mp4
├─ 2_9-2-改进型演员评论家算法.mp4
├─ 3_1-3-课程使用的技术栈.mp4
├─ 3_10-3-Dyna-Q算法代码实现.mp4
├─ 3_11-3-多智能体强化学习.mp4
├─ 3_12-3-强化学习最新发展趋势.mp4
├─ 3_2-3-概率.mp4
├─ 3_3-3-Jupyter-Notebook快速上手.mp4
├─ 3_4-3-马尔可夫决策过程：试着-“干”.mp4
├─ 3_5-3-价值迭代.mp4
├─ 3_6-3-蒙特卡洛方法和时序差分代码实现.mp4
├─ 3_7-3-常见问题改进和扩展.mp4
├─ 3_8-3-策略梯度方法代码实现.mp4
├─ 3_9-3-演员评论家算法代码实现.mp4
├─ 4_10-4-基于模型的策略优化.mp4
├─ 4_11-4-MADDP的代码实现.mp4
├─ 4_12-4-下一步的学习建议.mp4
├─ 4_3-4-仿真环境Gym安装.mp4
├─ 4_4-4-马尔可夫奖励过程：懂得“想”.mp4
├─ 4_5-4-动态规划代码实现.mp4
├─ 4_6-4-广义策略迭代.mp4
├─ 4_7-4-DQN改进算法代码实现.mp4
├─ 4_8-4-近端策略优化算法.mp4
├─ 4_9-4-深度确定性策略梯度.mp4
├─ 5_10-5-MBPO的代码实现.mp4
├─ 5_11-5-AlphaStar系统.mp4
├─ 5_3-5-深度学习库PyTorch的安装.mp4
├─ 5_4-5-贝尔曼方程：迭代求解价值函数.mp4
├─ 5_6-5-Q-Learning算法.mp4
├─ 5_8-5-近端策略优化（PPO）代码实现.mp4
├─ 5_9-5-DDPG算法代码实现.mp4
├─ 6_11-6-基于人类反馈大强化学习.mp4
├─ 6_4-6-模型分类与选择itdjs_com.mp4
├─ 6_6-6-SARSA算法.mp4
├─ 6_9-6-软性演员评论家算法.mp4
├─ 7_4-7-常见问题解析.mp4
├─ 7_6-7-Q-Learning&SARSA代码实现.mp4
├─ 7_9-7-SAC代码实现.mp4
└─ 8_4-8-马尔可夫过程代码实现.mp4

下载地址

隐藏内容，VIP可见

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

Ultraman 2025年3月28日

可以再弄一下arm64的链接吗？我一直没找到感谢

评论于 Microsoft Edge v134.0.3124.93 离线安装包
后来乀 2025年3月28日

不用导，直接再打开旧版的微信就好了，新版的是复制，不会删除旧的

评论于微信PC v4.0.2.22 绿色版
hjlw2004 2025年3月28日

无法完成安装。

评论于 Autodesk CAD v2026.0.0 高级版
猴啊 2025年3月28日

180天

评论于 Microsoft Activation Scripts v3.0 官方版/汉化版
Aeon Lau 2025年3月28日

我只知道按你的定义，你们俩都是老古董

评论于安卓闭源的谣言，反而利好了谁？
将夜 2025年3月28日

建议你去查查事实的定义是什么

评论于安卓闭源的谣言，反而利好了谁？
Aeon Lau 2025年3月28日

Win10的老古董认清现实吧，他说的就是事实

评论于安卓闭源的谣言，反而利好了谁？
将夜 2025年3月28日

用安卓11的老古董，睁眼看看世界吧

评论于安卓闭源的谣言，反而利好了谁？
将夜 2025年3月28日

张嘴就来，鸿蒙出来多少年了你们这群人还是反反复复这一句是吧？

评论于安卓闭源的谣言，反而利好了谁？
T哥 2025年3月28日

激活用MAS，microsoft activation script，不知道拼对了没，大概这样

评论于 Office 2024 批量许可版25年03月更新版

强化学习必修课：引领人工智能新时代 - 果核剥壳

课程目录

下载地址

相关推荐

发表回复

分享到：