郭震 AI公众号:郭震AI

最近更新:

分类: 图文节点

阅读次数: 0

返回图解索引

图文节点索引

强化学习入门图文节点

按文章顺序整理流程、配置、判断和复盘位置。点开任意条目,会直接进入原文对应图文位置。

图文节点
168
教程文章
28
可读条目
168
最近更新
2026-06-04

文章快速定位

先跳到这一系列里的某一篇

28 篇文章
  1. 强化学习核心idea总结- 篇 · 6 个节点
  2. 强化学习导论:强化学习的基本概念和历史1 篇 · 6 个节点
  3. 强化学习导论之强化学习与监督学习的区别2 篇 · 6 个节点
  4. 强化学习导论之强化学习的应用领域3 篇 · 6 个节点
  5. Markov决策过程(MDP)的定义与基本要素4 篇 · 6 个节点
  6. Markov决策过程之状态、动作和奖励5 篇 · 6 个节点
  7. 强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数6 篇 · 6 个节点
  8. 动态规划的基本思想和框架7 篇 · 6 个节点
  9. 强化学习从零学教程系列之动态规划之值迭代算法8 篇 · 6 个节点
  10. 动态规划之策略迭代算法9 篇 · 6 个节点
  11. 蒙特卡罗方法的基本原理10 篇 · 6 个节点
  12. 蒙特卡罗控制方法概述11 篇 · 6 个节点
  13. 强化学习中的蒙特卡罗方法:区间估计12 篇 · 6 个节点
  14. 时序差分学习介绍13 篇 · 6 个节点
  15. 强化学习之SARSA算法14 篇 · 6 个节点
  16. 时序差分学习之Q学习的原理与实现15 篇 · 6 个节点
  17. Q学习的详细讲解16 篇 · 6 个节点
  18. 强化学习之Q学习:探索与利用的权衡17 篇 · 6 个节点
  19. 近似Q学习18 篇 · 6 个节点
  20. 深度强化学习之深度学习在强化学习中的应用19 篇 · 6 个节点
  21. 深度强化学习之DQN算法20 篇 · 6 个节点
  22. 深度强化学习之经验回放21 篇 · 6 个节点
  23. 策略梯度的基本概念22 篇 · 6 个节点
  24. REINFORCE算法23 篇 · 6 个节点
  25. 强化学习中的优势函数24 篇 · 6 个节点
  26. 强化学习在游戏中的应用25 篇 · 6 个节点
  27. 应用案例之强化学习在机器人中的应用26 篇 · 6 个节点
  28. 强化学习的未来发展27 篇 · 6 个节点

系列清单

按文章顺序进入具体图文位置

168 个节点
  1. 强化学习核心idea总结

    - 篇 · 6 个节点 · 2.3k 字 · 2026-06-04

    打开文章
    1. 强化学习核心idea总结结构图预览图文 1强化学习核心idea总结结构图
    2. 强化学习核心idea总结核对图预览图文 2强化学习核心idea总结核对图
    3. 强化学习问题判断卡预览图文 3强化学习问题判断卡
    4. 强化学习学习重点卡预览图文 4强化学习学习重点卡
    5. 强化学习核心idea总结应用复盘卡预览图文 5强化学习核心idea总结应用复盘卡
    6. 强化学习核心idea总结应用检查卡预览图文 6强化学习核心idea总结应用检查卡
  2. 强化学习导论:强化学习的基本概念和历史

    1 篇 · 6 个节点 · 1.8k 字 · 2026-06-04

    打开文章
    1. 强化学习导论:强化学习的基本概念和历史结构图预览图文 1强化学习导论:强化学习的基本概念和历史结构图
    2. 强化学习导论:强化学习的基本概念和历史核对图预览图文 2强化学习导论:强化学习的基本概念和历史核对图
    3. 强化学习基本概念判断卡预览图文 3强化学习基本概念判断卡
    4. 强化学习核心脉络卡预览图文 4强化学习核心脉络卡
    5. 强化学习导论:强化学习的基本概念和历史应用复盘卡预览图文 5强化学习导论:强化学习的基本概念和历史应用复盘卡
    6. 强化学习导论:强化学习的基本概念和历史应用检查卡预览图文 6强化学习导论:强化学习的基本概念和历史应用检查卡
  3. 强化学习导论之强化学习与监督学习的区别

    2 篇 · 6 个节点 · 1.5k 字 · 2026-06-04

    打开文章
    1. 强化学习导论之强化学习与监督学习的区别结构图预览图文 1强化学习导论之强化学习与监督学习的区别结构图
    2. 强化学习导论之强化学习与监督学习的区别核对图预览图文 2强化学习导论之强化学习与监督学习的区别核对图
    3. 强化学习与监督学习区别判断卡预览图文 3强化学习与监督学习区别判断卡
    4. 强化学习应用拆解卡预览图文 4强化学习应用拆解卡
    5. 强化学习导论之强化学习与监督学习的区别应用复盘卡预览图文 5强化学习导论之强化学习与监督学习的区别应用复盘卡
    6. 强化学习导论之强化学习与监督学习的区别应用检查卡预览图文 6强化学习导论之强化学习与监督学习的区别应用检查卡
  4. 强化学习导论之强化学习的应用领域

    3 篇 · 6 个节点 · 1.5k 字 · 2026-06-04

    打开文章
    1. 强化学习导论之强化学习的应用领域结构图预览图文 1强化学习导论之强化学习的应用领域结构图
    2. 强化学习导论之强化学习的应用领域核对图预览图文 2强化学习导论之强化学习的应用领域核对图
    3. 强化学习应用领域判断卡预览图文 3强化学习应用领域判断卡
    4. 强化学习方法落地卡预览图文 4强化学习方法落地卡
    5. 强化学习导论之强化学习的应用领域应用复盘卡预览图文 5强化学习导论之强化学习的应用领域应用复盘卡
    6. 强化学习导论之强化学习的应用领域应用检查卡预览图文 6强化学习导论之强化学习的应用领域应用检查卡
  5. Markov决策过程(MDP)的定义与基本要素

    4 篇 · 6 个节点 · 1.6k 字 · 2026-06-04

    打开文章
    1. Markov决策过程(MDP)的定义与基本要素结构图预览图文 1Markov决策过程(MDP)的定义与基本要素结构图
    2. Markov决策过程(MDP)的定义与基本要素核对图预览图文 2Markov决策过程(MDP)的定义与基本要素核对图
    3. MDP基本要素判断卡预览图文 3MDP基本要素判断卡
    4. 强化学习实践复盘卡预览图文 4强化学习实践复盘卡
    5. Markov决策过程(MDP)的定义与基本要素应用复盘卡预览图文 5Markov决策过程(MDP)的定义与基本要素应用复盘卡
    6. Markov决策过程(MDP)的定义与基本要素应用检查卡预览图文 6Markov决策过程(MDP)的定义与基本要素应用检查卡
  6. Markov决策过程之状态、动作和奖励

    5 篇 · 6 个节点 · 1.4k 字 · 2026-06-04

    打开文章
    1. Markov决策过程之状态、动作和奖励结构图预览图文 1Markov决策过程之状态、动作和奖励结构图
    2. Markov决策过程之状态、动作和奖励核对图预览图文 2Markov决策过程之状态、动作和奖励核对图
    3. 强化学习状态动作奖励判断卡预览图文 3强化学习状态动作奖励判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. Markov决策过程之状态、动作和奖励应用复盘卡预览图文 5Markov决策过程之状态、动作和奖励应用复盘卡
    6. Markov决策过程之状态、动作和奖励应用检查卡预览图文 6Markov决策过程之状态、动作和奖励应用检查卡
    1. 强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数结构图预览图文 1强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数结构图
    2. 强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数核对图预览图文 2强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数核对图
    3. 折扣因子价值函数判断卡预览图文 3折扣因子价值函数判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数应用复盘卡预览图文 5强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数应用复盘卡
    6. 强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数应用检查卡预览图文 6强化学习从零学教程系列:Markov决策过程之折扣因子与价值函数应用检查卡
  7. 动态规划的基本思想和框架

    7 篇 · 6 个节点 · 1.5k 字 · 2026-06-04

    打开文章
    1. 动态规划的基本思想和框架结构图预览图文 1动态规划的基本思想和框架结构图
    2. 动态规划的基本思想和框架核对图预览图文 2动态规划的基本思想和框架核对图
    3. 动态规划的基本思想和框架应用检查卡预览图文 3动态规划的基本思想和框架应用检查卡
    4. 动态规划的基本思想和框架应用复盘卡预览图文 4动态规划的基本思想和框架应用复盘卡
    5. 动态规划强化学习判断卡预览图文 5动态规划强化学习判断卡
    6. 强化学习阅读地图卡预览图文 6强化学习阅读地图卡
    1. 强化学习从零学教程系列之动态规划之值迭代算法结构图预览图文 1强化学习从零学教程系列之动态规划之值迭代算法结构图
    2. 强化学习从零学教程系列之动态规划之值迭代算法核对图预览图文 2强化学习从零学教程系列之动态规划之值迭代算法核对图
    3. 值迭代算法判断卡预览图文 3值迭代算法判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习从零学教程系列之动态规划之值迭代算法应用复盘卡预览图文 5强化学习从零学教程系列之动态规划之值迭代算法应用复盘卡
    6. 强化学习从零学教程系列之动态规划之值迭代算法应用检查卡预览图文 6强化学习从零学教程系列之动态规划之值迭代算法应用检查卡
  8. 动态规划之策略迭代算法

    9 篇 · 6 个节点 · 1.3k 字 · 2026-06-04

    打开文章
    1. 动态规划之策略迭代算法结构图预览图文 1动态规划之策略迭代算法结构图
    2. 动态规划之策略迭代算法核对图预览图文 2动态规划之策略迭代算法核对图
    3. 策略迭代算法判断卡预览图文 3策略迭代算法判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 动态规划之策略迭代算法应用复盘卡预览图文 5动态规划之策略迭代算法应用复盘卡
    6. 动态规划之策略迭代算法应用检查卡预览图文 6动态规划之策略迭代算法应用检查卡
  9. 蒙特卡罗方法的基本原理

    10 篇 · 6 个节点 · 1.9k 字 · 2026-06-04

    打开文章
    1. 蒙特卡罗方法的基本原理结构图预览图文 1蒙特卡罗方法的基本原理结构图
    2. 蒙特卡罗方法的基本原理核对图预览图文 2蒙特卡罗方法的基本原理核对图
    3. 蒙特卡罗方法判断卡预览图文 3蒙特卡罗方法判断卡
    4. 蒙特卡罗方法的基本原理应用检查卡预览图文 4蒙特卡罗方法的基本原理应用检查卡
    5. 蒙特卡罗方法的基本原理应用复盘卡预览图文 5蒙特卡罗方法的基本原理应用复盘卡
    6. 强化学习阅读地图卡预览图文 6强化学习阅读地图卡
  10. 蒙特卡罗控制方法概述

    11 篇 · 6 个节点 · 1.4k 字 · 2026-06-04

    打开文章
    1. 蒙特卡罗控制方法概述结构图预览图文 1蒙特卡罗控制方法概述结构图
    2. 蒙特卡罗控制方法概述核对图预览图文 2蒙特卡罗控制方法概述核对图
    3. 蒙特卡罗控制方法判断卡预览图文 3蒙特卡罗控制方法判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 蒙特卡罗控制方法概述应用复盘卡预览图文 5蒙特卡罗控制方法概述应用复盘卡
    6. 蒙特卡罗控制方法概述应用检查卡预览图文 6蒙特卡罗控制方法概述应用检查卡
  11. 强化学习中的蒙特卡罗方法:区间估计

    12 篇 · 6 个节点 · 1.5k 字 · 2026-06-04

    打开文章
    1. 强化学习中的蒙特卡罗方法:区间估计结构图预览图文 1强化学习中的蒙特卡罗方法:区间估计结构图
    2. 强化学习中的蒙特卡罗方法:区间估计核对图预览图文 2强化学习中的蒙特卡罗方法:区间估计核对图
    3. 蒙特卡罗区间估计判断卡预览图文 3蒙特卡罗区间估计判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习中的蒙特卡罗方法:区间估计应用复盘卡预览图文 5强化学习中的蒙特卡罗方法:区间估计应用复盘卡
    6. 强化学习中的蒙特卡罗方法:区间估计应用检查卡预览图文 6强化学习中的蒙特卡罗方法:区间估计应用检查卡
  12. 时序差分学习介绍

    13 篇 · 6 个节点 · 1.4k 字 · 2026-06-04

    打开文章
    1. 时序差分学习介绍结构图预览图文 1时序差分学习介绍结构图
    2. 时序差分学习介绍核对图预览图文 2时序差分学习介绍核对图
    3. 时序差分学习判断卡预览图文 3时序差分学习判断卡
    4. 时序差分学习复盘卡预览图文 4时序差分学习复盘卡
    5. 时序差分学习介绍应用复盘卡预览图文 5时序差分学习介绍应用复盘卡
    6. 时序差分学习介绍应用检查卡预览图文 6时序差分学习介绍应用检查卡
  13. 强化学习之SARSA算法

    14 篇 · 6 个节点 · 1.6k 字 · 2026-06-04

    打开文章
    1. 强化学习之SARSA算法结构图预览图文 1强化学习之SARSA算法结构图
    2. 强化学习之SARSA算法核对图预览图文 2强化学习之SARSA算法核对图
    3. SARSA算法判断卡预览图文 3SARSA算法判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习之SARSA算法应用复盘卡预览图文 5强化学习之SARSA算法应用复盘卡
    6. 强化学习之SARSA算法应用检查卡预览图文 6强化学习之SARSA算法应用检查卡
  14. 时序差分学习之Q学习的原理与实现

    15 篇 · 6 个节点 · 1.5k 字 · 2026-06-04

    打开文章
    1. 时序差分学习之Q学习的原理与实现结构图预览图文 1时序差分学习之Q学习的原理与实现结构图
    2. 时序差分学习之Q学习的原理与实现核对图预览图文 2时序差分学习之Q学习的原理与实现核对图
    3. Q学习原理实现判断卡预览图文 3Q学习原理实现判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 时序差分学习之Q学习的原理与实现应用复盘卡预览图文 5时序差分学习之Q学习的原理与实现应用复盘卡
    6. 时序差分学习之Q学习的原理与实现应用检查卡预览图文 6时序差分学习之Q学习的原理与实现应用检查卡
  15. Q学习的详细讲解

    16 篇 · 6 个节点 · 1.7k 字 · 2026-06-04

    打开文章
    1. Q学习的详细讲解结构图预览图文 1Q学习的详细讲解结构图
    2. Q学习的详细讲解核对图预览图文 2Q学习的详细讲解核对图
    3. Q学习详细讲解判断卡预览图文 3Q学习详细讲解判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. Q学习的详细讲解应用复盘卡预览图文 5Q学习的详细讲解应用复盘卡
    6. Q学习的详细讲解应用检查卡预览图文 6Q学习的详细讲解应用检查卡
  16. 强化学习之Q学习:探索与利用的权衡

    17 篇 · 6 个节点 · 1.6k 字 · 2026-06-04

    打开文章
    1. 强化学习之Q学习:探索与利用的权衡结构图预览图文 1强化学习之Q学习:探索与利用的权衡结构图
    2. 强化学习之Q学习:探索与利用的权衡核对图预览图文 2强化学习之Q学习:探索与利用的权衡核对图
    3. 探索利用权衡判断卡预览图文 3探索利用权衡判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习之Q学习:探索与利用的权衡应用复盘卡预览图文 5强化学习之Q学习:探索与利用的权衡应用复盘卡
    6. 强化学习之Q学习:探索与利用的权衡应用检查卡预览图文 6强化学习之Q学习:探索与利用的权衡应用检查卡
  17. 近似Q学习

    18 篇 · 6 个节点 · 1.5k 字 · 2026-06-04

    打开文章
    1. 近似Q学习结构图预览图文 1近似Q学习结构图
    2. 近似Q学习核对图预览图文 2近似Q学习核对图
    3. 近似Q学习判断卡预览图文 3近似Q学习判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 近似Q学习应用复盘卡预览图文 5近似Q学习应用复盘卡
    6. 近似Q学习应用检查卡预览图文 6近似Q学习应用检查卡
  18. 深度强化学习之深度学习在强化学习中的应用

    19 篇 · 6 个节点 · 1.7k 字 · 2026-06-04

    打开文章
    1. 深度强化学习之深度学习在强化学习中的应用结构图预览图文 1深度强化学习之深度学习在强化学习中的应用结构图
    2. 深度强化学习之深度学习在强化学习中的应用核对图预览图文 2深度强化学习之深度学习在强化学习中的应用核对图
    3. 深度强化学习应用判断卡预览图文 3深度强化学习应用判断卡
    4. 深度强化学习之深度学习在强化学习中的应用应用复盘卡预览图文 4深度强化学习之深度学习在强化学习中的应用应用复盘卡
    5. 深度强化学习之深度学习在强化学习中的应用应用检查卡预览图文 5深度强化学习之深度学习在强化学习中的应用应用检查卡
    6. 强化学习阅读地图卡预览图文 6强化学习阅读地图卡
  19. 深度强化学习之DQN算法

    20 篇 · 6 个节点 · 1.7k 字 · 2026-06-04

    打开文章
    1. 深度强化学习之DQN算法结构图预览图文 1深度强化学习之DQN算法结构图
    2. 深度强化学习之DQN算法核对图预览图文 2深度强化学习之DQN算法核对图
    3. DQN算法判断卡预览图文 3DQN算法判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 深度强化学习之DQN算法应用复盘卡预览图文 5深度强化学习之DQN算法应用复盘卡
    6. 深度强化学习之DQN算法应用检查卡预览图文 6深度强化学习之DQN算法应用检查卡
  20. 深度强化学习之经验回放

    21 篇 · 6 个节点 · 1.6k 字 · 2026-06-04

    打开文章
    1. 深度强化学习之经验回放结构图预览图文 1深度强化学习之经验回放结构图
    2. 深度强化学习之经验回放核对图预览图文 2深度强化学习之经验回放核对图
    3. 经验回放判断卡预览图文 3经验回放判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 深度强化学习之经验回放应用复盘卡预览图文 5深度强化学习之经验回放应用复盘卡
    6. 深度强化学习之经验回放应用检查卡预览图文 6深度强化学习之经验回放应用检查卡
  21. 策略梯度的基本概念

    22 篇 · 6 个节点 · 1.6k 字 · 2026-06-04

    打开文章
    1. 策略梯度的基本概念结构图预览图文 1策略梯度的基本概念结构图
    2. 策略梯度的基本概念核对图预览图文 2策略梯度的基本概念核对图
    3. 策略梯度的基本概念要点判断卡预览图文 3策略梯度的基本概念要点判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 策略梯度的基本概念应用复盘卡预览图文 5策略梯度的基本概念应用复盘卡
    6. 策略梯度的基本概念应用检查卡预览图文 6策略梯度的基本概念应用检查卡
  22. REINFORCE算法

    23 篇 · 6 个节点 · 1.4k 字 · 2026-06-04

    打开文章
    1. REINFORCE算法结构图预览图文 1REINFORCE算法结构图
    2. REINFORCE算法核对图预览图文 2REINFORCE算法核对图
    3. REINFORCE算法要点判断卡预览图文 3REINFORCE算法要点判断卡
    4. REINFORCE算法应用复盘卡预览图文 4REINFORCE算法应用复盘卡
    5. REINFORCE算法应用检查卡预览图文 5REINFORCE算法应用检查卡
    6. 强化学习阅读地图卡预览图文 6强化学习阅读地图卡
  23. 强化学习中的优势函数

    24 篇 · 6 个节点 · 1.5k 字 · 2026-06-04

    打开文章
    1. 强化学习中的优势函数结构图预览图文 1强化学习中的优势函数结构图
    2. 强化学习中的优势函数核对图预览图文 2强化学习中的优势函数核对图
    3. 强化学习中的优势函数要点判断卡预览图文 3强化学习中的优势函数要点判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习中的优势函数应用复盘卡预览图文 5强化学习中的优势函数应用复盘卡
    6. 强化学习中的优势函数应用检查卡预览图文 6强化学习中的优势函数应用检查卡
  24. 强化学习在游戏中的应用

    25 篇 · 6 个节点 · 2.0k 字 · 2026-06-04

    打开文章
    1. 强化学习在游戏中的应用结构图预览图文 1强化学习在游戏中的应用结构图
    2. 强化学习在游戏中的应用核对图预览图文 2强化学习在游戏中的应用核对图
    3. 强化学习在游戏中的应用要点判断卡预览图文 3强化学习在游戏中的应用要点判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习在游戏中的应用应用复盘卡预览图文 5强化学习在游戏中的应用应用复盘卡
    6. 强化学习在游戏中的应用应用检查卡预览图文 6强化学习在游戏中的应用应用检查卡
  25. 应用案例之强化学习在机器人中的应用

    26 篇 · 6 个节点 · 1.6k 字 · 2026-06-04

    打开文章
    1. 应用案例之强化学习在机器人中的应用结构图预览图文 1应用案例之强化学习在机器人中的应用结构图
    2. 应用案例之强化学习在机器人中的应用核对图预览图文 2应用案例之强化学习在机器人中的应用核对图
    3. 应用案例之强化学习在机器人中的应用要点判断卡预览图文 3应用案例之强化学习在机器人中的应用要点判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 应用案例之强化学习在机器人中的应用应用复盘卡预览图文 5应用案例之强化学习在机器人中的应用应用复盘卡
    6. 应用案例之强化学习在机器人中的应用应用检查卡预览图文 6应用案例之强化学习在机器人中的应用应用检查卡
  26. 强化学习的未来发展

    27 篇 · 6 个节点 · 1.7k 字 · 2026-06-04

    打开文章
    1. 强化学习的未来发展结构图预览图文 1强化学习的未来发展结构图
    2. 强化学习的未来发展核对图预览图文 2强化学习的未来发展核对图
    3. 强化学习的未来发展要点判断卡预览图文 3强化学习的未来发展要点判断卡
    4. 强化学习阅读地图卡预览图文 4强化学习阅读地图卡
    5. 强化学习的未来发展应用复盘卡预览图文 5强化学习的未来发展应用复盘卡
    6. 强化学习的未来发展应用检查卡预览图文 6强化学习的未来发展应用检查卡