Warning: session_start() expects parameter 1 to be array, string given in /www/wwwroot/blog/wp-includes/class-wp-hook.php on line 288
机器学习 | 野风
  • 欢迎访问我的个人博客,如遇博客图片无法显示,请用IE浏览器访问。
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧!

标签:机器学习

强化学习——从Q-Learning到DQN到底发生了什么?

学习目标 复习Q-Learning; 理解什么是值函数近似(Function Approximation); 理解什么是DQN,弄清它和Q-Learning的区别是什么。 用Q-Learning解决经典迷宫问题 现有一个5房间的房子,如图1所示,房间与房间之间通过门连接,编号0到4,5号是房子外边,即我们的终点。我们将agent随机放在任一房间内,每打开……

强化学习——时序差分算法

学习目标 理解TD(0)的预测(prediction)问题; On-policy控制(control)算法SARSA; Off-policy控制(control)算法Q-learning; TD算法相对于MC算法和DP算法的优势; 简介 这次要介绍的时序差分(Temporal-Difference)算法应该是强化学习中最为核心的算法了,它结合了前面讲到的……

强化学习——蒙特卡洛方法

学习目标 理解Prediction和Control的差别; 理解什么是first-visit和every-visit; 理解什么是on-policy和off-policy; 理解蒙特卡洛方法的Prediction和Control问题; Prediction和Control 其实这两个名词在总结动态规划方法的文章中也提到过了,但是没有细说,这里再简单的说明……

K近邻算法(内附Kd-tree视频演示)

K近邻法(k-nearest neighbor,k-NN)是一种基本的分类与回归算法,其算法思想概括起来就是一句话——“近朱者赤,近墨者黑”。K-NN不具有显式的学习过程,而是利用训练数据集对特征向量空间进行划分,并作为其分类的“模型”。 学习k-NN算法,有三个基本要素:距离度量、k值选择和分类决策规则。 距离度量 ……

分类问题模型的评估

本文将以机器学习领域的"Hello World"数据集——MNIST为背景,来梳理一下关于分类问题模型评估的知识。分类问题有很多种,比如二分类(Binary Classification)、多类别分类(Multiclass Classification)、多类别分类(Multilabel Classification)和多输出分类(Multioutput ……

Machine Learning Project Checklist

今天要分享的东西是利用机器学习做数据分析时,我们可能需要做的一些步骤。不管是做什么任务,在开始之前有了清晰的框架和逻辑,往往做事效率会更高。一个机器学习的项目也是如此。 在学习机器学习之前我简单的学习了Python,以前我做的更多的是嵌入式的编程,都是用C在写。工欲善其事必先利其器,要学习机器学习,学习Python是有必要的。下面所提到的内容都……