• 欢迎访问我的个人博客,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站。
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧!
编程算法类

【附下载】刘知远老师2020年免费新书-《NLP中的表示学习》

【附下载】刘知远老师2020年免费新书-《NLP中的表示学习》
书籍简介 这本书概述了自然语言处理(NLP)的表示学习理论,算法和应用程序的最新进展。它分为三个部分。第一部分介绍了针对多种语言条目(包括单词,短语,句子和文档)的表示学习技术。然后,第二部分介绍了与NLP密切相关的那些对象的表示技术,包括基于实体的世界知识,基于义素的语言知识,网络和交叉模式条目。最后,第三部分提供了用于表示学习技术的开放资源工具,并讨论了……继续阅读 »

野风同学 2周前 (07-19) 106浏览 0评论 0个赞

电脑软件

有了这3个本地文件搜索工具,妈妈再也不担心我找不到文件了!

有了这3个本地文件搜索工具,妈妈再也不担心我找不到文件了!
Everything "Everything" 是 Windows 上一款搜索引擎,它能够基于文件名快速定文件和文件夹位置。不像 Windows 内置搜索,"Everything" 默认显示电脑上每个文件和文件夹 (就如其名 "Everything")。您在搜索框输入的关键词将会筛选显示的文件和文件夹。"Everything" 仅索引文件和文件夹名,一般仅需……继续阅读 »

野风同学 3周前 (07-15) 120浏览 0评论 0个赞

Python

用Python做一个"以图搜番"的应用程序,再也不用愁动漫图片的出处了!

用Python做一个
前言 喜欢看动漫的朋友们大概都能体会到一个难受的事情,就是在论坛或者群聊里面看到一张动漫截图,很想知道它的出处,但百度搜了一圈却也没有一个可靠结果,就很郁闷。今天就来带大家用Python做一个简单的“以图搜番”小应用。应用本身的实现不是很难的事情,其实就是调用别人的API接口来实现,主要目的还是通过这个案例来学习以下内容: - 学习如何用PyQt5做用户交互……继续阅读 »

野风同学 4周前 (07-05) 236浏览 0评论 0个赞

在线工具

推荐2个工具,格式转换不再求人!

推荐2个工具,格式转换不再求人!
格式工厂 格式工厂可以说是非常良心的一款格式转换软件了,这么多年来,提到文件转换格式,我第一时间想到的还是它。格式工厂支持视频、音频、图片、文档和光驱设备等主流和非主流格式的转换。具体地: - 视频:支持转到mp4, mkv, gif, webm, avi, flv, mov, vob,并且软件支持简单的视频剪辑、音视频分离、录屏、去水印等等! - 音频:支……继续阅读 »

野风同学 1个月前 (06-24) 272浏览 0评论 1个赞

强化学习

强化学习——从Q-Learning到DQN到底发生了什么?

强化学习——从Q-Learning到DQN到底发生了什么?
学习目标 复习Q-Learning; 理解什么是值函数近似(Function Approximation); 理解什么是DQN,弄清它和Q-Learning的区别是什么。 用Q-Learning解决经典迷宫问题 现有一个5房间的房子,如图1所示,房间与房间之间通过门连接,编号0到4,5号是房子外边,即我们的终点。我们将agent随机放在任一房间内,每打开……继续阅读 »

野风同学 1个月前 (06-22) 284浏览 0评论 0个赞

强化学习

强化学习——时序差分算法

强化学习——时序差分算法
学习目标 理解TD(0)的预测(prediction)问题; On-policy控制(control)算法SARSA; Off-policy控制(control)算法Q-learning; TD算法相对于MC算法和DP算法的优势; 简介 这次要介绍的时序差分(Temporal-Difference)算法应该是强化学习中最为核心的算法了,它结合了前面讲到的……继续阅读 »

野风同学 1个月前 (06-22) 278浏览 0评论 0个赞

强化学习

强化学习——蒙特卡洛方法

强化学习——蒙特卡洛方法
学习目标 理解Prediction和Control的差别; 理解什么是first-visit和every-visit; 理解什么是on-policy和off-policy; 理解蒙特卡洛方法的Prediction和Control问题; Prediction和Control 其实这两个名词在总结动态规划方法的文章中也提到过了,但是没有细说,这里再简单的说明……继续阅读 »

野风同学 1个月前 (06-22) 294浏览 0评论 0个赞

强化学习

强化学习——MDPs求解之动态规划

强化学习——MDPs求解之动态规划
学习目标 理解策略评估(Policy Evaluation)和策略提升(Policy Improvement); 理解策略迭代(Policy Iteration)算法; 理解值迭代(Value Iteration)算法; 理解策略迭代和值迭代的不同之处; 动态规划方法的局限性; Python实现格子世界(Gridworld)策略迭代和值迭代。 动态规划(……继续阅读 »

野风同学 2个月前 (06-01) 399浏览 0评论 0个赞

强化学习

强化学习——环境库OpenAI Gym

强化学习——环境库OpenAI Gym
前言 前段时间各大新闻媒体都在报道SpaceX的马斯克,因为其公司成功发射“猎鹰9号”火箭。马斯克是一个极具传奇色彩的人物,其成就也足以让他名垂青史。但今天我们要讨论的不是马斯克这个人,而是马斯克牵头建立的人工智能非营利组织OpenAI下一个强化学习工具库Gym,它可以被用来开发和比较强化学习算法。 简单的说,gym就是提供了强化学习中与agent交互的en……继续阅读 »

野风同学 2个月前 (06-01) 394浏览 0评论 0个赞