Work 20%
12
20
NLTK之词频 NLTK之词频
FreqDist类官方文档:nltk.probability.FreqDist 介绍:词的概率分布类,包含一些概率学的方法。 所在文件:probability.py ,大约在63~427行 创建定义:__init__(self, sampl
2017-12-20
19
NLTK常用操作和语料库 NLTK常用操作和语料库
安装NLTK按照官方步骤:Installing NLTK 在安装完nltk后,通过下述命令可查看nltk版本: import nltk print nltk.__doc__ 输出: The Natural Language Toolkit
2017-12-19
05
docker模拟多机环境 docker模拟多机环境
Docker基础这里不多说,借助docker官方文档可以学习到大部分内容,而且很详细。 在线阅读:GitBook 或 Github。 离线阅读。 pdf 版本 下载 epub 版本 下载 本次配置中用到的镜像: nginx:1.12-
2017-12-05
04
Week11:Photo OCR & Conclusion Week11:Photo OCR & Conclusion
OCR问题通俗一点讲就是图像识别中的文字识别。比方说给一张图,请识别图中的文字。 滑动窗口探测法该方法用于识别出图中哪些区域还有所指定的目标物体。 它选一个特定的尺寸的图片进行二分训练,判断这个尺寸的图片中是否含有要找的目标。 例如行人探
2017-12-04
02
Week10:Learning with large datasets Week10:Learning with large datasets
大规模机器学习大规模是指训练集数据很多,比如有1亿组数据。 大数据有一句话叫做“最后胜利的人不是因为他有好的算法,而是他用有大量数据”,因为随着数据量的增加,机器学习算法的准确度都会变得很高。 批量梯度下降先看梯度下降方程,以线性回归为例
2017-12-02
01
Week9:Anomaly Detection & Recommender Systems Week9:Anomaly Detection & Recommender Systems
序Coursera的课程还有2周就要结束了,我这周基本上是每天学一周的内容,而下周就要开始正式接触NLP了。 身边也有一起学习Ng这套课程的人,但是学到一半没到就放弃了,我在学习过程中也问过自己,Ng这套11年的课程放在现在还有价值么?这是
2017-12-01