所有进度在我博客里都有详细的笔记 传送门:http://blog.leanote.com/cate/fengmaster/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0
由于我之前从来没有了解过机器学习相关的东西,我甚至连机器学习是干嘛的都不知道,所以一切从0开始
首先我查阅了一些入门资料,但大部分资料都建立在有一定基础上才能看的懂,后来转向了入门资料的查找,不约而同的都指向了斯坦福大学的Andrew Ng在coursera上的关于机器学习的入门基础视频教程
https://www.coursera.org/learn/machine-learning
(好吧,翻墙实在是慢,最近由于我们的XXX,搞的梯子都不好用了,推荐下b站的搬运视频[而且翻译比coursera全面])
但我看了下coursera上的课程安排,一共11周,时间太长了,打算尽可能快的学习完毕,具体速度看这几天的学习情况再定
coursera第一周上半部分
- 大致上了解了机器学习所做的领域和作用
- 了解了监督学习( Supervised learning )和非监督学习的定义和一些例子
- 了解了类聚算法,分类算法的作用
- 复习了一下微积分的基础概念和简单计算
继续coursera的课程第一周的下半部分
- 学习了解了监督学习中的回归问题
- 学习了解了代价函数(cost function)的定义和作用
- 学习了解了假设函数的定义和作用
- 学习了解了单个参数下线性回归问题(梯度下降法)的简单思考过程
- 复习了线代中矩阵部分的基础知识
继续coursera的课程第二周上半部分
- 学习了解了特征缩放的使用和使用场景
- 学习了解了归一化的使用和使用场景
- 学习了解了多项式回归的使用
- 了解了什么叫数据拟合
- 初步了解了正规方程法
- 了解了正规方程法和梯度下降法的优点和缺点,和适用的场景
继续coursera课程第二周下半部分
- 了解coursera的语法
1.完成第二周编程作业:线性回归问题,并且完成了附加部分(多参数)
有事在忙,现在还没更新,进度比原来慢了点,因为有几天有事.
小手术住院啦,进度慢了点
完成coursera的课程第三周的学习
- 学习了解了二元分类算法
- 学习了解了多元分类算法
- 了解了一些高级的优化算法的使用
随便找个博客,开始入手了解下推荐系统(我也不知道这个毕业设计本质上是不是推荐系统,个人觉得挺像)
基于内容的推荐(Content-based Recommendations)
学习了coursera的过拟合部分
了解了简单的神经网络相关内容,好难.
最近感觉状态不好,调整学习状态,在看一些入门科普性质的博文
人工“碳”索意犹尽,智能“硅”来未可知(深度学习入门系列之二)
“机器学习”三重门,“中庸之道”趋若人(深度学习入门系列之四)
Hello World感知机,懂你我心才安息 (深度学习入门系列之五)
休息
去github上找了一天的爬虫,然而没几个能用的,不过学到了点东西,准备自己写
入门py,我并不打算花很长时间学习,我直接选了廖学峰的py教程
https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
预计花一个周左右
学习完py的基本语法
学习了下爬虫框架scrapy的使用
想偷懒上github找爬虫的,后来发现都不合乎自己的要求,浪费了一天
开始自己写爬虫,具体进程我明天再在github上新建个工程.
爬虫好像能正常工作了,就是慢了点,优化的事情之后再说,现在起码有部分数据了,剩下的工作是开始了解具体需要做的步骤
爬虫github传送门: https://github.com/FENG-MASTER/ZhihuSpider
- 初步了解中文分词
- 初步了解关键词提取
- 初步了解机器学习在搜索引擎中的运用,了解到了LTR,打算采用Listwise的训练方法,正在学习ListNet具体实现
http://blog.csdn.net/eastmount/article/details/43341907
之前休息外加考试复习和考试去了
先看了下LTR的一个简单的PRank算法
http://blog.csdn.net/eastmount/article/details/43080791
准备再了解下LTR的其他算法
撰写开题报告 准备其他一些开题材料等
###1.4-1.6### 正在编写正向索引相关代码
相关代码我完成这部分后会上传github管理一下
###1.14###
刚刚到家,明天开始更
###1.15###
- 增加了文本长度的特征值提取
- 试图优化逆向索引的生成速度,失败告终,打算直接跑.
###1.16-1.17###
写listnet算法,进度相关可以看我的库
传送门:https://github.com/FENG-MASTER/QA_Matching_Learning
###1.18###
好吧,前面算法不对,我还是先尝试找个库看看效果
###1.19###
补一下决策树的基础概念: