记录我关于在数据挖掘中,一些从入门到实战所积累的技巧。
代码很多都是直接从项目中复制出来的,比较乱,见谅。
- 配置科学计算环境
- KMeans算法与交通事故理赔审核预测
- Matplotlib学习笔记
- NumPy学习笔记
- Pandas学习笔记
- 数据预处理笔记
- 机器学习部分
- SKlearn模型评估方法
- Kaggle杂记
- 1.数据探索
- 2.数据预处理
- 3.电力窃漏电用户自动识别
- 4.地震后建筑修复建议预测
- 5.Kaggle Titanic
该部分为Coursera上的How to Win a Data Science Competition: Learn from Top Kagglers课程笔记。下载后,请使用jupyter notebook打开。
- Tips and tricks
- Advanced Feature Engineering I
- Hyperparameter tuning
- Advanced Feature Engineering II
- Emsembling
- feature engineering
- modeling