Releases: Yangruipis/simple_ml
Releases · Yangruipis/simple_ml
First Release
1. 数据和特征
1.1 数据集获取
simple_ml提供了大量经典的机器学习数据集的获取接口DataCollector,数据集来自UCI。
1.2 数据预处理
simple_ml 提供了常用的数据预处理方法,包括了编码、独热编码、缺失值处理、异常值处理以及随机数据集划分等。
同时,simple_ml 提供了PCA降维方法以及针对高维数据的SuperPCA降维方法。
1.3 特征选择
simple_ml提供了Filter和Embedded两种特征选择方法,包括了:
- 方差法
- 相关系数法
- 卡方检验法
- L1正则
- GBDT特征选择
2. 模型
2.1 二分类
simple_ml提供了非常多的二分类方法
2.2 多分类
simple_ml暂时只提供了一些多分类算法
2.3 回归
simple_ml提供了CART、GBDT这两种回归方法,后面将加入SVR
2.4 聚类
simple_ml提供了K-means聚类和层次聚类两种聚类方法
注:以上所有图均为simple_ml直出(需要matplotlib)