Skip to content

Releases: Yangruipis/simple_ml

First Release

19 Apr 10:44

Choose a tag to compare

First Release Pre-release
Pre-release

1. 数据和特征

1.1 数据集获取

simple_ml提供了大量经典的机器学习数据集的获取接口DataCollector,数据集来自UCI

1.2 数据预处理

simple_ml 提供了常用的数据预处理方法,包括了编码、独热编码、缺失值处理、异常值处理以及随机数据集划分等。

同时,simple_ml 提供了PCA降维方法以及针对高维数据的SuperPCA降维方法。

1.3 特征选择

simple_ml提供了Filter和Embedded两种特征选择方法,包括了:

  1. 方差法
  2. 相关系数法
  3. 卡方检验法
  4. L1正则
  5. GBDT特征选择

2. 模型

2.1 二分类

simple_ml提供了非常多的二分类方法

2.2 多分类

simple_ml暂时只提供了一些多分类算法

2.3 回归

simple_ml提供了CARTGBDT这两种回归方法,后面将加入SVR

2.4 聚类

simple_ml提供了K-means聚类层次聚类两种聚类方法

注:以上所有图均为simple_ml直出(需要matplotlib)

3. 效果评价