|
||
---|---|---|
.. | ||
README.md | ||
__init__.py | ||
categorical_process.py |
README.md
数值模块: 针对离散型数据进行特征分析
分析方法:
1> 描述性统计:
-
记录数据中该列包含的分类
-
分类个数
-
频数表
-
列联表
2> 卡方独立性检验
3> 信息熵
4> 互信息
功能:
多列离散数据循环进行数据分析
运行环境: python3.7.10以上
- numpy
- pandas
- matplotlib
- sklearn
- scipy.stats