util/lib/analysis_package/categorical/README.md

31 lines
383 B
Markdown
Raw Normal View History

2024-05-12 12:18:24 +00:00
数值模块:
针对离散型数据进行特征分析
分析方法:
1> 描述性统计:
- 记录数据中该列包含的分类
- 分类个数
- 频数表
- 列联表
2> 卡方独立性检验
3> 信息熵
4> 互信息
功能:
多列离散数据循环进行数据分析
运行环境:
python3.7.10以上
- numpy
- pandas
- matplotlib
- sklearn
- scipy.stats