31 lines
383 B
Markdown
31 lines
383 B
Markdown
|
数值模块:
|
||
|
针对离散型数据进行特征分析
|
||
|
|
||
|
分析方法:
|
||
|
|
||
|
1> 描述性统计:
|
||
|
- 记录数据中该列包含的分类
|
||
|
|
||
|
- 分类个数
|
||
|
|
||
|
- 频数表
|
||
|
- 列联表
|
||
|
|
||
|
2> 卡方独立性检验
|
||
|
|
||
|
3> 信息熵
|
||
|
|
||
|
4> 互信息
|
||
|
|
||
|
功能:
|
||
|
|
||
|
多列离散数据循环进行数据分析
|
||
|
|
||
|
运行环境:
|
||
|
python3.7.10以上
|
||
|
- numpy
|
||
|
- pandas
|
||
|
- matplotlib
|
||
|
- sklearn
|
||
|
- scipy.stats
|