util/lib/analysis_package/categorical/README.md

383 B

数值模块: 针对离散型数据进行特征分析

分析方法:

1> 描述性统计:

  • 记录数据中该列包含的分类

  • 分类个数

  • 频数表

  • 列联表

2> 卡方独立性检验

3> 信息熵

4> 互信息

功能:

多列离散数据循环进行数据分析

运行环境: python3.7.10以上

  • numpy
  • pandas
  • matplotlib
  • sklearn
  • scipy.stats