util/lib/analysis_package/categorical
wystan_rin 707997d4e1 init 2024-05-12 20:18:24 +08:00
..
README.md init 2024-05-12 20:18:24 +08:00
__init__.py init 2024-05-12 20:18:24 +08:00
categorical_process.py init 2024-05-12 20:18:24 +08:00

README.md

数值模块: 针对离散型数据进行特征分析

分析方法:

1> 描述性统计:

  • 记录数据中该列包含的分类

  • 分类个数

  • 频数表

  • 列联表

2> 卡方独立性检验

3> 信息熵

4> 互信息

功能:

多列离散数据循环进行数据分析

运行环境: python3.7.10以上

  • numpy
  • pandas
  • matplotlib
  • sklearn
  • scipy.stats