Go to file
wystan 81f10f8187 上传聚类结果 2025-01-10 22:53:24 +08:00
data 准备测试参数分类效果 2024-12-28 18:12:17 +08:00
notebook 上传聚类结果 2025-01-10 22:53:24 +08:00
.gitignore init 2024-12-24 16:01:29 +08:00
README.md 准备测试参数分类效果 2024-12-28 18:12:17 +08:00
classify_items.py 准备测试参数分类效果 2024-12-28 18:12:17 +08:00
config.py 准备测试参数分类效果 2024-12-28 18:12:17 +08:00
kmeans.py 上传聚类结果 2025-01-10 22:53:24 +08:00
requirements.txt 上传聚类结果 2025-01-10 22:53:24 +08:00
tfidf.py 上传聚类结果 2025-01-10 22:53:24 +08:00

README.md

文档拆分

  1. 文档分块
  2. 块中抽取条目
  3. 将条目分类

条目分类设计

  1. 如重量,潮气量等数值范围
  2. 如功能描述的文本类型