fix(training): patch lightgbm sklearn compatibility

2026-03-12 18:15:09 +08:00
parent d7c8019f96
commit d70bd54c41
16 changed files with 885 additions and 203 deletions
--- a/docs/01_系统架构设计.md
+++ b/docs/01_系统架构设计.md
@@ -5,7 +5,7 @@
 系统采用前后端分离架构：

 - 前端：Vue 3 + Vue Router + Element Plus + ECharts
- 后端：Flask + Pandas + Scikit-learn + Joblib
+- 后端：Flask + Pandas + Scikit-learn + PyTorch + Joblib
 - 数据层：CSV 数据文件 + 模型文件

 整体架构分为四层：
@@ -53,6 +53,7 @@
 - `preprocessing.py`：数据清洗与预处理
 - `model_features.py`：特征构建与预测输入映射
 - `train_model.py`：模型训练与评估
+- `deep_learning_model.py`：LSTM+MLP 深度学习训练与推理
 - `feature_mining.py`：相关性分析与群体对比
 - `clustering.py`：K-Means 聚类分析

@@ -67,6 +68,12 @@
 5. 训练多种模型并评估性能
 6. 保存模型、特征信息和训练元数据

+其中深度学习路径采用：
+
+- `LSTM` 处理员工最近多次缺勤事件构成的时间窗口序列
+- `MLP` 处理员工静态属性特征
+- 融合层输出缺勤时长回归结果
+
 ### 4.2 预测流程

 1. 前端输入核心预测字段
@@ -121,6 +128,12 @@ frontend/
 - 适合传统机器学习建模
 - 提供随机森林、GBDT、Extra Trees 等成熟算法

+### 6.4 PyTorch
+
+- 用于实现 LSTM+MLP 深度学习模型
+- 支持将时序特征与静态特征进行融合建模
+- 便于在论文中增加深度学习对比实验内容
+
 ## 7. 部署方式

 - 本地前端开发服务器：Vite
@@ -133,3 +146,4 @@ frontend/
 - 前后端职责明确
 - 支持快速展示图表与预测效果
 - 支持后续扩展为数据库或更复杂模型架构
+- 同时支持传统机器学习模型与深度学习模型的实验对比