fix(training): patch lightgbm sklearn compatibility

This commit is contained in:
2026-03-12 18:15:09 +08:00
parent d7c8019f96
commit d70bd54c41
16 changed files with 885 additions and 203 deletions

View File

@@ -74,6 +74,10 @@
- 星期几
- 是否节假日前后
- 季节
- 事件日期
- 事件日期索引
- 事件序号
- 员工历史事件数
- 请假申请渠道
- 请假类型
- 请假原因大类
@@ -129,6 +133,23 @@
- 慢性病史和健康异常会提升缺勤时长
- 年假和调休通常对应较短缺勤时长
### 6.3 时序样本构造
为支持 LSTM+MLP 深度学习模型,数据集在事件层面额外补充了时序字段:
- `事件日期`:缺勤事件发生日期
- `事件日期索引`:便于排序和窗口切片的数值型时间索引
- `事件序号`:同一员工内部的事件顺序
- `员工历史事件数`:该员工在数据集中对应的事件总数
深度学习样本构造规则如下:
- 以员工为单位按 `事件日期索引``事件序号` 排序
- 取最近 `5` 次缺勤事件作为时间窗口输入
- 序列不足时使用前向零填充
- 当前事件作为窗口最后一个时间步
- 静态特征单独输入 MLP 分支,与 LSTM 输出融合后进行回归预测
## 7. 数据质量要求
- 无大量缺失值