fix(training): patch lightgbm sklearn compatibility
This commit is contained in:
@@ -74,6 +74,10 @@
|
||||
- 星期几
|
||||
- 是否节假日前后
|
||||
- 季节
|
||||
- 事件日期
|
||||
- 事件日期索引
|
||||
- 事件序号
|
||||
- 员工历史事件数
|
||||
- 请假申请渠道
|
||||
- 请假类型
|
||||
- 请假原因大类
|
||||
@@ -129,6 +133,23 @@
|
||||
- 慢性病史和健康异常会提升缺勤时长
|
||||
- 年假和调休通常对应较短缺勤时长
|
||||
|
||||
### 6.3 时序样本构造
|
||||
|
||||
为支持 LSTM+MLP 深度学习模型,数据集在事件层面额外补充了时序字段:
|
||||
|
||||
- `事件日期`:缺勤事件发生日期
|
||||
- `事件日期索引`:便于排序和窗口切片的数值型时间索引
|
||||
- `事件序号`:同一员工内部的事件顺序
|
||||
- `员工历史事件数`:该员工在数据集中对应的事件总数
|
||||
|
||||
深度学习样本构造规则如下:
|
||||
|
||||
- 以员工为单位按 `事件日期索引` 和 `事件序号` 排序
|
||||
- 取最近 `5` 次缺勤事件作为时间窗口输入
|
||||
- 序列不足时使用前向零填充
|
||||
- 当前事件作为窗口最后一个时间步
|
||||
- 静态特征单独输入 MLP 分支,与 LSTM 输出融合后进行回归预测
|
||||
|
||||
## 7. 数据质量要求
|
||||
|
||||
- 无大量缺失值
|
||||
|
||||
Reference in New Issue
Block a user