- 新增中国企业员工缺勤模拟数据集生成脚本(generate_dataset.py),覆盖7个行业、180家企业、2600名员工 - 重构 config.py,更新特征字段为中文名称,调整目标列、员工ID、行业类型等配置 - 重构 clustering.py,简化聚类逻辑,更新聚类特征和群体命名(高压通勤型、健康波动型等) - 重构 feature_mining.py,更新相关性分析和群体比较维度(按行业、班次、婚姻状态等) - 新增 model_features.py 定义模型训练特征 - 更新 preprocessing.py 和 train_model.py 适配新数据结构 - 更新各 API 路由默认参数(model: random_forest, dimension: industry) - 前端更新主题样式和各视图组件适配中文字段 - 更新系统名称为 China Enterprise Absence Analysis System
1.4 KiB
1.4 KiB
答辩汇报提纲
1. 课题背景
- 企业缺勤管理存在统计分散、分析不及时、预测能力不足的问题
- 本课题旨在构建一个可视化、可分析、可预测的缺勤管理辅助系统
2. 课题目标
- 展示缺勤数据整体分布
- 分析关键影响因素
- 实现缺勤风险预测
- 构建员工群体画像
3. 系统总体设计
- 前后端分离架构
- 前端负责界面与图表
- 后端负责数据处理、模型预测与聚类分析
4. 核心功能展示顺序
4.1 数据概览
- 展示总量指标
- 展示月度趋势、星期分布、原因分布、季节分布
4.2 影响因素分析
- 展示特征重要性排序
- 解释为什么请假类型、医院证明、加班通勤压力等因素更重要
4.3 缺勤预测
- 输入关键字段
- 展示预测时长与风险等级
- 展示模型对比结果
4.4 员工画像
- 展示群体雷达图
- 展示聚类结果与散点图
5. 技术实现亮点
- 前后端分离结构清晰
- 采用多模型训练与比较
- 融合特征工程与聚类分析
- 前端页面采用卡片式可视化布局,适合展示
6. 项目成果
- 系统可完成统计、分析、预测、画像四类任务
- 页面可视化效果完整
- 项目文档和论文材料配套齐全
7. 不足与改进方向
- 可进一步引入真实企业数据
- 可加入更复杂的深度学习模型
- 可引入权限管理、报表导出和数据库存储