Files

shenjianZ e63267cef6 feat: 将数据集从国外员工缺勤数据替换为中国企业缺勤模拟数据

- 新增中国企业员工缺勤模拟数据集生成脚本(generate_dataset.py)，覆盖7个行业、180家企业、2600名员工
  - 重构 config.py，更新特征字段为中文名称，调整目标列、员工ID、行业类型等配置
  - 重构 clustering.py，简化聚类逻辑，更新聚类特征和群体命名（高压通勤型、健康波动型等）
  - 重构 feature_mining.py，更新相关性分析和群体比较维度（按行业、班次、婚姻状态等）
  - 新增 model_features.py 定义模型训练特征
  - 更新 preprocessing.py 和 train_model.py 适配新数据结构
  - 更新各 API 路由默认参数（model: random_forest, dimension: industry）
  - 前端更新主题样式和各视图组件适配中文字段
  - 更新系统名称为 China Enterprise Absence Analysis System

2026-03-11 10:46:58 +08:00

1.4 KiB

Raw Blame History

答辩汇报提纲

1. 课题背景

企业缺勤管理存在统计分散、分析不及时、预测能力不足的问题
本课题旨在构建一个可视化、可分析、可预测的缺勤管理辅助系统

2. 课题目标

展示缺勤数据整体分布
分析关键影响因素
实现缺勤风险预测
构建员工群体画像

3. 系统总体设计

前后端分离架构
前端负责界面与图表
后端负责数据处理、模型预测与聚类分析

4. 核心功能展示顺序

4.1 数据概览

展示总量指标
展示月度趋势、星期分布、原因分布、季节分布

4.2 影响因素分析

展示特征重要性排序
解释为什么请假类型、医院证明、加班通勤压力等因素更重要

4.3 缺勤预测

输入关键字段
展示预测时长与风险等级
展示模型对比结果

4.4 员工画像

展示群体雷达图
展示聚类结果与散点图

5. 技术实现亮点

前后端分离结构清晰
采用多模型训练与比较
融合特征工程与聚类分析
前端页面采用卡片式可视化布局，适合展示

6. 项目成果

系统可完成统计、分析、预测、画像四类任务
页面可视化效果完整
项目文档和论文材料配套齐全

7. 不足与改进方向

可进一步引入真实企业数据
可加入更复杂的深度学习模型
可引入权限管理、报表导出和数据库存储

1.4 KiB Raw Blame History

答辩汇报提纲

1. 课题背景

2. 课题目标

3. 系统总体设计

4. 核心功能展示顺序

4.1 数据概览

4.2 影响因素分析

4.3 缺勤预测

4.4 员工画像

5. 技术实现亮点

6. 项目成果

7. 不足与改进方向

1.4 KiB

Raw Blame History