- 新增中国企业员工缺勤模拟数据集生成脚本(generate_dataset.py),覆盖7个行业、180家企业、2600名员工 - 重构 config.py,更新特征字段为中文名称,调整目标列、员工ID、行业类型等配置 - 重构 clustering.py,简化聚类逻辑,更新聚类特征和群体命名(高压通勤型、健康波动型等) - 重构 feature_mining.py,更新相关性分析和群体比较维度(按行业、班次、婚姻状态等) - 新增 model_features.py 定义模型训练特征 - 更新 preprocessing.py 和 train_model.py 适配新数据结构 - 更新各 API 路由默认参数(model: random_forest, dimension: industry) - 前端更新主题样式和各视图组件适配中文字段 - 更新系统名称为 China Enterprise Absence Analysis System
3.4 KiB
3.4 KiB
需求规格说明书
1. 项目概述
1.1 项目名称
基于中国企业员工缺勤事件分析与预测系统
1.2 项目背景
在企业人力资源管理中,员工缺勤不仅影响排班与生产效率,也会对团队稳定性、运营成本和服务质量造成影响。传统方式往往依赖人工统计与经验判断,难以及时识别风险。为提升企业对缺勤行为的洞察能力,本项目设计并实现一个面向企业管理场景的缺勤分析与预测系统,通过数据统计、特征分析、风险预测和员工画像等功能,为管理者提供辅助决策支持。
1.3 项目目标
- 实现缺勤数据的全局统计与可视化展示
- 分析影响缺勤时长的关键因素
- 提供单次缺勤风险预测能力
- 基于聚类结果构建员工群体画像
- 形成一套完整的毕业设计系统与配套论文材料
2. 用户角色与使用场景
2.1 用户角色
- 企业人力资源管理人员
- 部门负责人
- 学校答辩评审教师
2.2 使用场景
- 查看缺勤整体趋势和分布结构
- 分析不同因素对缺勤时长的影响
- 输入关键因素并预测单次缺勤风险
- 查看员工群体画像与典型群体差异
- 在毕业设计答辩中展示系统界面与分析结果
3. 功能需求
3.1 数据概览模块
- 展示总缺勤事件数、员工覆盖数、平均缺勤时长、高风险事件占比等关键指标
- 展示月度缺勤趋势
- 展示星期分布
- 展示请假原因大类分布
- 展示季节分布
3.2 影响因素分析模块
- 展示特征重要性排序
- 展示关键变量相关性热力图
- 提供多维度群体对比分析
- 支持从行业、班次、岗位序列、婚姻状态、慢性病史等维度查看平均缺勤差异
3.3 缺勤预测模块
- 支持输入核心业务因子进行缺勤时长预测
- 支持显示风险等级与置信度
- 支持多模型结果对比
- 支持自动选择较优模型
3.4 员工画像模块
- 支持 K-Means 聚类分析
- 展示群体雷达图
- 展示聚类散点图
- 展示各群体人数、占比和文字说明
4. 非功能需求
4.1 性能需求
- 页面首次加载时间应控制在合理范围内
- 预测接口应在几秒内返回结果
- 常规图表接口应快速完成响应
4.2 易用性需求
- 界面布局清晰,适合课堂与答辩展示
- 关键功能入口明确,减少复杂操作
- 图表与统计结果需具有直观解释性
4.3 可维护性需求
- 前后端模块划分清晰
- 数据生成、训练、服务和展示逻辑相互独立
- 文档和代码保持一致
4.4 安全性需求
- 系统不使用真实企业敏感数据
- 数据集中不包含身份证号、手机号、详细住址等敏感信息
5. 业务规则
- 每条数据代表一次员工缺勤事件
- 预测目标为缺勤时长(小时)
- 风险等级划分规则:
- 低风险:缺勤时长小于 4 小时
- 中风险:缺勤时长 4 至 8 小时
- 高风险:缺勤时长大于 8 小时
6. 约束条件
- 系统采用前后端分离架构
- 后端基于 Flask
- 前端基于 Vue 3 与 Element Plus
- 训练数据采用项目内部生成的企业场景数据
7. 验收标准
- 系统可正常启动并访问所有页面
- 各模块接口能够正确返回数据
- 预测模块可以返回缺勤时长与风险等级
- 影响因素分析与聚类页面可正常展示图表
- 文档能够支撑毕业设计提交和答辩展示