feat: update clustering implementation and docs
This commit is contained in:
@@ -2,22 +2,24 @@
|
||||
|
||||
## 1. 题目名称
|
||||
|
||||
基于中国企业员工缺勤事件的分析与预测系统设计与实现
|
||||
基于中国企业员工缺勤事件的分析、解释与预测系统设计与实现
|
||||
|
||||
## 2. 论文(设计)采取的主要技术路线或方法
|
||||
|
||||
本课题围绕企业员工缺勤管理场景,采用前后端分离的系统设计思路开展研究与实现。前端基于 `Vue 3`、`Element Plus` 和 `ECharts` 构建可视化展示界面,实现缺勤趋势、影响因素、预测结果和员工画像等内容的交互式展示;后端基于 `Flask` 搭建接口服务,负责数据处理、分析计算、模型推理和聚类结果组织。
|
||||
本课题围绕企业员工缺勤管理场景,采用前后端分离的系统设计思路开展研究与实现。前端基于 `Vue 3`、`Element Plus` 和 `ECharts` 构建可视化展示界面,实现缺勤趋势、影响因素、`JD-R` 理论分析、预测结果和员工画像等内容的交互式展示;后端基于 `Flask` 搭建接口服务,负责数据处理、分析计算、模型推理、理论指标组织和聚类结果封装。
|
||||
|
||||
在数据处理方面,首先结合项目内部构建的中国企业员工缺勤事件数据集,使用 `Pandas` 和 `NumPy` 完成数据清洗、字段转换、统计分析与特征整理。随后围绕员工属性、岗位信息、班次安排、健康风险、请假原因、通勤压力和加班情况等因素进行特征工程,形成适用于分析与预测的结构化数据。
|
||||
在理论支撑方面,课题引入 `JD-R`(工作要求-资源)模型,用来解释“为什么员工会缺勤”。系统将工作要求、工作资源、个人资源、工作倦怠和工作投入等心理学变量映射为可计算字段,并进一步构建工作要求指数、工作资源指数、个人资源指数、`JD-R` 平衡度等复合指标,用于分析员工缺勤背后的深层机制。
|
||||
|
||||
在算法研究方面,课题采用传统机器学习与深度学习相结合的技术路线。传统模型依托 `scikit-learn`、`XGBoost` 和 `LightGBM` 完成缺勤时长预测与模型对比分析,并通过特征重要性排序和相关性分析挖掘关键影响因素;深度学习部分基于 `PyTorch` 构建 `LSTM+MLP` 融合模型,将员工历史缺勤事件序列与静态属性特征结合,用于提升预测研究的完整性和论文的技术深度。
|
||||
在数据处理方面,首先结合项目内部构建的中国企业员工缺勤事件模拟数据集,使用 `Pandas` 和 `NumPy` 完成数据清洗、字段转换、统计分析与特征整理。随后围绕员工属性、岗位信息、班次安排、健康风险、请假原因、通勤压力和加班情况等因素进行特征工程,并补充 `JD-R` 相关变量,形成适用于分析、解释与预测的结构化数据。
|
||||
|
||||
在员工画像分析方面,课题采用 `K-Means` 聚类方法对员工缺勤行为进行分群,结合散点图、雷达图和群体说明完成群体画像展示,从而辅助企业识别不同类型的缺勤风险群体。最终通过系统集成与前后端联调,实现缺勤数据概览、影响因素分析、单次缺勤预测和员工画像分析四个核心功能模块。
|
||||
在算法研究方面,课题采用传统机器学习、深度学习与可解释分析相结合的技术路线。传统模型依托 `scikit-learn` 和 `XGBoost` 完成缺勤时长预测与模型对比分析,并通过特征重要性排序和相关性分析挖掘关键影响因素;深度学习部分基于 `PyTorch` 构建时序注意力融合模型,以 `8` 步历史缺勤事件窗口结合静态属性特征进行建模;可解释分析部分引入 `SHAP`,从全局与局部两个层面对预测结果进行解释,并按 `JD-R` 理论维度进行聚合展示。
|
||||
|
||||
在员工画像分析方面,课题采用 `K-Means` 聚类方法对员工缺勤行为进行分群,结合散点图、雷达图和群体说明完成群体画像展示,从而辅助企业识别不同类型的缺勤风险群体。最终通过系统集成与前后端联调,实现缺勤数据概览、影响因素分析、`JD-R` 理论解释、单次缺勤预测和员工画像分析五类核心功能。
|
||||
|
||||
## 3. 论文(设计)预期结果
|
||||
|
||||
本课题预期完成一个可运行、可展示、可支撑论文撰写的员工缺勤分析与预测系统。系统能够实现缺勤事件统计展示、趋势分析、原因分布分析、关键因素挖掘、缺勤时长预测、风险等级评估和员工群体画像展示等功能,满足本科毕业设计对系统实现和功能展示的要求。
|
||||
本课题预期完成一个可运行、可展示、可支撑论文撰写的员工缺勤分析与预测系统。系统能够实现缺勤事件统计展示、趋势分析、原因分布分析、关键因素挖掘、`JD-R` 理论解释、缺勤时长预测、风险等级评估、`SHAP` 解释和员工群体画像展示等功能,满足本科毕业设计对系统实现和功能展示的要求。
|
||||
|
||||
在研究结果方面,预期能够形成一套较完整的员工缺勤分析方法流程,包括数据预处理、特征工程、相关性分析、特征重要性评估、预测建模和聚类画像分析。系统应能够根据输入的关键业务字段输出缺勤时长预测结果、风险等级和多模型对比结果,并通过可视化图表直观展示分析结论,为企业人力资源管理提供辅助决策依据。
|
||||
在研究结果方面,预期能够形成一套较完整的员工缺勤分析方法流程,包括数据预处理、理论变量构造、特征工程、相关性分析、特征重要性评估、预测建模、可解释分析和聚类画像分析。系统应能够根据输入的关键业务字段输出缺勤时长预测结果、风险等级、多模型对比结果和解释结果,并通过可视化图表直观展示分析结论,为企业人力资源管理提供辅助决策依据。
|
||||
|
||||
在论文成果方面,预期形成与项目实现一致的毕业设计文档与论文材料,包括需求分析、系统架构设计、接口设计、数据设计、系统实现、实验分析和总结展望等内容,并能够支撑后续开题、中期检查、论文提交和答辩展示工作。
|
||||
|
||||
Reference in New Issue
Block a user