Files

shenjianZ e63267cef6 feat: 将数据集从国外员工缺勤数据替换为中国企业缺勤模拟数据

- 新增中国企业员工缺勤模拟数据集生成脚本(generate_dataset.py)，覆盖7个行业、180家企业、2600名员工
  - 重构 config.py，更新特征字段为中文名称，调整目标列、员工ID、行业类型等配置
  - 重构 clustering.py，简化聚类逻辑，更新聚类特征和群体命名（高压通勤型、健康波动型等）
  - 重构 feature_mining.py，更新相关性分析和群体比较维度（按行业、班次、婚姻状态等）
  - 新增 model_features.py 定义模型训练特征
  - 更新 preprocessing.py 和 train_model.py 适配新数据结构
  - 更新各 API 路由默认参数（model: random_forest, dimension: industry）
  - 前端更新主题样式和各视图组件适配中文字段
  - 更新系统名称为 China Enterprise Absence Analysis System

2026-03-11 10:46:58 +08:00

3.0 KiB

Raw Blame History

系统架构设计

1. 总体架构

系统采用前后端分离架构：

前端：Vue 3 + Vue Router + Element Plus + ECharts
后端：Flask + Pandas + Scikit-learn + Joblib
数据层：CSV 数据文件 + 模型文件

整体架构分为四层：

表现层：负责页面展示、表单交互和图表可视化
接口层：负责 HTTP 路由转发与请求响应
业务层：负责数据统计、特征分析、预测和聚类逻辑
数据与模型层：负责原始数据、清洗数据、模型文件和训练元数据

2. 前端架构设计

2.1 模块划分

Dashboard.vue：数据概览页
FactorAnalysis.vue：影响因素分析页
Prediction.vue：缺勤预测页
Clustering.vue：员工画像页

2.2 核心职责

页面布局与导航
图表渲染
表单输入与结果展示
接口调用与状态管理

3. 后端架构设计

3.1 路由层

overview_routes.py
analysis_routes.py
predict_routes.py
cluster_routes.py

3.2 服务层

data_service.py：负责概览统计
analysis_service.py：负责特征重要性与群体对比
predict_service.py：负责模型加载与预测输出
cluster_service.py：负责聚类结果组织

3.3 核心算法层

generate_dataset.py：生成企业缺勤事件数据集
preprocessing.py：数据清洗与预处理
model_features.py：特征构建与预测输入映射
train_model.py：模型训练与评估
feature_mining.py：相关性分析与群体对比
clustering.py：K-Means 聚类分析

4. 数据流设计

4.1 训练流程

生成企业缺勤事件数据集
加载并清洗数据
构建衍生特征
进行标签编码和特征筛选
训练多种模型并评估性能
保存模型、特征信息和训练元数据

4.2 预测流程

前端输入核心预测字段
后端构建完整预测样本
自动补齐默认字段
执行特征工程和编码
加载模型进行预测
返回缺勤时长、风险等级、模型名称和置信度

4.3 分析流程

读取清洗后的数据
计算统计指标或相关关系
组织成前端图表所需结构
返回 JSON 数据供前端展示

5. 文件组织结构

backend/
  api/
  core/
  data/
  models/
  services/
  app.py

frontend/
  src/
    api/
    router/
    styles/
    views/
    App.vue
    main.js

6. 技术选型说明

6.1 Flask

轻量，适合本科毕设项目
路由层清晰，便于拆分接口

6.2 Vue 3

组件化开发效率较高
与 Element Plus、ECharts 配合较好

6.3 Scikit-learn

适合传统机器学习建模
提供随机森林、GBDT、Extra Trees 等成熟算法

7. 部署方式

本地前端开发服务器：Vite
本地后端服务：Flask 开发服务器
模型文件与数据文件均存储在本地项目目录中

8. 架构特点

结构清晰，便于答辩说明
前后端职责明确
支持快速展示图表与预测效果
支持后续扩展为数据库或更复杂模型架构

3.0 KiB Raw Blame History Unescape Escape

系统架构设计

1. 总体架构

2. 前端架构设计

2.1 模块划分

2.2 核心职责

3. 后端架构设计

3.1 路由层

3.2 服务层

3.3 核心算法层

4. 数据流设计

4.1 训练流程

4.2 预测流程

4.3 分析流程

5. 文件组织结构

6. 技术选型说明

6.1 Flask

6.2 Vue 3

6.3 Scikit-learn

7. 部署方式

8. 架构特点

3.0 KiB

Raw Blame History