fengyebuhong/c

Files

刘正航 b5237f9038 1

2026-04-21 22:45:19 +08:00

3.3 KiB

Raw Blame History

skill小程序：基于朴素贝叶斯的垃圾信息识别小程序（社区交互+商用）

1. 目标

复刻一个可商用的小程序，满足以下闭环：

用户发布文本（公共/私有/私信）
后端实时检测垃圾信息（朴素贝叶斯）
命中阈值即拦截并入库备案
用户可对拦截信息发起申诉
管理员人工复核与申诉处理
样本持续回流并重训模型

2. 技术框架

2.1 前端环境（微信小程序）

微信开发者工具开发与调试
页面模块：
- 注册/登录
- 文本发布（发布框+提交按钮）
- 实时状态反馈（发布成功/拦截警告）
- 个人发布历史
- 拦截信息申诉
- 私信收件箱
界面规范：
- 遵循小程序设计规范
- 卡片化布局 + 统一主题色 + 移动端自适配

2.2 后端环境（Flask RESTful）

Flask 提供 API
JWT 身份认证与会话管理
SQLAlchemy 数据持久化
模型服务：TF-IDF + MultinomialNB
核心职责：
- 接收发布文本
- 调用模型检测
- 阈值决策拦截/放行
- 拦截日志入库
- 申诉与人工复核
- 管理员日志查询与阈值调节

3. 数据模型

users

用户信息、管理员标记

content_posts

文本内容、发布类型、检测概率、阈值、发布状态
人工复核状态
申诉状态与处理结果

spam_prediction_logs

检测原始日志

spam_training_samples

训练样本（seed/import/feedback/manual_review）

detection_configs

动态检测阈值

4. 功能模块映射

4.1 用户功能模块

个人信息注册/登录/维护
文本信息编辑与上传
公共信息发布
私有信息发布
用户私信信息发布
私信信息拦截
拦截信息申诉
发布历史查看

4.2 管理员功能模块

用户信息编辑/删除
垃圾信息编辑（复核结果更新）
确认垃圾信息（人工复核属实）
申诉处理（通过/驳回）
垃圾信息历史记录查看
检测阈值动态调节

4.3 垃圾信息识别模块

信息检测（朴素贝叶斯）
信息拦截
阈值动态调节
信息发布拦截
垃圾信息入库备案
信息上报管理员

5. 关键接口

用户端

POST /api/content/publish
GET /api/content/posts/history
GET /api/content/posts/inbox
POST /api/content/posts/<id>/appeal

管理端

GET /api/admin/intercepts
PUT /api/admin/intercepts/<id>/review
GET /api/admin/appeals
PUT /api/admin/appeals/<id>/process
GET /api/admin/detection/threshold
PUT /api/admin/detection/threshold

6. 实施步骤

初始化数据库并导入种子样本
训练初始朴素贝叶斯模型
接入发布接口并实现实时反馈
完成历史、申诉、私信收件箱
完成管理员复核与阈值配置
打通样本回流和模型重训

7. 商用落地建议

使用 HTTPS 和网关限流
管理操作写审计日志
默认管理员密码上线前替换
密钥全部改环境变量注入
申诉处理增加 SLA 与状态通知

8. 验收标准

发布文本可实时检测并返回明确状态
疑似垃圾信息会被拦截且可申诉
管理员可人工复核与处理申诉
阈值可在线调节且立即生效
页面在不同手机尺寸下排版正常
样本可回流并用于模型迭代