1

2026-04-21 22:45:19 +08:00
commit b5237f9038
159 changed files with 7769 additions and 0 deletions
--- a/skill小程序.md
+++ b/skill小程序.md
@@ -0,0 +1,136 @@
+# skill小程序：基于朴素贝叶斯的垃圾信息识别小程序（社区交互+商用）
+
+## 1. 目标
+
+复刻一个可商用的小程序，满足以下闭环：
+
+1. 用户发布文本（公共/私有/私信）
+2. 后端实时检测垃圾信息（朴素贝叶斯）
+3. 命中阈值即拦截并入库备案
+4. 用户可对拦截信息发起申诉
+5. 管理员人工复核与申诉处理
+6. 样本持续回流并重训模型
+
+## 2. 技术框架
+
+### 2.1 前端环境（微信小程序）
+
+- 微信开发者工具开发与调试
+- 页面模块：
+  - 注册/登录
+  - 文本发布（发布框+提交按钮）
+  - 实时状态反馈（发布成功/拦截警告）
+  - 个人发布历史
+  - 拦截信息申诉
+  - 私信收件箱
+- 界面规范：
+  - 遵循小程序设计规范
+  - 卡片化布局 + 统一主题色 + 移动端自适配
+
+### 2.2 后端环境（Flask RESTful）
+
+- Flask 提供 API
+- JWT 身份认证与会话管理
+- SQLAlchemy 数据持久化
+- 模型服务：TF-IDF + MultinomialNB
+- 核心职责：
+  - 接收发布文本
+  - 调用模型检测
+  - 阈值决策拦截/放行
+  - 拦截日志入库
+  - 申诉与人工复核
+  - 管理员日志查询与阈值调节
+
+## 3. 数据模型
+
+1. `users`
+- 用户信息、管理员标记
+
+2. `content_posts`
+- 文本内容、发布类型、检测概率、阈值、发布状态
+- 人工复核状态
+- 申诉状态与处理结果
+
+3. `spam_prediction_logs`
+- 检测原始日志
+
+4. `spam_training_samples`
+- 训练样本（seed/import/feedback/manual_review）
+
+5. `detection_configs`
+- 动态检测阈值
+
+## 4. 功能模块映射
+
+### 4.1 用户功能模块
+
+- 个人信息注册/登录/维护
+- 文本信息编辑与上传
+- 公共信息发布
+- 私有信息发布
+- 用户私信信息发布
+- 私信信息拦截
+- 拦截信息申诉
+- 发布历史查看
+
+### 4.2 管理员功能模块
+
+- 用户信息编辑/删除
+- 垃圾信息编辑（复核结果更新）
+- 确认垃圾信息（人工复核属实）
+- 申诉处理（通过/驳回）
+- 垃圾信息历史记录查看
+- 检测阈值动态调节
+
+### 4.3 垃圾信息识别模块
+
+- 信息检测（朴素贝叶斯）
+- 信息拦截
+- 阈值动态调节
+- 信息发布拦截
+- 垃圾信息入库备案
+- 信息上报管理员
+
+## 5. 关键接口
+
+### 用户端
+
+- `POST /api/content/publish`
+- `GET /api/content/posts/history`
+- `GET /api/content/posts/inbox`
+- `POST /api/content/posts/<id>/appeal`
+
+### 管理端
+
+- `GET /api/admin/intercepts`
+- `PUT /api/admin/intercepts/<id>/review`
+- `GET /api/admin/appeals`
+- `PUT /api/admin/appeals/<id>/process`
+- `GET /api/admin/detection/threshold`
+- `PUT /api/admin/detection/threshold`
+
+## 6. 实施步骤
+
+1. 初始化数据库并导入种子样本
+2. 训练初始朴素贝叶斯模型
+3. 接入发布接口并实现实时反馈
+4. 完成历史、申诉、私信收件箱
+5. 完成管理员复核与阈值配置
+6. 打通样本回流和模型重训
+
+## 7. 商用落地建议
+
+1. 使用 HTTPS 和网关限流
+2. 管理操作写审计日志
+3. 默认管理员密码上线前替换
+4. 密钥全部改环境变量注入
+5. 申诉处理增加 SLA 与状态通知
+
+## 8. 验收标准
+
+1. 发布文本可实时检测并返回明确状态
+2. 疑似垃圾信息会被拦截且可申诉
+3. 管理员可人工复核与处理申诉
+4. 阈值可在线调节且立即生效
+5. 页面在不同手机尺寸下排版正常
+6. 样本可回流并用于模型迭代