添加数据增强方案以及扩散生成模型的想法

2025-10-20 21:14:03 +08:00
parent d6d00cf088
commit 08f488f0d8
22 changed files with 1903 additions and 190 deletions
--- a/docs/todos/03_Stage3_Integration_Optimization.md
+++ b/docs/todos/03_Stage3_Integration_Optimization.md
@@ -82,6 +82,25 @@
    - [ ] 特征维度一致性检查
    - [ ] GPU/CPU 切换测试

+    #### 2.3 基准与评估补充（来自 NextStep 2.1 未完项）
+
+    - [ ] GPU 环境 A/B 基准（速度/显存）
+      - [ ] 使用 `tests/benchmark_backbones.py` 在 GPU 上复现（20 次，512×512），记录 ms 与 VRAM
+      - [ ] 追加结果到 `docs/description/Performance_Benchmark.md`
+
+    - [ ] GPU 环境 Attention A/B 基准（速度/显存）
+      - [ ] 使用 `tests/benchmark_attention.py` 在 GPU 上复现（10 次，512×512），覆盖 `places` 组合（`backbone_high`/`det_head`/`desc_head`）
+      - [ ] 记录平均耗时与 VRAM 峰值，追加摘要到 `docs/description/Performance_Benchmark.md`
+
+    - [ ] 三维网格基准（Backbone × Attention × Single/FPN）
+      - [ ] 使用 `tests/benchmark_grid.py` 在 GPU 上跑最小矩阵（例如 3×3，runs=5）
+      - [ ] 将 JSON 存入 `results/benchmark_grid_YYYYMMDD.json`，在性能文档中追加表格摘要并链接 JSON
+
+    - [ ] 真实数据集精度评估（IoU/mAP 与收敛曲线）
+      - [ ] 固定数据与超参，训练 5 个 epoch，记录 loss 曲线
+      - [ ] 在验证集上评估 IoU/mAP，并与 vgg16 基线对比
+      - [ ] 形成对照表与初步结论
+
 **验收标准**:
 - [ ] 所有测试用例通过
 - [ ] 推理结果符合预期维度和范围
@@ -143,6 +162,12 @@
  - [ ] 日志查看方法
  - [ ] GPU 内存不足处理

+#### 3.4 预训练权重加载摘要（来自 NextStep 2.1 未完项）
+
+- [x] 在 `models/rord.py` 加载 `pretrained=true` 时，打印未命中层摘要
+  - [x] 记录：加载成功/跳过的层名数量
+  - [x] 提供简要输出（missing/unexpected keys，参数量统计）；实现：`models/rord.py::_summarize_pretrained_load`
+
 #### 3.2 编写配置参数文档

 - [ ] 创建 `docs/CONFIG.md`
--- a/docs/todos/04_Stage4_Advanced_Features.md
+++ b/docs/todos/04_Stage4_Advanced_Features.md
@@ -218,6 +218,41 @@

 ---

+### 4. 注意力机制集成（来自 NextStep 2.2）
+
+**目标**: 在骨干高层与头部前集成 CBAM / SE，并量化收益
+
+#### 4.1 模块实现与插桩
+- [ ] 实现 `CBAM` 与 `SEBlock`（或迁移可靠实现）
+- [ ] 在 `models/rord.py` 通过配置插拔：`attention.enabled/type/places`
+- [ ] 确保 forward 尺寸不变，默认关闭可回退
+
+#### 4.2 训练与评估
+- [ ] 选择入选骨干为基线，分别开启 `cbam` 与 `se`
+- [ ] 记录训练损失、验证 IoU/mAP、推理时延/显存
+- [ ] 可选：导出可视化注意力图
+
+**验收标准**:
+- [ ] 训练稳定，无数值异常
+- [ ] 指标不低于无注意力基线；若提升则量化收益
+- [ ] 配置可一键关闭以回退
+
+#### 4.3 扩展模块与插入位置消融
+- [ ] 扩展更多注意力模块：ECA、SimAM、CoordAttention、SKNet
+  - [ ] 在 `models/rord.py` 实现统一接口与注册表
+  - [ ] 在 `configs/base_config.yaml` 增加可选项说明
+- [ ] 插入位置消融
+  - [ ] 仅 `backbone_high` / 仅 `det_head` / 仅 `desc_head` / 组合
+  - [ ] 使用 `tests/benchmark_attention.py` 统一基准，记录 Single/FPN 时延与 VRAM
+  - [ ] 在 `docs/description/Performance_Benchmark.md` 增加“注意力插入位置”小节
+
+**验收标准**:
+- [ ] 所有新增模块 forward 通过，尺寸/类型与现有路径一致
+- [ ] 基准结果可复现并写入文档
+- [ ] 给出速度-精度权衡建议
+
+---
+
 ## 🔄 实施流程

 ### 第 1 周: 实验管理集成