添加数据增强方案以及扩散生成模型的想法
This commit is contained in:
@@ -82,6 +82,25 @@
|
||||
- [ ] 特征维度一致性检查
|
||||
- [ ] GPU/CPU 切换测试
|
||||
|
||||
#### 2.3 基准与评估补充(来自 NextStep 2.1 未完项)
|
||||
|
||||
- [ ] GPU 环境 A/B 基准(速度/显存)
|
||||
- [ ] 使用 `tests/benchmark_backbones.py` 在 GPU 上复现(20 次,512×512),记录 ms 与 VRAM
|
||||
- [ ] 追加结果到 `docs/description/Performance_Benchmark.md`
|
||||
|
||||
- [ ] GPU 环境 Attention A/B 基准(速度/显存)
|
||||
- [ ] 使用 `tests/benchmark_attention.py` 在 GPU 上复现(10 次,512×512),覆盖 `places` 组合(`backbone_high`/`det_head`/`desc_head`)
|
||||
- [ ] 记录平均耗时与 VRAM 峰值,追加摘要到 `docs/description/Performance_Benchmark.md`
|
||||
|
||||
- [ ] 三维网格基准(Backbone × Attention × Single/FPN)
|
||||
- [ ] 使用 `tests/benchmark_grid.py` 在 GPU 上跑最小矩阵(例如 3×3,runs=5)
|
||||
- [ ] 将 JSON 存入 `results/benchmark_grid_YYYYMMDD.json`,在性能文档中追加表格摘要并链接 JSON
|
||||
|
||||
- [ ] 真实数据集精度评估(IoU/mAP 与收敛曲线)
|
||||
- [ ] 固定数据与超参,训练 5 个 epoch,记录 loss 曲线
|
||||
- [ ] 在验证集上评估 IoU/mAP,并与 vgg16 基线对比
|
||||
- [ ] 形成对照表与初步结论
|
||||
|
||||
**验收标准**:
|
||||
- [ ] 所有测试用例通过
|
||||
- [ ] 推理结果符合预期维度和范围
|
||||
@@ -143,6 +162,12 @@
|
||||
- [ ] 日志查看方法
|
||||
- [ ] GPU 内存不足处理
|
||||
|
||||
#### 3.4 预训练权重加载摘要(来自 NextStep 2.1 未完项)
|
||||
|
||||
- [x] 在 `models/rord.py` 加载 `pretrained=true` 时,打印未命中层摘要
|
||||
- [x] 记录:加载成功/跳过的层名数量
|
||||
- [x] 提供简要输出(missing/unexpected keys,参数量统计);实现:`models/rord.py::_summarize_pretrained_load`
|
||||
|
||||
#### 3.2 编写配置参数文档
|
||||
|
||||
- [ ] 创建 `docs/CONFIG.md`
|
||||
|
||||
@@ -218,6 +218,41 @@
|
||||
|
||||
---
|
||||
|
||||
### 4. 注意力机制集成(来自 NextStep 2.2)
|
||||
|
||||
**目标**: 在骨干高层与头部前集成 CBAM / SE,并量化收益
|
||||
|
||||
#### 4.1 模块实现与插桩
|
||||
- [ ] 实现 `CBAM` 与 `SEBlock`(或迁移可靠实现)
|
||||
- [ ] 在 `models/rord.py` 通过配置插拔:`attention.enabled/type/places`
|
||||
- [ ] 确保 forward 尺寸不变,默认关闭可回退
|
||||
|
||||
#### 4.2 训练与评估
|
||||
- [ ] 选择入选骨干为基线,分别开启 `cbam` 与 `se`
|
||||
- [ ] 记录训练损失、验证 IoU/mAP、推理时延/显存
|
||||
- [ ] 可选:导出可视化注意力图
|
||||
|
||||
**验收标准**:
|
||||
- [ ] 训练稳定,无数值异常
|
||||
- [ ] 指标不低于无注意力基线;若提升则量化收益
|
||||
- [ ] 配置可一键关闭以回退
|
||||
|
||||
#### 4.3 扩展模块与插入位置消融
|
||||
- [ ] 扩展更多注意力模块:ECA、SimAM、CoordAttention、SKNet
|
||||
- [ ] 在 `models/rord.py` 实现统一接口与注册表
|
||||
- [ ] 在 `configs/base_config.yaml` 增加可选项说明
|
||||
- [ ] 插入位置消融
|
||||
- [ ] 仅 `backbone_high` / 仅 `det_head` / 仅 `desc_head` / 组合
|
||||
- [ ] 使用 `tests/benchmark_attention.py` 统一基准,记录 Single/FPN 时延与 VRAM
|
||||
- [ ] 在 `docs/description/Performance_Benchmark.md` 增加“注意力插入位置”小节
|
||||
|
||||
**验收标准**:
|
||||
- [ ] 所有新增模块 forward 通过,尺寸/类型与现有路径一致
|
||||
- [ ] 基准结果可复现并写入文档
|
||||
- [ ] 给出速度-精度权衡建议
|
||||
|
||||
---
|
||||
|
||||
## 🔄 实施流程
|
||||
|
||||
### 第 1 周: 实验管理集成
|
||||
|
||||
Reference in New Issue
Block a user