模型
选择模型架构
总结: 在开始一个新项目时,尽量重用有效的模型。
- 首先选择一个完善且常用的模型架构来开始工作。这样可以尽早让模型进入工作状态,之后再构建自定义模型也是可行的。
- 模型架构通常具有各种超参数,用于确定模型的大小和其他细节(例如层数、层宽度、激活函数类型)。
- 因此,选择架构实际上意味着选择一整个系列的各种模型(每个模型都有不同的超参数设置)。
- 如果可以的话,请尝试找到一篇尽可能接近手头问题的相关论文,并将复现该论文中的模型作为起点。
- 数据量少的时候,最好使用带预训练参数(如Imagenet)的模型去微调。
上次更新: 2025/04/02, 12:03:38