这篇论文的原理上不算复杂。
主要工作和贡献:

  • 将扩散模型应用到长尾数据的识别中(首次),通过扩散模型,对长尾数据进行数据增强,优化了识别效果。
  • 在潜空间而非像素空间运用扩散模型,减少了计算开销,提升速度。
  • 在不同的基线模型上,运用作者提出的模型(LDMLR),提升了在长尾数据识别工作的性能。

一些知识

  • 长尾数据:长尾数据(Long-tailed Data)是指在数据集分布中,少数类(头部类)包含大量样本,而大多数类(尾部类)仅有极少样本的偏态分布现象。这种数据分布会导致机器学习模型在头部类上表现良好,但在长尾部分的样本识别率低、效率不高,从而显著降低整体模型精度。
  • 不平衡因子:IF = 数量最多的类别的样本数 / 数量最少的类别的样本数
  • 长尾数据的常用处理方法:数据重采样(包含过采样和欠采样)、代价敏感学习和重加权、表示学习解耦、迁移学习和知识蒸馏

本论文的思路类似于表示学习解耦。

模型原理

LDMLR模型分为三个部分,图像编码、表征生成、分类器训练。

图像编码

把常用的