加载中...

毕业设计文献阅读——[CVPRW2024]Latent-based Diffusion Model for Long-tailed Recognition

发表于2026-01-30|更新于2026-02-15|计算机

|字数总计:359|阅读时长:1分钟|阅读量:

这篇论文的原理上不算复杂。
主要工作和贡献：

将扩散模型应用到长尾数据的识别中（首次），通过扩散模型，对长尾数据进行数据增强，优化了识别效果。
在潜空间而非像素空间运用扩散模型，减少了计算开销，提升速度。
在不同的基线模型上，运用作者提出的模型（LDMLR），提升了在长尾数据识别工作的性能。

一些知识

长尾数据：长尾数据（Long-tailed Data）是指在数据集分布中，少数类（头部类）包含大量样本，而大多数类（尾部类）仅有极少样本的偏态分布现象。这种数据分布会导致机器学习模型在头部类上表现良好，但在长尾部分的样本识别率低、效率不高，从而显著降低整体模型精度。
不平衡因子:IF = 数量最多的类别的样本数 / 数量最少的类别的样本数
长尾数据的常用处理方法：数据重采样（包含过采样和欠采样）、代价敏感学习和重加权、表示学习解耦、迁移学习和知识蒸馏

本论文的思路类似于表示学习解耦。

模型原理

LDMLR模型分为三个部分，图像编码、表征生成、分类器训练。

图像编码

把常用的

文章作者: Sinohope

文章链接: https://liu-cy.top/2026/01/30/%E6%AF%95%E4%B8%9A%E8%AE%BE%E8%AE%A1%E6%96%87%E7%8C%AE%E9%98%85%E8%AF%BB%E2%80%94%E2%80%94-CVPRW2024-Latent-based-Diffusion-Model-for-Long-tailed-Recognition/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 The Site Of Liu！

投喂作者

微信
支付宝

相关推荐

毕业设计文献阅读--From Poses to Identity:Training-Free Person Re-Identification via Feature Centralization

毕业设计文献阅读--OmniPerson: Unified Identity-Preserving Pedestrian Generation

毕业设计文献阅读——[CVPR2023]Person Image Synthesis via Denoising Diffusion Model

数据库加载中