融合矩阵分解和代价敏感的微生物数据扩增算法

root 提交于 周五, 06/17/2022 - 10:21
微生物会对人类健康产生直接影响,对相关数据的分析有助于疾病诊断。然而,采集到的数据存在类不平衡与高稀疏性两个问题。现有的过采样方法在一定程度上可缓解数据的类不平衡,但是难以应对微生物数据的高稀疏性。本文提出了一种融合矩阵分解和代价敏感的数据扩增算法,其包含3个技术。首先,将原始矩阵分解为样本子空间和特征子空间;其次,利用样本子空间的正向量及其近邻向量生成合成向量;最后,根据合成向量与所有负向量的距离对其过滤。实验在8个微生物数据集上进行,同时与5种过采样算法对比,结果表明本文所提算法能够增强正样本的多样性,在识别出更多正样本的同时,分类结果的代价更低。

相关内容

发布日期 01/10/2022 - 19:31
发布日期 10/31/2021 - 01:16
发布日期 11/09/2024 - 19:46
发布日期 11/17/2024 - 19:48
发布日期 07/23/2023 - 21:46
发布日期 03/11/2025 - 20:51
发布日期 06/17/2022 - 10:21
发布日期 10/14/2023 - 23:10
发布日期 06/05/2024 - 17:45