在FACED数据集上，驱动EEG分类的是刺激身份而非情绪|||北京沫之东生物技术有限公司

4 次围观

可靠的基准数据集对于推进基于 EEG 的情绪识别至关重要。细粒度情感计算 EEG 数据集（FACED）是目前公开可用的最大 EEG 情绪数据集（123 名受试者，九类情绪），也是被广泛采用的基准。我们表明，在 FACED 上进行的被试内和跨被试分类，主要反映的是刺激身份而非情绪。通过使用线性分类器（LinearSVC）和深度学习模型（CLISA），我们发现：（1）对于受试者报告感受到指定情绪与未感受到指定情绪的试次，分类性能相当；（2）当以个体自我报告替代刺激所指定的标签时，准确率下降；（3）当每种情绪仅保留一个视频时，尽管舍弃了三分之二的数据，准确率反而提高。这些结果反映了 FACED 中的三项设计选择：每一类别中的刺激数量较少、采用刺激指定标签，以及在交叉验证中使用视频内部的时间划分。综合来看，这些因素使该数据集易受时间自相关和刺激身份混杂因素的影响。为指导未来研究，我们提出了五项建议——涵盖刺激多样性、时间独立性和标签验证——用于设计能够减轻这些混杂因素的情绪解码研究。

可靠的基准数据集对于推动基于脑电图（EEG）的情绪识别至关重要。更细粒度情感计算脑电数据集（Finer-grained Affective Computing EEG Dataset, FACED）是目前公开可用的最大脑电情绪数据集（123名受试者，九类情绪），也是被广泛采用的基准。我们证明，在FACED上进行的被试内分类和跨被试分类，主要反映的是刺激身份而非情绪。通过使用线性分类器（LinearSVC）和深度学习模型（CLISA），我们表明：（1）对于受试者报告感受到指定情绪与未感受到指定情绪的试次，分类性能相当；（2）当用个体自我报告替代刺激指定标签时，准确率下降；（3）尽管舍弃了三分之二的数据，当每种情绪仅保留一个视频时，准确率反而上升。这些结果反映了FACED中的三项设计选择：每个类别的刺激数量较少、采用刺激指定标签，以及在交叉验证中使用视频内部的时间划分。综合来看，这些因素使该数据集容易受到时间自相关和刺激身份混杂的影响。为指导未来研究，我们提出了五项建议——涵盖刺激多样性、时间独立性和标签验证——用于设计能够减轻这些混杂因素的情绪解码研究。

📄 原文链接：https://www.biorxiv.org/content/10.64898/2026.06.12.731889v1?rss=1

🏷️ 脑电图情绪识别数据集偏倚刺激身份混杂分类模型

来源出处

在FACED数据集上，驱动EEG分类的是刺激身份而非情绪 https://www.biorxiv.org/content/10.64898/2026.06.12.731889v1?rss=1