- 4 次围观
可靠的基准数据集对于推进基于 EEG 的情绪识别至关重要。细粒度情感计算 EEG 数据集(FACED)是目前公开可用的最大 EEG 情绪数据集(123 名受试者,九类情绪),也是被广泛采用的基准。我们表明,在 FACED 上进行的被试内和跨被试分类,主要反映的是刺激身份而非情绪。通过使用线性分类器(LinearSVC)和深度学习模型(CLISA),我们发现:(1)对于受试者报告感受到指定情绪与未感受到指定情绪的试次,分类性能相当;(2)当以个体自我报告替代刺激所指定的标签时,准确率下降;(3)当每种情绪仅保留一个视频时,尽管舍弃了三分之二的数据,准确率反而提高。这些结果反映了 FACED 中的三项设计选择:每一类别中的刺激数量较少、采用刺激指定标签,以及在交叉验证中使用视频内部的时间划分。综合来看,这些因素使该数据集易受时间自相关和刺激身份混杂因素的影响。为指导未来研究,我们提出了五项建议——涵盖刺激多样性、时间独立性和标签验证——用于设计能够减轻这些混杂因素的情绪解码研究。
可靠的基准数据集对于推动基于脑电图(EEG)的情绪识别至关重要。更细粒度情感计算脑电数据集(Finer-grained Affective Computing EEG Dataset, FACED)是目前公开可用的最大脑电情绪数据集(123名受试者,九类情绪),也是被广泛采用的基准。我们证明,在FACED上进行的被试内分类和跨被试分类,主要反映的是刺激身份而非情绪。通过使用线性分类器(LinearSVC)和深度学习模型(CLISA),我们表明:(1)对于受试者报告感受到指定情绪与未感受到指定情绪的试次,分类性能相当;(2)当用个体自我报告替代刺激指定标签时,准确率下降;(3)尽管舍弃了三分之二的数据,当每种情绪仅保留一个视频时,准确率反而上升。这些结果反映了FACED中的三项设计选择:每个类别的刺激数量较少、采用刺激指定标签,以及在交叉验证中使用视频内部的时间划分。综合来看,这些因素使该数据集容易受到时间自相关和刺激身份混杂的影响。为指导未来研究,我们提出了五项建议——涵盖刺激多样性、时间独立性和标签验证——用于设计能够减轻这些混杂因素的情绪解码研究。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.12.731889v1?rss=1
🏷️ 脑电图 情绪识别 数据集偏倚 刺激身份混杂 分类模型
来源出处
在FACED数据集上,驱动EEG分类的是刺激身份而非情绪
https://www.biorxiv.org/content/10.64898/2026.06.12.731889v1?rss=1