- 3 次围观
空间生物学实验成本高昂、后勤组织复杂,并且在样本量上具有内在限制,导致所得数据集往往不完整且高度异质(2)。缺失数据是构建可靠计算模型以揭示人体如何响应航天飞行的根本障碍。本研究提出了一个通过插补处理缺失数据的系统性框架。我们开发了一个经过验证的四阶段插补框架,专门用于保留数字孪生开发所需的生物学信号,同时量化下游分析中的权衡。以 NASA RR9 任务的视网膜成像和组学数据作为案例研究(9),我们展示了如何诊断数据缺失的原因(10)、选择并优化适当的插补策略(5,10),以及严格评估插补后的数据是否仍具有生物学意义。本研究的一个关键发现是,尽管插补可显著提高预测模型的性能,但它也可能同时掩盖细微的生物学模式;这是研究人员在应用这些方法之前必须理解的一项关键权衡(11)。该框架为处理空间生物学中稀疏、多模态数据集的空间生物学家和数据科学家提供了实用且可操作的指导,并代表着朝向构建更完整、更可靠的极端环境下人体生理学数据驱动模型迈出的基础性一步。
空间生物学实验成本高昂、后勤组织复杂,并且在样本量上具有内在限制,导致所得数据集往往不完整且高度异质(2)。缺失数据是构建可靠计算模型以刻画人体如何响应航天飞行的根本性障碍。本研究提出了一个通过插补处理缺失数据的系统性框架。我们开发了一个经过验证的四阶段插补框架,专门用于在量化下游分析权衡的同时,保留数字孪生开发所需的生物学信号。以 NASA RR9 任务中的视网膜成像和组学数据作为案例研究(9),我们展示了如何诊断数据缺失的原因(10)、选择并优化适当的插补策略(5,10),以及严格评估插补后的数据是否仍具有生物学意义。本研究的一项关键发现是,尽管插补能够显著提高预测模型的性能,但它也可能同时掩盖细微的生物学模式;这是研究人员在应用这些方法之前必须理解的一项关键权衡(11)。该框架为处理空间生物学中稀疏、多模态数据集的空间生物学家和数据科学家提供了实用且可操作的指导,并代表了朝着构建更完整、更可靠的极端环境下人类生理数据驱动模型迈出的基础性一步。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.09.730965v1?rss=1
🏷️ 空间生物学 多模态数据插补 视网膜成像 组学数据 数字孪生 航天生理学
来源出处
稀疏多模态空间生物学数据的系统性插补框架:在 RR9 任务视网膜成像与组学数据中的应用
https://www.biorxiv.org/content/10.64898/2026.06.09.730965v1?rss=1