OMIO:一个面向可复现显微图像输入/输出的策略驱动型 Python 库

root 提交于 周五, 06/12/2026 - 16:47
现代荧光显微镜与多光子显微镜工作流程运行于一个异构的生态系统之中,其中包含多种文件格式、部分重叠的元数据标准以及依赖特定读取器的约定。在实践中,这种情况常常导致坐标轴被悄然误判、物理体素尺寸信息丢失或损坏,以及实验室特定的“胶水代码”变得脆弱、文档不完善且难以复现。OMIO,即 Open Microscopy Image I/O,旨在通过为 Python 提供一个轻量级、策略驱动的图像 I/O 层来解决这些问题,并在 API 边界强制实施一种规范化的、与 OME 兼容的数据表示。 OMIO 的核心贡献在于将底层格式访问与语义规范化明确分离。现有读取器库被用作可互换的后端,以提取像素数据和可用元数据,而 OMIO 则在一个集中化且可审计的策略层中强制执行坐标轴约定、元数据解释和回退决策。这种设计使得异构的显微成像输入能够被转换为稳定的数据表示,而无需将特定后端的假设传播到下游分析代码中。 OMIO 的核心设计原则包括:规范化的坐标轴语义(TZCYX)、具有显式且可审计回退机制的稳健元数据规范化、通过可选的基于 Zarr 的后端实现的内存感知型操作,以及超越单个文件、扩展到文件夹堆栈和类 BIDS 项目结构的工作流级语义。该架构使 OMIO 能够将现有读取器库编排为一个连贯且可复现的 I/O 流水线,而无需替代或重复其功能。 OMIO 被实现为一个开源、面向社区的系统,其中对附加文件格式和元数据约定的支持可以通过模块化读取器后端逐步增加。通过鼓励贡献示例数据集、后端扩展和功能请求,OMIO 被设计为能够随着新兴采集系统的发展而演进,同时在接口层面保持严格的语义保证。由此产生的标准化 OME-TIFF 输出可立即用于科学 Python 工作流程中的下游定量分析和交互式检查,包括基于 ImageJ 和 Napari 的工作流程。

现代荧光显微镜与多光子显微镜工作流程运行于一个由异构文件格式、部分重叠的元数据标准以及读取器特定约定构成的生态系统中。在实践中,这常常导致坐标轴被无提示地误解释、物理体素尺寸信息丢失或损坏,以及依赖实验室特定“胶水代码”的工作流——这些代码通常脆弱、文档不完善且难以复现。OMIO,即 Open Microscopy Image I/O,旨在通过为 Python 提供一个轻量级、策略驱动的图像 I/O 层来解决这些问题,并在 API 边界强制采用一种规范化的、与 OME 兼容的数据表示。

OMIO 的核心贡献在于将底层格式访问与语义规范化明确分离。现有读取器库被用作可互换的后端,用于提取像素数据和可用元数据,而 OMIO 则在一个集中化且可审计的策略层中强制执行坐标轴约定、元数据解释以及回退决策。这种设计使异构显微镜输入能够被转换为一种稳定的表示形式,而不会将后端特定的假设传播到下游分析代码中。

OMIO 的核心设计原则包括:规范化的坐标轴语义(TZCYX)、具有显式且可审计回退机制的稳健元数据规范化、通过可选的基于 Zarr 的后端实现内存感知操作,以及超越单个文件、扩展到文件夹堆栈和类 BIDS 项目结构的工作流级语义。该架构使 OMIO 能够将现有读取器库编排为一个连贯且可复现的 I/O 流水线,而无需替代或重复其功能。

OMIO 被实现为一个开源且面向社区的系统,其中对附加文件格式和元数据约定的支持可以通过模块化读取器后端逐步添加。通过鼓励贡献示例数据集、后端扩展和功能请求,OMIO 被设计为能够在保持接口层面严格语义保证的同时,与新兴采集系统共同演进。最终生成的标准化 OME-TIFF 输出可立即用于下游定量分析以及科学 Python 工作流中的交互式检查,包括基于 ImageJ 和 Napari 的工作流。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.09.731118v1?rss=1

🏷️ 显微图像处理 图像输入输出 OME-TIFF 元数据规范化 可复现研究 Python库