GRAFT:生命之树中专利申请的系统发育信号

root 提交于 周六, 05/30/2026 - 20:47
近缘物种是否会被用于相似的生物技术用途,即人类技术兴趣中的系统发育信号,迄今缺乏可在大规模上操作的检验。我们构建了 GRAFT(Graph of Relatedness, Applications, Families and Taxonomy),一个 Neo4j 知识图谱,将 Open Tree of Life 合成分类体系(4.53 × 10^6 个分类单元)与多语言俗名以及来自单次 257 GB SQL 扫描的 Google Patents BigQuery 专利层相连接,恢复出 22,876 个物种在 759,182 项专利中的关联,并解析了全部 CPC 和 IPC 分类定义。将每个物种的 CPC 子类谱视为二元应用向量,我们通过 Mantel 检验(999 次置换,n = 9,944 个至少拥有 5 项专利的物种,49,436,596 对)测试成对拓扑系统发育距离与专利谱成对 Jaccard 距离之间的相关性。总体相关性显著(Pearson r = +0.188,单侧 p = 0.001),并且从姐妹物种到类内的所有近距离分箱中均存在经 Bonferroni 校正后显著的系统发育信号。该信号并非无权拓扑的伪影:将系统发育距离重新表述为来自生命时间树(TimeTree of Life)的时间校准分化距离后,证实在约 500 Myr 的分化范围内各分箱均存在 Bonferroni 显著信号。同一图谱还支持一种预测性查询,可针对任一应用返回姐妹物种级别的生物勘探候选对象:十个 Angelica 同属物种尚未被标记用于药用制剂,而 A. sinensis(中药当归)已具有 86,814 条此类边。GRAFT 是一个开放且可扩展的框架,将系统发育、生态学与全球知识产权记录连接起来。

wim.vancriekinge{at}ugent.be

摘要 信息/历史 指标 数据/代码 预览 PDF

摘要 近缘物种是否会被重新用于相似的生物技术,这一关于人类技术兴趣中系统发育信号的问题,迄今缺乏一种可大规模实施的检验方法。我们构建了 GRAFT(相关性、应用、科与分类图谱;Graph of Relatedness, Applications, Families and Taxonomy),这是一个 Neo4j 知识图谱,通过一次 257 GB 的 SQL 扫描,将 Open Tree of Life 合成分类体系(4.53 × 10^6 个分类单元)与多语言俗名以及 Google Patents BigQuery 专利层连接起来,识别出 759,182 件专利中涉及的 22,876 个物种,并解析了所有 CPC 和 IPC 分类定义。将每个物种的 CPC 子类谱视为二元应用向量后,我们采用 Mantel 检验(999 次置换,n = 9,944 个至少出现在 5 件专利中的物种,49,436,596 个配对),检验了成对拓扑系统发育距离与专利谱成对 Jaccard 距离之间的相关性。全局相关性显著(Pearson r = +0.188,单侧 p = 0.001),且从姐妹种到纲内的每一个近距离区间中,系统发育信号均达到 Bonferroni 校正后的显著性。该信号并非未加权拓扑结构的人为产物:将系统发育距离重新表示为来自 TimeTree of Life 的时间校准分化时间后,结果证实在直至约 5 亿年分化的每一个区间中,系统发育信号均达到 Bonferroni 校正后的显著性。同一图谱还支持一种预测性查询,可针对任何应用返回姐妹种生物勘探候选物种:例如,在当归属中,有 10 个近缘种尚未被标记为药用制剂相关对象,而 A. sinensis(中国当归)已具有 86,814 条此类关联边。GRAFT 是一个开放且可扩展的框架,用于连接系统发育、生态学与全球知识产权记录。

利益冲突声明 脚注 https://github.com/wvcrieki42/GRAFT

版权 持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 本文依据 CC-BY 4.0 国际许可协议 发布。

查看讨论串。 返回顶部 上一页 下一页

发表于 2026 年 5 月 29 日。

下载 PDF

数据/代码

电子邮件 感谢您有意帮助传播 bioRxiv。 您的电子邮箱 *

您的姓名 *

发送至 *

请输入多个地址,每行一个,或用逗号分隔。

您将发送以下内容 GRAFT:生命之树上专利应用中的系统发育信号

邮件主题 (您的姓名)已从 bioRxiv 向您转发一个页面

邮件正文 (您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。

您的个人留言

验证码 此问题用于测试您是否为人类访客,并防止自动化垃圾信息提交。

分享 GRAFT:生命之树上专利应用中的系统发育信号

Wim Van Criekinge

bioRxiv 2026.05.27.728288; doi: https://doi.org/10.64898/2026.05.27.728288

分享本文: 复制

引文工具 GRAFT:生命之树上专利应用中的系统发育信号

Wim Van Criekinge

bioRxiv 2026.05.27.728288; doi: https://doi.org/10.64898/2026.05.27.728288


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.27.728288v1?rss=1

🏷️ 系统发育信号 知识图谱 专利分析 生命之树 生物勘探 Mantel检验