图文跨模态检索研究进展

root 提交于 周五, 06/17/2022 - 10:21
随着互联网技术的迅速发展,文本和图像等各种类型的数据在网络上呈现爆发式增长,如何从这些多源异构且语义关联的多模态数据中获取有价值的信息则尤为重要。跨模态检索能够突破模态的限制,跨越不同模态的数据进行信息检索,满足用户获取有关事件信息的需求。近年来,跨模态检索已经成为了学术界和工业界研究的热点问题。本文聚焦于图文跨模态检索任务,首先介绍图文跨模态检索的定义,并分析说明了当前该任务面临的挑战。其次,对现有的研究方法进行归纳总结,将其分为3大类:(1)传统方法;(2)基于深度学习的方法;(3)基于哈希表示的方法。然后,详细介绍了图文跨模态检索的常用数据集,并对常用数据集上已有算法进行详细分析与比较。最后,对图文跨模态检索任务的未来发展方向进行展望。

相关内容

发布日期 08/04/2020 - 01:35
发布日期 10/31/2021 - 01:53
发布日期 06/17/2022 - 10:21
发布日期 08/31/2024 - 19:26
发布日期 06/17/2022 - 10:21
发布日期 08/04/2020 - 01:35
发布日期 01/10/2022 - 19:31
发布日期 01/10/2022 - 19:31
发布日期 01/18/2024 - 12:10