图像视频的多尺度表征与语义映射

发布时间: 2022-11-12

来源: 科技服务团

基本信息

合作方式：合作开发

成果类型：发明专利,软件著作权,著作权

行业领域：

电子信息技术,信息安全技术,计算机及网络技术

成果介绍

针对复杂图像视频内容，借鉴认知科学、语言学领域相关理论方法，团队以小尺度到大尺度的视觉内容表征，数据-语义场同型映射，结构化、层次化渐进语义映射学习为研究主线，提出了视觉内容多尺度表征与多层级语义映射学习框架，在视觉感知与认知之间建立了坚实宽广的桥梁。基于研究成果，参与制定了 IEEE 1857.6 视频内容描述国际标准；获得了多媒体顶级国际会议的技术挑战赛冠军；成果应用于网络内容监测、学前教育、内容服务等应用场景。

成果亮点

该项目面向国际前沿，在国家基金、科技部 973 等项目的支持下，历经十四年，针对复杂图像视频内容，研究了小尺度到大尺度的视觉内容表征，数据-语义场同型映射，结构化、层次化渐进语义映射学习等问题，取得了如下创新成果。 1. 针对传统视觉表征方法存在维数灾难和病态难题，提出了视觉内容的多尺度通用描述性表征框架和自适应层级特征融合方法，构建了视觉表征的空间可扩展和特征级融合模式。 2. 针对海量网络图像视频缺乏高质量语义标注及部分标签低质冲突等难题，建立了图像视频的数据-语义场同型化映射学习模型，实现了在弱标注及噪声环境下海量内容的结构语义一致性理解。

团队介绍

黄庆明男 1965-12-23 教授博士中国科学院大学本项目科学问题的提出者和总体研究思路的设计者。提出了图像视频的多尺度表征框架，建立了高维数据场的全局语义结构映射机制，实现了图像视频语义结构的渐进学习，完成了图像视频多尺度表征和渐进语义学习技术在内容服务等场景中的应用。 2 王树徽男 1983-7-9 副研究员博士中国科学院计算技术研究所主要负责图像视频语义映射理论与方法研究，从散度场角度提出了数据场多层拓扑信息扩散建模方法，提出了层次化语义结构和视觉特征的渐进学习框架，是科学发现 2 和科学发现 3 的重要完成人，初步验证了图像视频语义映射技术在学前教育等领域的应用前景。 3 许倩倩女 1983-11-2 副研究员博士中国科学院计算技术研究所主要负责图像视频数据-语义同型映射学习理论方法研究，利用旋度场对语义不一致性进行建模，为将群体智能引入图像视频理解领域提供了关键解决思路，是科学发18现 2 的重要完成人。

成果资料

产业化落地方案

点击查看

科创中国

友情链接

国际技术贸易

海外专利信息资源系统

省级中心站