研究背景
物联网作为信息世界向物理世界的延伸,拓展了人类认知和控制物理世界的能力。大数据技术能够帮助人们发现存在于日积月累数据中的客观规律,帮助人们预测未来和灵活决策。物联网和大数据技术的出现,也为人工智能技术提供了新的机遇,促使人工智能技术催生更多面向实际应用需求的研究方向:无人超市、无人物流、智能交通、智能家居等,这些应用的推广与使用将会使得“智能城市”和“智能乡村”成为现实。人工智能技术所蕴含的社会价值引起了世界各国的普遍关注,各国投入大量的人力物力进行人工智能的相关研究:欧盟的“人脑计划(Human Brain Project, HBP)”、美国的“美国国家人工智能研究和发展计划”、日本的“日本机器人战略-愿景、战略、行动计划”,我国政府也将人工智能列入国家“十三五”规划,国务院发布了“新一代人工智能发展规划”。
图1 人工智能的广泛应用场景
虽然新时代下的人工智能有巨大的潜在社会价值,但真正地把它在“智慧城市”中落实应用尚且有许多实际的问题需要亟待解决。这些问题可归纳为四个主要的方面:感知失谐、协作失调、场景失用和学习失律。
感知失谐,即局部片面地感知。这种感知的内容和实际的人类认识是分裂的,导致机器智能的决策失败。打个比方,评估一道菜需要从颜色、气味和味道三个方面进行,仅仅依靠鼻子的嗅觉、眼睛的视觉和舌头的味觉,都会导致人们无法全面正确地给出评估的结果。相应地,在人工智能中,无论采用机器视觉、雷达扫描还是其他单方面的感知技术,都只会是“盲人摸象”。
协作失调,即多种感知域无法很好地协作,利用已有的资源帮助机器决策。目前,在城市中广泛存在多种感知设备:摄像头、WiFi设备、红外传感器等。这些设备的感知域相互之间是分离独立的,每种设备都只用于特定方面的感知。哪怕同一类型的不同设备,所感知的信息也被分别处理,用来实现各自的目的。设备之间无法做到相互协调和相互补充,造成了资源的浪费,同时也无法做到不同感知技术的优势互补。
场景失用,日益增长的普适化应用需求与供能设备之间出现了鸿沟。物联网中很多感知节点是要依赖电池供电,然而电池电量有限,难以实现全域覆盖,并且存在更换维护困难的问题。特别是在航空物流等领域,受应用环境局限,节点无法配备电池。电池的局限性,已经严重制约了物联网普适化应用,迫切需要新型的能量获取与运用模式作为有效的补充手段,进一步拓展物联网的应用场景。
学习失律,即无法做到自主学习、终身学习。自主学习目前面临如下两个主要问题。第一,自主学习模型的更新、生长受限:由于现实世界中跨域多模态数据是在不断变化的,不同域间,不同模态间的数据有不同的变化方式和形态,这种剧烈的变化导致模型的智能生长受限;第二,自主学习推演协同困难:传统的方法多是基于文本(单模态)的规则式推演方式,效果差,适用性低。考虑多模态多模型协同推演有助于提高智能推演效果,但多模态数据存在巨大的语义鸿沟,导致实现协同推演困难。
综上所述,协同化和普适化的应用需求与人工智能技术现状之间出现了鸿沟,感知域的分离导致跨域协作困难,机器智能的应用场景受限,目前迫切需要跨域感知模式,增强机器智能的协同性和普适性。这些问题已经受到国内外的密切关注,跨域感知、迁移学习、增强学习和自主学习等技术正成为学术界研究的热点。SIGCOMM,NIPS,ICML等顶级会议将跨域感知、强化学习等列为专题。
研究内容
根据跨域感知与增强智能所面临的挑战,本项目确立了研究内容的三个主要科学问题:可信融合、深度迁移和自主学习。
可信融合。目前的多源异构信息可靠性弱,无法提供稳定保障。隐私保护与协调效率的矛盾难以调和。要想改变这个现状,就要解决信息域分离和覆盖局限难以提供可靠稳定感知信息的挑战,使得开放环境下的信息可靠,且重构异构的感知数据。在非开放环境下跨域分享信息对称。综上所述,我们提出了如下科学问题:如何利用环境中的已有的多种信息源,结合非传感器感知,实现跨域信息的可信融合,以及具有隐私保护能力的跨域信息共享。为了应对此科学问题,我们提出了针对核心判据缺失的跨域信息协作机制。对开放环境和隐私环境的跨域信息进行融合。
图2 针对核心判据缺失的跨域信息协作机理
深度迁移。目前的深度学习缺乏多源域迁移泛化能力,跨域连续迁移跨度受限。由于源域间关联关系复杂,跨域数据分布差异大,迁移场景的复杂性和多样性导致传统迁移学习难以解决跨域多模态感知的需求。综上所述,我们提出了如下科学问题:如何建立具有泛化能力的源域关联关系和多步连续迁移模型,提高迁移学习在复杂多态环境下的迁移能力。针对这一问题,我们提出了基于迁移对象选择的多源域多不连续迁移方法与理论。
图3 基于迁移对象选择的多源多步连续迁移方法理论
自主学习。目前的自主学习缺乏增量式智能生长方式,传统的智能推演手段基于单一原则,泛化能力差。要解决这个问题,我们需要应对复杂场景下非确定行导致的自主辨识能力缺乏,多模态数据推演困难的挑战。综上所述,我们提出了如下科学问题:如何高效利用跨域多模态交互数据构建完备的知识图谱,得到主动感知的框架和技术体系,以提升对未知环境的感知协同能力,实现智能推演。针对这一科学问题,我们提出基于跨域渐进式自主学习的智能推演基础理论。
图4 基于跨域渐进式自主学习的智能推演基础理论
任务分工
作为项目牵头单位的中国科学技术大学负责跨域可信融合方面的研究内容,主要包括跨域协同感知模型、数据获取与隐私保护、算法验证及性能评估,李向阳教授为课题负责人。西安交通大学负责深度迁移方面的研究内容,主要包括多源域隐关联挖掘、迁移判据分析建模、大跨度域间多步迁移、算法验证及系统整合,赵季中教授为课题负责人。中科院自动化所负责自主学习方面的研究,主要包括数据层和特征层框架、熵减和模糊理论驱动、渐进式跨域智能增长、知识图谱与智能推演,张天柱副研究员为课题负责人。该项目的研究团队共计25人,除了各课题的负责人外,参研人员还包括中国科学技术大学的杨盘隆教授、谈海生副教授和周颢副教授;西安交大的王进军教授;自动化所的杨小汕助理研究员。
预期成果
该项目的研究目标是实现多域协同关联分析,复杂环境下的主动学习与渐进式智能迭代增强。预期成果包括以下几个方面:实现跨域协同的多模态感知于增强智能技术,发表一流期刊和会议论文20余篇,申请相关专利4-6项,培养一批优秀青年学术带头人,形成一支具有国际影响力的优秀学术团队。