论坛首页 论坛概述 青年学者论坛 最新动态 会议纵览 会议申请 联系我们 今天:2024年03月29日 星期五
信息物理融合系统(CPS)中的数据管理关键技术
1 信息产业发展的新趋势-CPS
  自二十世纪六十年代以来,电子技术,计算技术和网络技术等取得了飞速发展,特别是网络技术的革新成为了这场方兴未艾的伟大IT革命的重要动力源泉。网络的规模及其新应用领域正日益得到扩展,其最引人举目的是新网络技术和物理设备系统的结合。随着传感器、嵌入式计算设备或终端、高性能通信设备、各种消费类和工程类电子设备等物理设施的大量接入,新型计算机化和网络化的物理设备系统网络的规模得以急剧膨胀。同时,随着国家大型电力网络、航空航天交通控制网络、高速公路交通控制网络、卫生防疫应急响应网络、远程医疗与社区医保网络、海洋搜寻与救援网络等大型或者特大型网络物理设备系统的蓬勃发展,以及网络家电、汽车引擎智能网络控制系统、心房脉冲产生器、纳米级制造控制系统等小型或者微型网络物理设备系统的出现,突破了传统物理领域中的网络应用形式,使得用联网计算方式来整合物理系统和计算系统以实现物理设备的功能扩展成为物理系统发展的新趋势,并由此导致出现了新一代的并由此导致出现了新一代的工程系统:信息物理融合系统(Cyber—physical Systems,CPS)。CPS网络在工业生产与国民经济生活中的基础性、全局性作用正日益增强。
2 什么是CPS
  CPS,从广义上来理解,就是一个在环境感知的基础上,深度融合了计算、通信和控制能力的可控可信可扩展的网络化物理设备系统,它通过计算进程和物理进程相互影响的反馈循环实现深度融合和实时交互来增加或扩展新的功能,以安全、可靠、高效和实时的方式监测或者控制物理实体。CPS的终极目标是实现信息世界和物理世界的完全融合,构建一个可控、可信、可扩展并且安全高效的CPS网络,并最终从根本上改变人类构建工程物理系统的方式[1]。
  新的信息世界观认为现代世界是由物理世界、信息世界和人类社会所组成的三元世界。人-机-物三元世界[2](如下图1所示)是一个多人、多机、多物组成的动态开发的网络世界。从交互的角度来看,融合了信息世界和物理世界的CPS改变了我们人和物理世界交互的方式,正如Internet改变了我们彼此之间的交互方式一样。CPS这种新方式所完成的是物理设备系统的“三化”:信息化、网络化和智能控制化。因此,从本质上来理解,CPS实际上是一个“3C”(Computation, Communication and Control)融合系统,体现了信息科学,物理科学,控制科学和系统科学的交叉与融合,它以信息处理任务为核心,计算部件完成计算功能,并通过高性能通信网络完成数据通信,通过开放的大规模循环控制实现对物理实体的监测与控制,其体现的“3C”概念模型如图2所示。从结构上来看,CPS系统需要包括这样几个部分:(1)传感器,用于感知物理世界的信息;(2)控制器/执行器,用于实施对物理实体的操作;(3)计算部件,可能是集中式的也可能式分布式的,能根据物理信息做出恰当的处理与分析,并做出控制/执行策略;(4)通信网络,用于连接以上各个单元以及相关的信息、对象、事件和人物,网络的规模式是大规模甚至于全球级的互联。从功能上来看,CPS具备五大功能特性:(1)计算功能;(2)网络通信功能;(3)精确控制功能;(4)远程协作功能;(5)自治功能。
3 CPS中数据的新特征
  如前所述,CPS的终极目标是实现信息世界和物理世界的完全融合,并改变我们和物理世界的交互方式,其基本形式都是通过在物理系统的物理部件中引入计算部件和网络通信部件,并使得计算进程和物理进程进行实时交互来增强物理设备的功能或者增添物理设备新的功能[3—5]。由此,CPS系统中的数据应具有五个关键特征:
(1)异构性:CPS系统网络支持多种异构网络互联和支持多种复杂的异构应用系统集成,因而涉及到多种多样的异构数据。例如从数据本身的属性来看,有描述物理不同特征的数据;从数据的基本格式来看,有数据格式、科学文本格式以及XML格式等;从数据的结构来看,有结构化数据、半结构化数据和非结构化数据等;从数据语义来看,有采集的底层原始数据和数据聚合后的高层概括性数据等。
(2)动态性:描述CPS实体的数据具有显著的动态性。数据的动态性主要表现在三个方面:一是CPS系统网络中物理设备的加入、删除和移动等情况,导致数据处于不断动态变化中;二是CPS系统网络中的数据是上下文相关的,即具有情景相关性;三是CPS系统的功能和显著特点是通过物理实体和计算实体的交互表现出来的,因而CPS的物理设备之间以及物理进程与计算进程之间具有紧密交互的特征,这种紧密交互行为也导致数据处于不断动态变化中。而数据的动态性则会进一步导致部分数据存在不确定性。
(3)实时性:大多数CPS系统的建立为了支持实时应用,如实时观测、实时监控、实时控制和实时预测等,以便及时了解物理设备的现况,通过网络化控制手段对物理设备和环境进行必要的控制和干预。因此,CPS数据处理必须满足实时需求,保证在限定的时间内给出正确的处理结果。
(4)海量性:CPS系统网络有数亿或者数十亿个物理设备彼此连接和整合而成的动态网络,这些数量庞大的智能设备进行实时数据采集和彼此之间信息交互,产生巨大的数据量。例如用CPS技术实现的智能交通系统中,可能在一辆汽车中需要处理的由各个传感器节点所采集的实时数据就会达到海量的程度。因此,海量数据处理的需求会变得非常普遍。
(5)可信性:由于CPS系统网络的复杂性,系统中存在许多不可预知的因素,这些不可预知的因素所产生的数据不确定性将影响数据处理的各个阶段,包括数据采集、数据传输、数据加工和数据反馈等,尤其是在数据加工处理的聚集计算、查询处理、数据分析中更需要保证数据处理的可信性,对可能出现的错误或者系统故障,应具有容错能力,保证数据处理结果的正确性、可靠性和安全性。可信性包含的另外一个方面是隐私保护,要求在对原始数据内容保密的情况下仍然提供定制的服务。
4 CPS中数据管理关键技术
  CPS会被应用到非常广泛的各种领域中,这些系统需要实现支持异构网络互联和支持异构应用系统集成,因此,CPS是一种非常典型的复杂系统,其数据管理的关键技术涉及各个方面,主要包括:多源、异构、海量数据的融合与集成技术;低耦合、高扩展的不确定数据并行查询处理与概率推演技术;从原始数据到受信任知识的处理依赖链相关新理论和建模技术;知识的可信性及其推演机制;数据服务的安全保障与隐私保护技术。
  多源、异构、海量数据的融合与集成技术:数据融合与集成技术是管理大规模、异构数据源不可或缺的关键技术。由于异构数据源的语义、模型以及映射与转换机制等都可能存在差异,需要将异构数据源转换成共享的中间模式,并基于中间模式处理数据交互与通信。同时由于数据规模是海量的,这些海量数据难以全部都保存下来,需要对CPS系统中的源数据进行数据聚合计算和融合处理,形成有意义的逻辑数据,并对高层的逻辑数据进行数据集成,以满足高层应用系统的需求。
  低耦合、高扩展的不确定数据并行查询处理与概率推演技术:查询处理技术是数据管理技术的重要内容。由于在异构的、分布式的CPS环境下,数据具有相异的时空特性(即数据来源于不同的数据源且产生于不同的时刻)和动态变化特性,尤其是不确定性数据对于不同的应用具有不同的意义,意味着不同事件的产生,需要通过低耦合、高扩展的不确定性数据并行查询处理,获得物理设备的状态信息或者相关事件信息,制定相应的系统反应与处理措施。此外,相对于确定数据查询处理的概率值概念而言,不确定数据查询处理需要引入概率维度概念,当各个数据元组的取值必须通过概率分布函数来描述,且在概率分布函数无法预先指定的情况下,就需要采用不确定数据概率推演技术来解决问题。
  从原始数据到受信任知识的处理依赖链相关新理论和建模技术:一堆纷繁复杂的原始数据对应用系统来说,没有直接的应用价值,因此需要采用数据挖掘技术从大量纷繁复杂的原始数据中获取受信任的知识,即需要捕获从原始数据到受信任的知识过程处理依赖链。CPS中环境感知系统的节点需要进行实时数据采集和彼此之间信息交互,这些数据通常以流(Stream)的形式产生,并且在通常情况下是高速产生的。因而这种实时的数据流挖掘和从静态数据中获取知识有很大的不同。这不仅仅需要简单的吞吐量,尽管这对它本身是一个挑战,更需要更好地理解如何保持和操控多个数据元组,有一些更接近样本数据,一些更抽象,这样就可以更高效地检索和浏览实时数据了。我们也需要记录历史的和信息感知的数据存储,让我们能更有目的性和方向性,也更高效地检索有意义的数据。
  知识的可信性及其推演机制:数据源的可靠性和知识的可信性都是必需的,同时把对创建知识的评价反馈给物理层也很重要[6]。当数据存在不确定性时,数据的推演过程既是不确定性不断演化的过程,也是数据世系不断丰富的过程,而世系可以用来追踪、评价数据质量和可靠性。CPS系统中,数据质量可以用准确度、置信度和完整性等指标来衡量。
  数据服务的安全保障与隐私保护技术:数据管理中的安全性和私密性论题是CPS科学理论挑战的重要内容[7]。由于CPS系统的开放性,在保证数据有效性和可用性的前提下,如何保护海量数据的安全性和隐私性成为了一个棘手问题。CPS面临新的安全威胁――物理系统可能遭受来自网络空间的攻击,并且网络空间也可能遭受来自物理设备的攻击,同时物理系统会泄漏信息,能够被隐藏的隐私信息很有限,例如由于多数收发器上存在的物理层指纹而导致的容易泄漏位置和时间以及个人身份信息。CPS面对非常规的在当前网络系统中还没发现的安全攻击是很脆弱,难于抵御新型CPS攻击。因此,需要提供适合CPS特征的轻量级数据安全保障和隐私保护解决方案。此外,数据安全保障与隐私保护,还涉及到社会法律等问题。
5 总结与展望
  本文在分析当今信息产业发展新趋势的基础上,阐述了CPS的本质内涵,并进一步结合CPS系统中数据的异构性、动态性、实时性、海量性和可信性等鲜明特征,阐述了CPS系统中数据管理的若干关键技术,包括多源、异构、海量数据的融合与集成技术;低耦合、高扩展的不确定数据并行查询处理与概率推演技术;从原始数据到受信任知识的处理依赖链相关新理论和建模技术;知识的可信性及其推演机制;数据服务的安全保障与隐私保护技术。
  信息物理融合系统CPS的研究与发展,离不开数据管理技术的支持,并随着CPS中的应用需求越来越多,其数据管理技术研究将变得日益重要。但同时我们也要看到,由于CPS中的数据管理关键技术研究尚处于起步阶段,因而相关研究成果还比较少,即使已有的一些研究成果也还存在许多不足之处,需要我们进一步深入细致的开展相关研究工作。
参考文献:
[1] 何积丰, Cyber—Physical Systems. 中国计算机学会通讯,第6卷,第1期,pages 25—29,2010
[2] 李国杰, 21世纪上半叶发展信息科学技术的战略取向. 2009年度中国计算机大会报告.
[3] Edward A. Lee, Cyber Physical Systems: Design Challenges. Technical Report No. UCB/EECS—2008—8. http://www.eecs.berkeley.edu/Pubs/TechRpts/2008/EECS—2008—8.html.
[4] Insup Lee, George Pappas, Rance Cleaveland, John Hatcliff, Bruce Krogh, Peter Lee, Harvey Rubin, Lui Sha, “High—Confidence Medical Device Software and Systems,” IEEE Computer, vol 39, no 4, April 2006. pp. 33—38..
[5] Edward A. Lee,Cyber—Physical Systems – Are Computing Foundations Adequate? NSF Workshop on Cyber—Physical Systems: Research Motivation, Techniques and Roadmap, Oct. 16—17, 2006
[6] Prepared by the CPS Steering Group, USA. Cyber—physical Systems Executive Summary, March 6, 2008. http://varma.ece.cmu.edu/summit/CPS—Executive—Summary.pdf. 
[7] NSF workshop on Cyber—physical Systems. http://varma.ece.cmu.edu/cps/
回到顶端
版权所有2006 东方科技论坛  技术支持 上海中科网络信息技术有限公司 沪ICP备05000140号
服务电话:021-64314273  客户服务信箱:yech@cst.sh.cn