软硬件综合系统软件需求建模及可靠性综合试验、分析、评价技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.6 软硬件综合系统可靠性

系统可靠性描述的是系统在规定时间内和规定条件下完成规定功能的能力,其中系统是指由一些基本部件(组件)构成的用于完成某种指定功能的整体。这里系统的概念是相对的。例如,飞控计算机系统可看作一个系统,其中的飞控计算机可以看作系统的一个组件,但是在单独研究飞控计算机时可以把它看作一个系统,而它又是由硬件和软件组件构成的用于完成某种指定功能的整体。由于设计软硬件综合系统一般来说是为了使系统具有更高的性能,因此系统越复杂就越容易发生故障,这也使得软硬件综合系统的可靠性问题成为亟待解决的问题。当从体系结构上考虑系统的可靠性时,由于系统的软硬件结构、冗余结构应用广泛,因此本书针对上述两类结构给出目前对其进行建模与分析的现状。

目前国内外部分学者已针对软硬件综合系统可靠性开展了相关研究。文献[9]基于嵌入式系统提出了一种软件故障与硬件故障的划分方法,为具体的故障分析提供了依据;文献[10]利用RBD建立了考虑硬件失效与软件失效的网络服务器的可靠性模型;文献[11]利用Markov过程建立了由硬件与软件组成的分布式系统的可靠性模型;文献[12]利用Markov过程建立了考虑硬件与软件失效的单组件、三组件冗余系统和冷备系统的可靠性模型;文献[13]利用FTA法建立了用于某复合计算机系统可靠性分析的故障树,并将故障树分为硬件子系统故障树和软件子系统故障树;文献[14]利用DFT分析法对考虑了硬件容错与软件容错的数字飞控计算机系统的可靠性进行了分析。上述关于软硬件综合系统的可靠性分析将系统的硬件与软件视为不同的子系统,将系统故障分为由硬件子系统引起的系统故障和由软件子系统引起的系统故障,分析模型假定硬件与软件是相互独立的而忽略了硬件与软件之间的相互作用关系。

近年来,国内外部分学者在对软硬件综合系统可靠性进行分析时开始考虑硬件与软件之间的相互作用关系,如文献[15]分析了在软件运行时,内存失效时的软件可靠性;文献[16]通过故障注入的方法定性地给出了硬件与软件之间的相互作用关系,尤其是软件对硬件的故障容错;文献[17]在考虑软硬件结合故障的基础上建立了不可维修的软硬件综合系统可靠性分析模型;文献[18]在一种新的软件可靠性分析方法基础上,参考硬件系统阶段性任务可靠性的建模方法,为考虑硬件与软件之间的相互作用关系的计算机系统可靠性提出了解决方法;文献[19]根据系统的可维修性建立了可编程逻辑控制器(Programmable Logic Controller,PLC)系统的可靠性分析的Markov模型,并根据模型提出了提高PLC系统有效度的有效措施;文献[20]对故障容错系统进行了可靠性分析,并考虑了组件的功能和结构的相互作用及整个系统的重组和维修策略,但建模过程较为复杂。总之,在进行软硬件综合系统可靠性分析时,应根据实际情况考虑软件与硬件之间的相互作用关系,建立系统可靠性模型,并使模型能用于实际系统的可靠性分析,从目前国内外的研究现状来看,此类研究仍存在不足。