书城管理决策问题管理系统开发研究
11104100000033

第33章 问题管理系统开发组件在系统中的应用

6.3.1 系统开发

与i-GIDSSG的开发平台保持一致,CMTIDSS也采用Visía1 Stidio。NET 2005开发,我们先用。NET开发出系统的主体界面和系统管理模块,然后分别采用i-GIDSSG中的PMS-DC、KMS-DC、MMS-DC和DMS-DC开发系统的问题管理、知识管理、模型管理和数据管理模块。

由于采用组件式开发,系统的核心模块开发非常简单,只需将各组件在Visía1 Stidio。NET 2005平台上添加到系统开发工程中,再对其中需要使用的组件对象的属性进行设置,并对必要的接口事件进行少量的编程,即可完成系统中这些模块的开发。

CMTIDSS的系统界面。

6.3.2 决策问题分析过程

CMTIDSS的主要功能是解决我国固体矿产业技术创新体系建设所涉及的决策问题。根据课题的研究,总结出需要由系统处理的决策问题主要有三个:

问题1:九五和十五期间,我国固体矿产业各年的技术创新综合水平如何?

问题2:九五和十五期间,影响我国固体矿产业技术创新综合水平的各因素中,最主要的因素是哪些?

问题3:九五和十五期间,影响我国固体矿产业技术创新综合水平的各因素对技术创新体系各方面绩效的影响程度怎样?

通过这三个问题的分析求解,即可对我国固体矿产业技术创新体系的建设目标、建设重点以及相关政策调整的决策提供重要的支持。

下面,我们根据本书提出的问题处理方法给出在CMTIDSS中对这三个问题的分析过程。

1.问题1分析过程

根据第三章提出的问题智能识别机制和第四章的问题智能识别模型,我们将PMS中的问题分析归结为五步分析过程:

第一步,问题表述语句的输入。

问题1的中文表述为:

九五和十五期间,我国固体矿产业各年的技术创新综合水平如何?

第二步,问题的表层属性的识别。

首先,利用中文分词系统(我们在PMS-DC中选用中国科学院计算技术研究所研制的中文自然语言处理开放平台——基于多层隐马模型的汉语词法分析系统ICTCLAS,该系统在2002年的é73专家组评测中获得第一名,并在2003年的Bakeoff比赛中取得较突出的成绩)对问题表述语句进行分词,分词并经过适当的组词后结果如下:

九五/和/十五/期间/,/我国/固体/矿产业/各年的/技术创新/综合水平/如何/?/

其次,通过问题表层属性识别模型(式16)识别问题的条件和目标子句:

S=“九五”,S=“和”,S=“十五”,S=“期间”;

D=“我国”,D=“固体”,D=“矿产业”,D=“各年的”,D=“技术创新”,D=“综合水平”,D=“如何”。

然后,利用依存语法的句法分析器(式17、式18)得到问题表层属性识别的三元组集合表示:

S 1={(九五,和,联合),(十五,和,联合),(和,期间,偏正)}

1={(如何,如何,谓语),(综合水平,如何,主语),(我国,固体,偏正),(固体,矿产业,偏正),(矿产业,各年的,偏正),(各年的,技术创新,偏正),(技术创新,综合水平,偏正)}D

经过相似性分析无相似问题的存在。

第三步,问题隐含属性的识别。

首先通过目标D 1找到识别问题类型的双关键词(式1é),在D 1的三元组关系表示中,找到问题的主语和谓语分别为:“综合水平、如何”,得到双关键词为“综合水平&如何”。

然后匹配问题类型知识库中的“对应的关键词集合”,得到问题类型的大类为“综合水平评估类”(式20)。根据用户选择问题类型的小类,具体的问题类型为“技术创新综合水平评估类”(式21)。

接下来通过该问题类型查找“对应的求解方法集合”,由系统给出的求解方法包括:综合指数模型、层次分析模型、数据包络分析模型、神经网络模型、突变级数模型、全要素生产率模型。我们(用户)从中选择的求解方法为“基于全要素生产率(TFP)的技术创新水平评价模型”(式22)。

最后匹配求解方法“基于全要素生产率(TFP)的技术创新水平评价模型”的“求解条件—值—相关说明”,通过系统数据源分析和问题表层条件的匹配得出问题的求解条件的值:V 11=“九五和十五期间”,V 12=“固体矿产业”;而输入变量V13、V14、V 15、V16、V17未知,输出变量f11(目标属性)未知(式23)。

第四步,子问题识别。

首先根据子问题产生规则(式24),除目标属性未知外,还有五个输入变量V

13、V14、V15、V16、V17的取值未知,由此产生关

于总问题求解的五个子问题。根据子问题的构建规则,产生如下五个子问题描述:

子问题1.1:总产出增长率是多少?

子问题1.2:资本存量增长率是多少?

子问题1.3:劳动力增长率是多少?

子问题1.4:资本产出弹性是多少?

子问题1.5:劳动产出弹性是多少?

子问题产生后,子问题的智能识别主要是子问题的隐含属性的识别。因为关于子问题的双关键词(求解条件&是多少)和已知条件(继承总问题和上级子问题的所有已知条件)已经确定,问题的表层属性不再需要识别。

其次,对子问题的隐含属性进行识别。根据双关键词匹配问题类型、问题类型匹配问题的求解方法以及用户选择(式20~式22)得到识别结果。

关于各子问题求解方法匹配的“求解条件—值—相关说明”在一一列出。通过系统数据源分析和继承总问题的条件匹配得出问题的求解条件的值。

子问题1.1~1.3除输出变量(目标属性)外,其余条件均可识别,因此不产生子问题。子问题1.4、1.5除输出变量(目标属性)外,取值未知的属性包括V 32,V33,V34,故产生下一级子问题。根据子问题的构建规则,产生如下三个下一级子问题描述:

子问题1.4.1:总产出序列对数值是多少?

子问题1.4.2:资本存量序列对数值是多少?

子问题1.4.3:劳动力序列对数值是多少?

由于子问题1.5取值未知的属性与1.4相同,故不再产生相同的次级子问题。

采用与子问题1.1~1.5同样的方法可以识别出上述子问题的隐含属性。

关于各子问题求解方法匹配的“求解条件—值—相关说明”。通过系统数据源分析和问题表层条件的匹配得出问题的求解条件的值。除了问题的目标属性值未知,求解条件的所有属性值均已识别,故不再产生子问题。

第五步,问题求解。

根据问题1及其子问题的识别结果,由最下级子问题反向递推并调用求解方法的求解算法,求解总问题。其求解模型调用路径。

2.问题2分析过程

第一步,问题表述语句的输入。

问题2的中文表述为:

九五和十五期间,影响我国固体矿产业技术创新综合水平的各因素中,最主要的因素是哪些?

第二步,问题的表层属性的识别。问题表述语句经过中文分词得到:

九五/和/十五/期间/,/在/影响/我国/固体/矿产业/技术创新/综合水平/各因素/中/,/最主要的/因素/是/哪些/?/

根据问题表层属性识别模型得到的该问题条件和目标子句为:

S=“九五”,S=“和”,S=“十五”,S=“期间”;

S=“在”,S=“影响”,S=“我国”,S=“固体”,S=“矿产业”,S=“技术创新”,S=“综合水平”,S=“各要素”,S[é]=“中”;

D=“哪些”,D=“因素”,D=“是”,D=“最主要的”。

利用依存语法的句法分析器得到该问题表层属性识别的三元组集合表示为:

S 1={(九五,和,联合),(十五,和,联合),(和,期间,偏正)}

2={(我国,固体,偏正),(固体,矿产业,偏正),(矿产业,技术创新,偏正),(技术创新,偏正),(技术创新,综合水平,偏正),(综合水平,各要素,偏正),(各要素,影响,述宾),(各要素,在,介宾),(各要素,中,介宾)}S

D 1={(最主要的,因素,偏正),(是,是,谓语),(哪些,是,宾语),(因素,是,主语)}

同样,经过问题相似性分析无相似问题的存在。

第三步,问题隐含属性的识别。

首先通过目标D 1找到识别问题类型的双关键词,在D1的三元组关系表示中,找到问题的主语和谓语分别为:“因素”、“是”,通过双关键词识别模型得到双关键词为“因素&是”。

然后匹配问题类型知识库中的“对应的关键词集合”,得到问题类型为“影响因素评价类”。由于系统中已有的具体类型没有合适的类型(因为匹配已有类型求解问题效果不理想),故我们创建一种新的具体的问题类型——“技术创新水平影响因素评价类”——于问题类型知识库中。同时在模型管理模块中建立“全要素生产率关键因素分析模型”作为该类问题的求解方法,并在模型管理模块中设置“阶层型人工神经网络敏感性分析”算法作为该模型的求解算法。

创建好新的问题类型和模型后,即可在问题类型知识库中选择该类型及其求解方法,并匹配其“求解条件—值—相关说明”(在创建类型和模型时设置)。

第四步,子问题识别。

通过问题隐含属性的取值分析,除目标属性未知外,输入变量V53未知。但由于该变量同时又是问题1所用求解方法的输出变量,同时问题1与问题2的层次相同(均属于总问题),根据子问题产生规则(式24),不需再对该不明取值属性产生子问题,但此时问题1与问题2之间形成了顺序关系,必须待问题1求解后才能求解问题2.

如果首先提出的是问题2,则根据输入变量V53的取值状态需要产生子问题,其隐含属性的识别与问题1相似,则问题1的输出变量可以直接从V 53的取值得到。

第五步,问题求解。

在问题1被求解的前提下,即可调用全要素生产率关键因素分析模型的求解算法——阶层型人工神经网络敏感性分析算法——来求解问题2.

3.问题3分析过程

第一步,问题表述语句的输入。

问题3的中文表述为:

九五和十五期间,影响我国固体矿产业技术创新综合水平各因素对技术创新体系各方面绩效的影响程度怎样?

第二步,问题的表层属性的识别。

问题表述语句经过中文分词得到:

九五/和/十五/期间/,/影响/我国/固体/矿产业/技术创新/综合水平/各因素/对/技术创新/体系/各方面/绩效的/影响程度/怎样/?/

根据问题表层属性识别模型得到的该问题条件和目标子句为:

S=“九五”,S=“和”,S=“十五”,S=“期间”;

D=“影响”,D=“我国”,D=“固体”,D=“矿产业”,D=“技术创新”,D=“综合水平”,D=“各要素”,D=“对”,D[é]=“技术创新”,D=“体系”,D=“各方面”,D=“绩效的”,D=“影响程度”,D=“怎样”。

利用依存语法的句法分析器得到该问题表层属性识别的三元组集合表示为:

S 1={(九五,和,联合),(十五,和,联合),(和,期间,偏正)}

1={(我国,固体,偏正),(固体,矿产业,偏正),(矿产业,技术创新,偏正),(技术创新,综合水平,偏正),(综合水平,各要素,偏正),(各要素,影响,述宾),(对,影响程度,述宾),(技术创新,体系,偏正),(体系,各方面,偏正),(各方面,绩效的,偏正),(绩效的,影响程度,偏正),(影响程度,怎样,主语),(怎样,怎样,谓语)}D

第三步,问题隐含属性的识别。

首先,通过目标D1找到识别问题类型的双关键词,在D1的三元组关系表示中,找到问题的主语和谓语分别为“影响程度”、“怎样”,通过双关键词识别模型得到双关键词为“影响程度&怎样”。然后匹配问题类型知识库中的“对应的关键词集合”,得到问题类型为“影响因素评价类”。采用与问题2同样的处理方法设置新的问题具体类型——“技术创新体系绩效影响因素评价类”和新的求解方法——“技术创新体系关键因素分析模型”(该模型同样采用“阶层型人工神经网络敏感性分析”算法求解)。

最后,匹配求解方法“技术创新体系关键因素分析模型”的“求解条件—值—相关说明”。

第四步,子问题识别。

由于除目标属性(输出变量)未知外,其他的属性均已识别,故根据子问题产生机制不产生子问题。

第五步,问题求解。

直接调用技术创新体系关键因素分析模型的求解算法——阶层型人工神经网络敏感性分析算法——即可求解问题3.

上述分析过程在CMTIDSS中的主要相关界面。

6.3.3 开发结果

利用CMTIDSS中的PMS及其相关子系统,我们对我国固体矿产业未来技术创新体系建设所涉及的上述三个总决策问题进行了分析,同时也对有色、黑色、煤炭、非金属几个子产业的同类问题进行了分析。

开发结果显示,CMTIDSS对上述问题从问题表述语句分词到问题表层属性分析、隐含属性分析、子问题分解,直至问题求解、求解结果展示及求解结果评价等一系列过程都能进行有效的处理。同时,对这些问题分析求解所涉及的63个统计分析指标、3600多个统计数据、5类20个分析模型以及与之相关的1300多条知识都能进行有效的管理。

由于使用PMS-DC及相关组件,开发人员不需要关心具体的决策问题及求解方法,只需知道系统的基本功能与界面要求。具体的决策问题可在系统使用过程中由用户输入,问题的求解方法亦可通过系统的识别快速找到,或在专家用户的帮助下快速建立。因此,整个系统的开发只用了10天。