如第三章所述,问题隐含属性的识别主要包括问题类型的识别和隐含在求解方法中的求解条件的识别。问题类型是决定决策问题求解方法的关键,所以我们必须先识别出问题的类型才能进一步识别问题的其他隐含属性。
4.2.1 基于依存关系三元组的关键词识别方法
当问题的表层属性被识别后,问题的目标也就通过依存关系三元组{(D[j][m],D[j][n],R)}表示出来。根据我们在第三章中分析提出的问题类型识别机制,采用依据“关键主题词”加“关键动词”的“双关键词”体系来定位问题类型的方法具有更好的定位准确性。为此,在识别出问题的目标与条件后,再从中找出代表问题求解特征的双关键词,是识别问题类型的基础。
我们通过企业访谈、情景模拟和从各种管理试题库中抽取试题等方法收集了大量的实际决策问题和类决策问题(即虚拟的决策问题),经过对这些问题的表述语句的分析,发现三点规律:
第一,可作为问题双关键词的词或短语基本上都出现在问题的目标子句中,而且问题的关键主题词和关键动词一般在相邻位置出现,其中关键动词通常在问题目标子句中作为句子的谓语成分出现,而关键主题词则一般以主语或宾语的成分出现。
第二,目标子句中一定包含关键动词,因为缺谓语的语句不能构成一个子句。但不一定包含关键主题词,例如:“对于公司未来的产量,我们应该如何规划?”而这种表述语句的句子成分一定是不完整的,即在主语或宾语上有所缺失。
第三,如果句子同时存在主语和宾语,宾语通常为关键主题词。例如:“我们应如何预测公司的销售量?”其中的谓语“预测”作为问题的关键动词,宾语“销售量”作为关键主题词,而不是主语“我们”。
这里,句子中的主语、谓语、宾语等成分可以是单个的词语也可以由短语构成。
根据这三点规律,我们可以通过搜索子句句法分析所得到的依存关系三元组,来获取问题表述语句中的双关键词。其方法是:
If R=“宾语”or R=“主语”Then
D[j][m]=“关键主题词”,D[j][n]=“关键动词”,D[j][m]&D[j][n]=“双关键词”
End if
其中,R为目标子句各三元组中的依存关系,D[j][m]和D[j][n]为各三元组中的两个相互依存的词组。
需要说明的是,该方法只适合一般的情况。当决策问题的目标子句中不包含关键主题词或用户对识别出的关键主题词不满意时,需要用户参与关键词的识别过程。其基本思路是:先由机器搜索所有问题条件子句中的主语和宾语,再将搜索得到的主语和宾语和目标子句中的主语或宾语呈现给用户,由用户从中选择一个最优的关键主题词反馈给机器,从而得到问题的双关键词。该识别过程可以通过设计人机交互程序来实现,该程序包括一个确认双关键词的人机交互界面和一个呈现所有可能的关键主题词的函数过程,我们将此人机交互界面命名为SGJC-QR,函数过程命名为ZTC-Search。这样,一个完整的双关键词识别算法可以描述为:
If R=“宾语”or R=“主语”Then
D[j][m]=“关键主题词”,D[j][n]=“关键动词”,D
[j][m]&D[j][n]=“双关键词”E1se
Ca11 SGJC-QR
If command1_c1ick事件Then retírn D[j][m]&D[j][n]
E1se
command2_c1ick事件Then Ca11 ZTC-Search
End if
End if
其中,command1_c1ick。va1íe=“确认此双关键词”,com-mand2_c1ick。va1íe=“修改此关键词”。
4.2.2 基于双关键词的问题类型识别与求解方法匹配过程
确定问题的双关键词后,可根据问题类型知识中关键词与问题类型的对应关系来识别出问题的类型。然而,依据双关键词匹配问题类型却具有一定的复杂性,原因在于虽然问题的关键主题词能唯一地确定问题的领域类型,但问题的关键动词却不一定能唯一地确定问题的求解类型。例如,对于以下三个问题:
·在现有市场份额下,未来一个时期内,公司的市场份额是多少?
·公司现有产品销量为×××市场上该产品的总销量为×××的情况下,公司的市场份额是多少?
·根据市场情报,公司的市场份额是多少?
它们的双关键词都是“市场份额是多少”,问题的领域类型即关键主题词所对应的是“市场份额”,但问题的关键动词为“是多少”。从词义来看,与之相关或相近的词包括“判断”、“计算”、“估算”、“预计”、“预测”、“预估”等,而这些词所对应的问题求解类型是不同的。根据管理学知识可知,第一个问题为“预测类”问题,第二个为“简单计算类”问题,第三个则为“判断类”问题。当问题的关键动词不能唯一地确定问题的求解类型时,我们认为在PMS中可采用以下策略来确定问题的类型:
第一,相似性引用策略。即看PMS的问题库中是否存在已求解的相似问题,如果有且经过相似性分析判断为高度相似,则直接调用该相似问题的求解类型和求解方法。
第二,深度语义分析策略。即当PMS的问题库中无高度相似的决策问题时,利用上下文相关的语义分析模型,对关键词结合目标子句和条件子句的其他词语进行深度语义分析,从而确定“关键动词”的真正语义,并以此选择问题的求解类型。
第三,“用户选择 疑问词辅助”策略。即当PMS的问题库中无高度相似的决策问题时,由用户自己选择给定的求解类型。由于关键动词对应的问题的求解类型虽然不是唯一确定的,却是有限的,一般只有几种问题的求解类型与之对应。在上述例子中,关键动词“是多少”对应的问题的求解类型只有预测类、简单计算类、判断类等有限类型。于是我们可以通过由用户选择的方法来确定问题的类型,即利用问题知识库中已建立好的关键动词与问题求解类型之间“一对多”的映射关系,先由用户选择其中的某一大类,再根据问题类型分解树选择该大类中的各阶子类直到某一具体的求解类型来进行试探性求解,如先选择“预测类”,再在其中选择“回归预测”、“灰度预测”、“指数平滑预测”等子类,直到选择到“线性回归预测”这一具体的求解类型,然后根据选定的求解类型调用相应的求解方法对问题求解。如果无法求解,则重新选择其他求解类型(包括大类和各阶子类),直到问题可求解为止。如果找到合适的求解类型但并不能确定该类型对应求解方法的有效性,可将这种类型选择记录为一种求解方案(求解路径),再继续选择其他求解类型,从而形成不同的求解方案,最后再根据求解结果对不同的方案进行评价。为减少这一选择过程中的盲目性,可利用疑问词与问题求解类型的密切关系,辅助以疑问词作为约束条件。如疑问词“如何”、“怎样”对应描述类型,“多少”“多长”对应数量类型,等等。这样,用户根据系统给出的疑问词信息的解释进行选择,能更快地找到问题合适的求解类型。
第四,用户设定策略。即不需要任何条件,直接由用户自己设定问题求解类型,并选择或建立求解方法。
上述四种策略中,实际上只有第二、三种策略是需要依据关键词来确定问题类型的。由于目前自然语言深层理解的技术并不是很成熟,因此,当问题的关键动词不能唯一确定问题的求解类型,且在问题库中没有已求解的高度相似问题而用户自身对问题类型又缺乏足够的知识时,采用“用户选择 疑问词辅助”的策略对PMS-DC更为简单有效。
要想依据双关键词识别出问题的类型进而找到合适的求解方法,必须构建问题类型知识库,以存储问题类型与问题关键词的映射关系。根据第三章设计的通用知识库结构——元知识的外部属性到内部属性的映射,我们用元知识的外部属性来表示问题类型知识的特征,其属性结构为:
<类型编号,类型名称,领域类型,求解类型,对应的关键词集合,对应求解方法集合>
这样通过识别得出的双关键词与问题类型知识的“对应的关键词集合”匹配即能识别“问题的类型”和“对应的求解方法集合”。
由于汉语有许多近义词,如关键主题词“产出”和“产量”,关键动词“计划”和“安排”,双关键词“产出计划”、“产量计划”、“产出安排”、“产量安排”表示同一问题类型——“生产计划类”,故需要根据关键主题词和关键动词的组合是否匹配“对应的关键词集合”来判断问题类型,该组合由关键主题词和关键动词的笛卡儿积构成。
由此,利用双关键词匹配问题类型及求解方法的过程可描述为:
If D[j][m]D[j][n]⑨X,X:-{Ti},Ti(Mi)Then D[j][m]D[j][n]:-{Ti},Ti(Mi)
其中,X为某问题类型关键主题词和关键动词的笛卡儿积;D[j][m]D[j][n]为识别的双关键词;{Ti}为D[j][m]D[j][n]匹配的问题类型的大类;Ti(Mi)为某一问题类型Ti对应的求解方法集合。
当用户选择求解方法集合Ti(Mi)中某一具体的求解方法mi后,该方法所需的求解条件(如求解模型输入变量、求解知识的必要条件)便构成了待求决策问题的其他隐含属性。由于求解条件依赖于求解方法,为识别出这些求解条件,我们同样以通用知识库结构来描述求解方法知识:
<求解方法编号,求解方法名称,求解条件-值-相关说明集合>
这样当确定求解方法后,通过系统的数据源分析以及与问题表层属性识别模型中已识别的问题条件的匹配,求解条件及其值也就确定了。需要说明的是:求解条件的值在无数据源或不能匹配识别表层属性的情况下为空,即该属性值不明,求解条件的输出变量即为目标属性。
4.2.3 问题隐含属性识别模型
根据上述基于双关键词的问题类型识别与求解方法匹配过程,我们可以建立问题隐含属性识别的模型,该模型可表述为:
{D[j][m],D[j][n],R}→D[j][m]&D[j][n](1é)
D[j][m]&D[j][n]→Ti;{Ti}(20)
Ti→Ti(Mi);{Ti}→{Ti(Mi)}(21)
Ti(Mi)→mi,mi⑨Ti(Mi)(22)
mi→mi(S,ValUe)(23)
其中,D[j][m]&D[j][n]为双关键词;{Ti}为问题类型的大类;Ti为具体的问题类型;{Ti(Mi)}为{Ti}对应的求解方法集合;Ti(Mi)为Ti对应的求解方法集合;mi为求解方法集合Ti(Mi)中的某一具体的求解方法;mi(S,ValUe)为该问题求解方法对应的求解条件及其取值,ValUe可缺省。
根据问题隐含属性识别的分析过程得到的模型算法流程。