依据问题知识库的结构和问题的知识结构所设计的问题知识库仅仅提供了运用知识管理方法理解和求解决策问题的数据支持,在实际DSS问题管理系统的开发中,还必须解决系统功能结构和工作流程的问题。根据我们在第一章中的分析,该问题依赖于运用问题知识理解和求解问题的逻辑过程和相关算法的设计。
3.3.1 基于知识管理的问题理解与求解流程
根据第二章关于决策问题理解和求解的基本思路研究,在DSS中,决策问题理解与求解的基本过程是在提交决策问题后,进行问题的属性分析、子问题分解和求解路径分析,直到找到合适的求解方法并按照子问题的分解路径求解问题。其中,属性分析就是要从决策的表述中识别出问题的目标、条件等属性,而根据目标与条件的特征又分为显性属性分析和隐含属性分析两部分。子问题分解就是要根据属性分析识别出总问题的各层子问题。求解路径分析就是要根据问题的表述识别出问题的类型,进而选择合适的求解方法。同时,由于属性分析、子问题分析和求解路径分析是问题处理的三个关键环节,因此,DSS在问题处理上的智能性也就主要体现在显性属性与隐含属性的智能识别、子问题的智能识别和问题类型的智能识别上。
需要指出的是,属性分析、子问题分析和求解路径分析相互之间具有交叉性。属性分析是子问题分析和求解路径分析(求解方法分析部分)的前提,子问题分析又为求解路径分析(求解顺序分析部分)提供依据。同时,对分解出的子问题还需要作新一轮的属性、子问题和求解路径分析。而求解路径分析将得到该方法所需的求解条件,这又为问题的隐含属性的识别提供依据,并由此进一步分析出问题的子问题。正是通过这种不断交织反复的分析,才能深入全面地分析理解和求解决策问题。由此,决策问题智能理解与求解的一般流程。
在该流程中,各处理环节主要由DSS自动完成。但为弥补计算机在决策问题智能处理方法上的不足,还是需要决策用户或领域专家的参与,其作用主要是确认和修改DSS处理的结果。
虽然各专用DSS的问题处理流程并不一定与该流程相同,但它满足了通用PMS对决策问题处理的要求,而这正适合PMS-DC的需要。
3.3.2 问题智能理解机制
在上述过程中,要成功理解和求解一个用户提交的决策问题有以下几个关键步骤:第一,问题显性属性(即表层属性)识别;第二,问题知识库中已求解的同类问题查找;第三,问题类型判断;第四,子问题识别。接下来,我们探讨一下这几个关键环节的处理内容和机制。
1.问题显性属性识别
根据前面的分析,决策问题的显性属性包括决策目标、已知条件和管理信息。其中:
(1)决策目标主要描述问题解决要达到的目的,即问题究竟要干什么。通常,它都会包含在问题的表述当中。虽然有些决策问题的目标不一定表述得很明确,但通过一定的分析总能弄清楚问题的决策目标,否则该问题将无从解答,也就失去了分析的必要。
(2)已知条件描述的是问题应该在什么条件下来求解,它既包括求解问题的限制条件,也包括求解问题可使用的数据信息。同样,已知条件也或多或少地出现在问题表述中,因为,目标和条件是决策问题的两个基本要素,与无目标的问题一样,无任何条件的决策问题也是不可能解答的。
(3)管理信息包括与问题的提交人和条件时间有关的背景信息,以及问题保存在问题知识库中的一些日常管理信息,如问题编号、知识类型、问题优先级等。管理信息一般不会包含在问题的表述中,但之所以将其作为问题的显性属性是因为这些信息都是显而易见的,PMS只需提供简单的用户设置和编码生成功能就能获取。
上述显性属性对决策问题的理解分析而言,有用的主要是决策目标和已知条件。所以,问题显性属性识别的关键是从问题表述中识别出决策目标和已知条件。
要从用自然语言表述的决策问题中智能识别出问题的决策目标和已知条件,就需要应用自然语言识别技术。该技术目前在机器翻译、智能搜索引擎、机器人等领域已广泛使用,它包括文字语言识别和语音语言识别两类。在我们研究的PMS-DC中,目前仅能使用文字语言识别。基于自然语言识别的决策问题显性属性的智能分析机制。由于我们开发的PMS-DC主要用于中文决策问题求解的DSS开发,而中文自然语言的识别必须先经过词句切分环节,因此,对于提交的决策问题表述语句,首先须经过分词处理,然后运用语义分析模型对切分出的词句进行语义分析,从中找出问题的目标和条件。同时,分词结果和属性识别结果可交由用户或领域专家确认,以修正偏差。而分词和语义分析所调用的词库和语料库也可以作为知识库的子库存储于知识库中。
识别的有效性关键在于分词算法和语义分析模型的性能,它们共同构成决策问题显性属性识别方法。对此,我们将在下一章决策问题智能识别模型研究中详细讨论。
2.同类问题查找与相似性分析
同类问题的查找与相似性分析是为了应用问题知识库中已有问题的知识来理解和求解问题。查找的基本方法是用所提交问题的任一显性属性或显性属性的组合来搜索问题知识库。通常可能会找到若干个符合条件的问题,为了在其中选出合适的同类问题,还需要对检索结果逐一进行与提交问题的相似性分析。在第二章中我们提出了一种基于向量空间模型的用向量间夹角余弦公式来计算两个问题相似性的方法。该方法判断的准确性虽然较高,但有个缺陷就是用于判断的两个问题的属性向量坐标(即属性项目)必须一一对应,而在实际应用中是很难确定这种对应关系的。因此,我们根据问题知识库结构的研究,提出了另一种问题相似性的判断方法:
假设问题P 1和问题P2的元知识外部显性属性集分别为AE 1={a1i|1≤i≤m}和AEj={a2j|1≤j≤n},a1i和a2j分别为两问题的元知识外部显性属性,设V 1i和V2j分别为a1i与a2j对应的属性取值,设置计数器变量s(0≤s≤m),并将s的初始值设为0.分析时,首先调出两问题的元知识外部显性属性,然后逐一用P 1的a1i检索P2的AEj,当检索到V1i=V2j时,s=s 1,则两问题的相似性判断公式为:
其中Sim(P 1,P2)为两个问题的相似度,Sim(P1,P2)越大表示两问题越相似,即两问题具有相同属性取值的属性越多就越相似。为了提高判定的准确度,可以把AE限定在一定的范围内(可根据第三层属性分类划分范围),并将不同范围的属性分开比较。
该方法不要求两个问题的属性项目一一对应,同时具有操作简单、计算容易的优势。
在PMS-DC中,我们提出的两种方法均可使用。第一种方法适用于属性较少,但能够找到两个问题相互对应的属性的情形;第二种方法则适用于属性较多,但属性难以对应的情形。
3.问题类型判断
问题类型判断是决策问题隐含属性识别的重要部分,它是为了在问题知识库中没有可以应用的现成求解方案的条件下,实现运用专家有关不同问题的求解知识来求解问题,这也是PMS为决策问题找到求解方法的关键。其基本思想是用提交问题的关键词来搜索问题类型知识库,找出问题的类型和求解知识。
决策问题是千差万别的,可以从不同的角度对问题进行不同的分类。但从问题求解的角度来看,任何决策问题都有其领域类型和求解类型二维标度。其中领域类型说明了问题所属的专业领域,如战略管理、财务管理、生产管理、市场营销等;求解类型说明了问题求解所需的基本方法,如预测、规划、聚类、人工判断等。因为不同专业领域的问题所用的求解方法不尽相同,如市场预测和生产预测的方法是不完全一样的,战略规划与生产规划使用的决策方法也不相同,所以,即使只是针对于问题的求解,也必须从领域和求解两个角度来区分问题。
为了更准确地定位问题类型,就需要将问题关键词分为关键主题词(一般是名词)和关键动词。如“销售量预测”的关键主题词是“销售量”,关键动词是“预测”。其中,关键主题词一般与问题的专业领域相关,而关键动词则与求解方法相关。DSS通过搜索问题类型知识库中问题类型与关键主题词列表和关键动词列表的对应关系来定位问题类型,这样将更有效地降低关键词的二义性。
对于用户提交的决策问题,该方法需要从问题的表述中识别出关键主题词和关键动词,而决策问题的关键词主要包含在决策目标中。如决策问题“在有新的竞争者加入的情况下,如何调整企业的战略”,其决策目标是“企业调整战略”,关键主题词是“企业战略”,关键动词是“调整”。在此基础上,可进一步识别出问题的领域类型是“企业战略管理”,求解类型是“规划问题”,所采用的求解方法应属于“企业战略规划”的相关方法。在此,必然要使用问题关键词识别模型、问题类型识别模型以及根据问题类型匹配求解方法的方法,对于这些模型与方法,我们也将在下一章中讨论。
该方法还需要在知识库中建立问题类型知识子库,用于记录问题类型与关键词之间的对应关系和各类问题的求解知识。问题类型的元知识需要由领域专家来建立。其中,对于各类问题类型求解知识,如果专家有足够的能力建立求解模型或求解策略,则可以在模型管理系统中创建模型求解方案或在知识求解管理系统中创建知识求解方案,并把相关信息记录于问题类型求解建议属性中。如果不具备这种能力,也可以只在问题类型求解建议中提出模型求解描述知识或策略求解描述信息,再由系统在问题求解过程中创建求解模型或策略。
需要指出的是,问题求解类型的设定和问题求解知识的建立,对于问题求解的效果有着非常重要的影响,但对DSS的开发组件而言,它只需要提供良好的问题类型设置、知识构建功能以及有效的问题类型知识库结构就可以了。
4.子问题识别
子问题识别的原理我们在第二章中已经给出,即子问题产生于问题属性取值状态。具体过程是:在总问题类型判断的基础上,找出总问题的求解方法,然后通过查询该方法的所需条件(有些条件亦构成问题隐含属性的一部分),再针对每个所需条件去检索总问题的已知条件。如果两者匹配,说明该条件有数据源,即属性的取值状态为“已知”,即可求解问题;如果匹配不到已知条件,可以再去获取其他数据源(包括数据库搜索、人工填写和其他问题的目标搜索);如果其他数据源也找不到,则属性的取值状态为“未知”,这样就要生成子问题,再对子问题作同样的分析,直到所需条件均为已知。基于该思路的子问题智能识别模型将会在下一章给出。