书城教材教辅科技档案管理学
9400600000040

第40章 科技档案检索(1)

科技档案检索,简单地讲,就是把人们需要利用的科技档案信息,从档案库房里或数据库中查找出来。从科学的意义上说,科技档案检索是指对科技档案信息进行加工存贮,并根据用户的需要查找科技档案的全过程。

科技档案检索是开发科技档案信息资源的重要内容和必要条件。

17.1科技档案检索体系

17.1.1检索原理与科技档案检索体系

从科技档案检索的含义中,我们不难看出科技档案检索实际上包括两个互为联系的过程:科技档案信息存贮和科技档案信息查找。对科技档案信息的加工存贮,是输入,是进行检索的前提;对科技档案信息的查找,是输出,是进行检索的结果。所以,存贮和查找是两个不可分割、相互联系的过程。科技档案检索体系,是指为进行科技档案检索而建立的、由检索过程中涉及的各种因素构成的一个有机整体。它由以下几个子系统配套而成:

(1)检索语言子系统。检索语言是表达科技档案主题内容和查找提问内容的一种规范标识。主要有档号表、分类表和主题词表。检索语言在科技档案检索体系中,实际上是沟通加工存贮和查找提问的“标准约定”。

(2)著录标引子系统。即科技档案信息的加工存贮系统,根据档案著录、标引规则,选择可能被检索的科技档案信息,并将其转换为规范化的检索标识加以存贮。

(3)查询子系统。即科技档案检索的服务系统,它要指导用户确定检索策略,将他们的利用需求转换成规范的检索表达式。

(4)匹配子系统。该系统的任务是将检索要求与科技档案存贮信息进行比较、匹配,确定检索目标。与检索要求相匹配的科技档案存贮信息,既包括手工检索使用的各种检索工具,也包括自动检索使用的各种数据库。

17.1.2建立科技档案检索体系的必要性

建立科技档案检索体系,是一项非常庞大、极其细致的系统工程,也是开发科技档案信息资源的一项基础建设工作。其必要性在于:

I.为迅速准确地利用科技档案创造条件

新中国建立50多年来,我国积累了十分丰富的科技档案。伴随着国家科学技术、经济建设的发展,科技档案数量急剧增加,查找的问题越来越突出。另外,广大用户利用科技档案的广度、深度及利用方式也在不断变化。

如何解决科技档案数量与准确查找之间的矛盾,办法只有一个,这就是建立并完善科技档案检索体系,浓缩科技档案信息,简化查找过程,使用户迅速准确地利用科技档案。

2.促进科技档案信息的交流

科技档案中蕴藏着丰富的信息,能够满足用户广泛的利用需求。但由于它是一种原生信息,其实体交流有诸多的不便。科技档案检索体系的建立,特别是科技档案全文检索系统的建立,形成了科技档案原件的“替身”,使科技档案信息与其实体相脱离,独自参与交流过程,创造了科技档案信息广泛交流的可能性。随着检索技术水平的提高,科技档案检索体系不仅便利了信息的交流,而且提高了信息交流的质量。

3.推动科技档案业务的规范化,促进科技档案工作的发展

建立科技档案检索体系必须以标准化和规范化为基础。通过著录与标引形成标准的著录条目,并按照规范化的要求组成科技档案检索工具。这种规范化的过程必将带动其它业务活动,如组卷、登记、编目等的标准化,从而促进科技档案工作的发展。

17.1.3建立科技档案检索体系的要求

I.灵活、全面、准确和迅速的要求

为了充分满足用户的需要,建立科技档案检索体系必须灵活、全面、准确和迅速。否则,检索体系就会失去应有的意义。

灵活,是指检索入口的多元化,能够满足用户多途径、多角度的检索。

比如,科技档案检索体系可以提供分类号、主题词、责任者、时间等多种查找途径,也可以同时将两个或两个以上的途径组配起来,充分满足用户的各种检索需要。

全面,是为了提高科技档案的查全率而提出的要求。在科技档案检索体系中,存贮的科技档案信息必须有一定的广度,不仅要揭示科技档案题名中反映的显性主题,而且要注意科技档案内容中涉及的隐性主题,以便在档案查找时,提高查全率,降低漏检率。

准确,是为了提高科技档案的查准率而提出的要求。在科技档案检索体系中,存贮的科技档案信息必须保证一定的深度,针对性强,无论是查找某一组科技档案信息,还是查找某个数据,都要力求具体、准确,以提高查准率,降低误检率。

迅速,是指提高检索速度,尽快检索到用户所需要的科技档案信息,节省检索时间。

2.科学和实用紧密结合的要求

完善的科技档案检索体系,应建立在科学和实用的基础之上。科学性的要求包括:第一,研制检索语言时,要充分考虑到科技档案和科技档案工作的实际,保证检索标识能够准确表达科技生产活动的基本内容。第二,著录标引应是标准的、规范的,著录标引的标准化与否会直接影响到检索的质量和效率,特别是在实现档案自动化检索、建立档案信息中心时,标准化显得尤为重要。第三,检索工具应合理有效,包括信息存贮的深度和方式要合理,各种数据库的结构要合理,以及各种检索工具的功能匹配要合理,以保证检索工具作用的有效发挥。

科技档案检索体系的实用性要求是指:第一,编制检索工具要注意实效,既要编制基础型的检索工具,又要编制辅助型的检索工具;既要满足现实的利用需求,又要兼顾长远发展的需要。第二,从实际出发配置检索设备。建立科技档案检索体系,需要一定的设备条件,尤其是自动化检索对设备要求更高,需要足够的财力和技术力量。这就要求配置检索设备时,既要考虑到手工检索的现状,又考虑到机器检索的发展方向,努力做好从传统手工检索向自动检索的过渡。

17.2科技档案检索语言

科技档案检索语言是根据检索的需要而编制的专用人工语言,是表示科技档案内容信息及其相互关系的概念标识系统。

检索语言是科技档案检索体系的语言保证。在标引时,用检索语言描述科技档案的主题内容,形成检索标识;在查找时,用检索语言描述用户利用需求,形成提问标识,以此来保证标引用语和查找用语的一致性,以便进行相符性比较。

17.2.1检索语言的构成与特点

检索语言由三个基本要素构成:一是构成检索词汇要素单元的字符;二是表达基本概念,并作为表示复杂概念的组配单元的基本词汇;三是保证通过基本词汇的组配来表达复杂概念的语法和句法。把科技档案用自然语言表达的主题,转换或翻译成检索语言,需要一种检索词典。有了检索词典,就使检索语言得到了有效的控制,也为检索语言的使用提供了方便。

档案检索语言以概念逻辑为基础,词汇与概念一一对应,一词一义,排除了多词一义、一词多义和词义不符的情况,并且能显示概念之间的相互关系,从而帮助档案工作者既快又准地进行标引和检索。

科技档案检索语言有库藏法、分类法和主题法三大类型。

17.2.2库藏法检索语言

库藏法检索语言是以档案形成者或责任者为依据,按照档案形成规律而编制的人工检索语言。其检索词汇是档号,检索词典是档号表。库藏法检索语言的基本规则是:在一个企事业单位内不允许有相同的目录号,在一个目录内不允许有相同的案卷号,在一个案卷内,不允许有相同的件号或页号,以保持档号这个检索标识的单义性。

采用库藏法编制的目录系统,称为库藏目录,包括案卷目录、卷内文件目录等。这种目录的优点在于它与库藏档案的实体排列相一致,有着完全相同的逻辑结构,便于对科技档案进行管理和统计,能完整地反映文件形成时相互间的历史联系,便于从部门的角度查找文件或案卷。但由于受库藏结构的限制,库藏法不便于按档案内容进行系统检索和专指检索。

库藏法检索语言具有原始性、派生性和多元性的特点。原始性是指库藏法保持了文件形成时相互之间的原始联系,没有人为的分割和破坏;派生性是指库藏法的检索词汇---档号是在库藏结构的基础上派生出来的,与档案实体排架相对应;多元性表现为档号的多层次性和档号组织原则的多样性。因此,以库藏法检索语言组织的目录主要是面向档案工作者的工作目录,而不是面向用户的目录。它的功能是以对库藏档案的实体控制为主,其次才是对档案信息内容的检索和报道。这也是一些著作中未将其列入检索语言范畴的原因。

17.2.3分类法检索语言

分类法检索语言是指用分类号表达科技档案主题内容的一种检索语言。它的检索词汇是分类号,检索词典是档案分类法,其规则是体系分类法。

I.体系分类法的原理

体系分类法是指对揭示档案内容特征的概念进行逻辑分类,以分类号作为检索标识的一种列举式检索语言。其构成原理是:遵循形式逻辑法则,按内容性质将概念分门别类、层层列举、逐级展开;以类目为基础,构成一个相互之间具有隶属关系和平行关系的单向成族的类目体系;以分类号作为类目的代号和排序的依据。《中国档案分类法》正是根据体系分类法建立的一种专用分类检索语言。体系分类法的构成原理,决定了分类法检索语言有以下四个特点:

(1)便于进行族性检索。体系分类法集中体现了类目的系统性,充分反映了类目的等级关系,便于按学科或专业集中档案或查找档案。

(2)容易识别。体系分类法以分类号作为检索标识,其结构简单,容易识别。

(3)不适宜反映狭窄主题和交叉关系的类目。体系分类法是以类目共性为基础建立的,不适宜反映类目的个性或细微差别,其专指性不够强。根据分类的逻辑规则,各类目之间具有排它性,不能反映类目的交叉关系。

(4)查找思路比较复杂。用户查找某一内容的档案时,必须首先判断该内容所属的类别,包括从大类到各级属类,以便逐级缩小查找的范围。如果有一个上位类目判断不当,就难以找到需要的下位类目。因此,无论是用户,还是档案工作者都必须对相关的专业知识有一定的了解。

2.《中国档案分类法》的编制原则和特点。

为了建立全国的档案检索体系,实现我国档案信息分类和检索的规范化,建立档案目录中心和咨询中心,《中国档案分类法》于1987年编制、出版。

《中国档案分类法》是遵循体系分类的原则,根据档案的特殊性编制的档案分类标引的词表式工具书。实际上它是按分类法检索语言编制成的档案信息分类表。它由编制说明、主表和复分表三部分组成。

(1)《中国档案分类法》的编制原则。其原则是:以马克思列宁主义、毛泽东思想为指导,以国家机构和社会组织的职能分工为基础,结合档案内容论述和反映的事物属性,从总体上包容各个时期和各种档案,适应实际分类的需要,形成从总到分、从一般到具体的类目体系。

(2)《中国档案分类法》的特点

A.基本分类依据。分类依据是分类法形成的基础。《中国档案分类法》分类的基本依据是“职能分工”。任何国家机构和社会组织都具有特定的职能,这是该机构或组织存在的基本条件,也是与其它机构和组织区别的重要标志。档案分类与一般信息分类的主要区别就在于基本分类依据的不同,一般信息分类都是以学科分类或专业性质为基本依据的。

B.类目的特点。分类表是由类目组成的,为了体现类目准确、科学、简洁的要求,《中国档案分类法》采用了以下方法处理各级类目。

第一,为了减少重复,除大类外其它类目都使用了简化的概念。例如,“PC1民用航空运输”的下位类目:“PC11气象服务”、“PC12检查维修”、“PC13客运”、“PC14货运”都是简化概念。仅凭这些概念难以把握类目的完整含义,使用时需要根据类目的位置,联系其上下位类概念,或者根据类目注释才能完整地了解类目含义。

第二,为了控制类目数量,设置了一些组合类目。如“D195机要、保密、档案”。根据各项社会活动形成档案的实际情况,在不影响正确使用的前提下,《中国档案分类法》允许将某些有一定联系,而且档案数量不多的类目合并,以减少类目的数量并提高类目的使用频率。

C.分类号的特点。主要有以下三个方面:

第一,《中国档案分类法》采用混合制号码体系。以汉语拼音字母为代字,以阿拉伯数字为代号,构成分类号。

第二,汉语拼音字母采用音序法,在分类表中代表基本大类和部分二级类目。为了避免与数字混淆,代字中没有采用“O”和“I”两个汉语拼音字母。

第三,分类表中的代号为不完全的层累制。在十进位的基础上,适当采用了八分制,以适应档案同位类较多的特点。

例如:NK37家用电子设备

NK371电视接收机

NK372投影电视机

NK373电视智能游戏机

NK374录像机

NK375录音机

NK376收音机

NK377电唱机

NK378电子计算机

NK3791电子手表

NK3792电子玩具

NK3793音响组合机

……

3.《中国档案分类法》的使用方法

(1)类目注释的方法。在使用《中国档案分类法》之前必须了解类目的结构关系和注释内容,以便准确地把握类目的含义。为了便于了解和使用类目,补充类目的含义,了解类目之间的关系,《中国档案分类法》采用了以下注释方法:

A.指明类目的内容和范围。具体有三种形式:一是列举类目的内容。

例如“B122城市详细规划”注释为“包括居住规划,中心区、商业区规划,工业区规划,历史地段保护规划,专业工程详细规划,城市设计”。二是指出应属于类目的内容,排除不属于该类目的内容。例如“MA25化肥”注释为“化肥管理、使用入此类,化肥生产入NQ15”。三是进一步明确类目的含义。例如“TA82海洋文献服务”注释为“图书、情报、资料、档案工作入此类”。

B.指明类目之间的关系,包括交替关系和参照关系。对于某些有交叉关系的类目或可以选择两个以上的类目,为保证归类的一致性,规定了其中一个为正式类目,用“宜入”一词加以注释。比如,“NE73调度、通讯设备”注释为“宜入NK21(电子通讯设备)”,指明了“电子通讯设备”为其正式类目。

对于类目之间有一定联系但又不属于同一上位类的若干类目定为参照类目,用“参见”一词加以注释。比如,“NK46雷达”注释为“参见NK31”。由于“NK46”为兵器类中的雷达类目,它只是雷达类的一个组成部分,而“NK31”为电子类中的雷达类,是对雷达系统全面的分类。指出这种参照关系,便于系统地了解雷达及其分类的情况,从而能正确使用类目。