当前位置: 研究成果 >>> 志鉴研究

面向档案地情知识服务的网站系统研究

2013-02-18    

        知识经济到来后,信息技术及信息化有了新的发展,数据管理从信息管理进入到知识管理。其中,面向知识管理和应用,提供数字化学习和知识服务,使用户能够获取、利用知识和知识应用方案的知识网站管理信息系统正在逐渐形成。知识服务的本质是将知识、经验、技能、智慧融入对显性知识和隐性知识的揭示,是开展信息搜寻、知识分析、知识整合、知识创新的服务过程, 而这一过程的全部内容都离不开知识技术的支持。本文就是针对如何利用知识技术对档案地情信息网站进行管理,并通过网络与知识技术,实现地情信息知识的发现和使用,创造性地为用户提供获取地情知识的方案和策略。这种知识衍生和知识创新的服务系统能够改变以往获取知识的环境, 创造整合信息的友好界面与平台。

一、档案地情信息知识网站简介

        地情资料属地方文献信息类型,它主要包括志书、年鉴等,包含的内容非常广泛。从纵的方面看,从古到今,上下几千年,具有鲜明的历史性和连续性特点;从横的方面看,既包括反映地域内的地理、气候、自然资源、生态环境等自然状况的内容,又包括反映地域内的人口、民族、行政区划、政策体制、生产力水平、社会文化等社会状况的内容,具有明显的地方性和广泛性的特点。地情资料的内容及其特点是地域特色经济发展的重要历史依据。但是,在生产力低下的自然经济阶段,尤其对中国长期农耕火种的农业社会来说,地情信息在推动社会进步发展的贡献上没有太突出的表现,从而没有得到社会的广泛认可,仅仅被作为一种科教资料用来普及人文知识。而当今社会的发展与地情资源的关系越来越密切,尤其在国家提出和谐发展,合理利用各种资源,争取创造投入和产出的最大效益等一系列要求的时候,对地情资源的全面掌握和科学开发,减少因地情资源不明而造成的损失,成了社会发展和经济建设中的重要问题,地情正逐步成为直接运用于建设的有效工具。

        档案地情信息服务是指:档案局、地方志等机构全面系统地记述本行政区域自然、政治、经济、文化、社会的历史与现状(例如当地政府的政策)的资料性文献,并将这些重要信息资源提供给用户满足他们的各种需求。这些需求包括:政府决策的需求,科学研究的需求,社会各项事业的需求,具体某项工程的需求,海外同胞和国外友人的需求等等。可以看出,档案地情信息服务必将成为档案馆、地方志机构为大众服务的一个重要平台。但传统档案地情服务方式存在着传递缓慢、时效性差、影响范围有限等缺陷,这与传统地方志的纸质载体形式和地方志编纂周期过长等原因有关,未能发挥其应有的作用。这种局面制约了档案地情信息资源服务事业的发展。将知识管理与档案地情信息资源服务相结合,建立一种面向档案地情信息服务的知识网站系统,有利于提高档案地情信息资源的服务质量与工作效率、扩大档案地情资源利用的社会影响。基于知识管理思想构建起来的信息机构知识网站,是实现信息机构知识管理的一个重要手段,随着社会信息化进程的加快和知识管理需求的增加,面向档案地情信息服务的网站系统必将成为越来越多档案部门、地方志机构的首要选择。

二、档案地情信息服务知识网站的目标与功能

        面向档案地情信息知识网站的建设不仅仅实现的是载体上的跨越而且要实现从形式到内容的飞跃。在网络平台上,用户对地情信息的要求,已不满足于检索到相关的资料性文献,而是希望通过简单快捷的方式,检索到所需文献中的具体事件、数据、结论等;更希望能够随时随地获得地情信息知识,提高有效信息利用效率,并从单一的信息需求转化到信息综合,即将所需知识和与其相关信息进行组合而得出解决方案的需求。

        但是,目前各种类型的地情主题网站对范围广泛的地情资源进行组织,能够汇聚各种各样的地情信息资源,他们不是针对特定用户而设计的。它们对于辨别一般领域中的“某些”信息特别有用,但对于确定定义明确的有限领域中的特定信息却效果不大。就像是大百科全书,对于科普常识的涵盖非常周全,但对于想得到具体专业的知识服务,或者解决非常具有技术难度的问题,就必须参考更专业、知识领域更集中的书籍。档案地情信息服务知识网站,其构建的目标主要是应用各种知识管理技术对各种数字化后的档案地情文献内容进行组织和管理,并且以知识检索为入口,为广大用户提供一个更加合理便捷、更具个性化的知识服务平台。

        档案地情信息服务知识网站的设计目标是:重新构建知识组织方式并将其与现代技术相结合,成为现代知识组织与管理的工具。这个目标主要是指:(1)以逻辑条件控制知识组织,提高检索和浏览的能力;(2)对象征受控词汇的同义词和同形异义词进行控制,提高查全率和查准率;(3)优化检索策略和检索结果。

        当用户在某一知识类中选择一个词的时候,这个词的语境关系也就展示出来了。他们能通过这个等级发现一些语义相关的词,也能通过交叉参照检索其它相关词。当用户查找一个感兴趣的知识类时,通过搜索引擎或存储在该知识类中的特定链接,他们不仅能直接检索到想要查找的特定信息,也能检索其它相关信息资源。

        它应该提供以下功能:

      (1)以人工语言作为检索标识并采用主题词揭示和描述信息主题内容,满足用户对特定事物、特定主题的检索需求,最大的特点就是能揭示主题词之间的各种关系。

      (2)在检索一个概念时可以得到与该概念有关的其他概念。搜索引擎对用户提供的概念进行扩检, 例如用户输入“城市绿化建设”时, 可能还希望得到“城市规划”方面的信息(实际上“城市规划”是“城市绿化建设”的上位词)。

      (3)对检索到的地情文献做深度知识挖掘,查找主题或内容相关、相似的文献,以扩大查全率。构成以每一篇文献为中心的主题网络和文献网络,在网络环境下,一次检索结果,就可营造无数个主题数字化学习环境,有助于人们深入学习研究,同时发现和获得相同、相似、相关的文献和知识。

      (4)控制检索词和优化检索策略并加以存储以备将来使用。

三、档案地情信息知识体系的构建

        首先要明确档案地情信息并不等于档案地情信息知识,实现档案地情信息的知识化,必须弄清楚“档案地情信息”与“档案地情知识”的关系。档案地情信息或者称档案地情信息数据是一种显性知识,经过数字化而形成的档案地情信息资源其实质是地情显性知识数字化的过程,数字档案地情资源相互之间的关系是不清晰的,其存储位置带有一定的随机性和偶然性,它所提供的信息服务,总体来说仍处于消息服务的层次,它所提供的决策支持功能也是零星的、粗糙的和片面的,是一种低水平的决策支持。但是,档案地情信息是档案地情信息知识的基础,对档案地情信息内容特征的再组织,尤其是在信息内容的构建上,不仅包含信息资源管理机构采集、组织和储存的信息资源,而且还要包含各种隐性知识,让它们在知识服务过程中参与对信息内容的重组与整合,才能完成信息资源知识化这一过程。

        针对档案地情信息内容,我们按照一定的标准,对其档案地情文献的内容特征进行标引和描述,这些标引和描述信息,称为档案内容元数据。档案内容元数据本身也是数据,它是关于档案数据的数据,这些元数据的确要符合一定的国际和国家标准。在档案界较为著名的元数据标准是称之为档案描述编码格式(Encoded Archival Description,EAD)的元数据标准。该元数据标准始于加州大学伯克利分校图书馆1993年的伯克利检索工具计划,目的在于开发一种非专属的元数据及其编码标准,用于档案馆、图书馆、博物馆的各种馆藏纪录(例如目录、登记簿、索引等,尤其是档案、手稿、具有内在联系或结构的资料集等)的数字化和网络化应用。各类文献一般都具有主题,从表现形式上从低到高依次为:主题词、主题概念、主题句、主题段落、主题篇章。知识标引工作是要从知识单元中抽出知识创新点(或兴趣点)——知识元,其目的是让用户直接有效地使用知识单元中的知识元,而不需要将精力浪费在兴趣点之外的部分。目前,经过数字化的档案地情信息,通常都是以文档或者地方志文献为单位加以组织和描述,所进行的主题词、关键词标引的深度一般都停留在档案标题名称层次,尽管人们使用各种技术途径解决信息检索的查全率和查准率问题,但鉴于没有系统的、更加深入的内容标引机制,导致这种标引至多可让人看到文献的摘要,并不能对具体内容(重要内容、或兴趣点)迅速掌握,标引的深度直接影响了编研的质量和效益,因而收效甚微。档案地情文献内容知识元组织的关键技术在于档案地情文献内容知识元的标引。

         在档案地情信息知识网站中,实现档案地情信息的知识元自动标引和管理,是档案地情信息转化为“档案地情信息知识”的关键技术,极具挑战性。按照其内容知识的组织层次,重新构建档案信息组织体系,是档案地情信息转化为“档案地情信息知识”的重要技术路线。这方面的工作涉及“档案地情知识”的粒度控制、“档案地情知识”元组织方式。这方面的工作大多停留在实验研究阶段,但毋庸置疑,档案信息知识体系的构建,对于档案信息的智能检索和编研将提供强大的技术支持。

        从现状来看,许多地方志工作已经或正在从简单的实体管理向信息管理发展,也有一些地方志工作开始尝试知识化的管理和服务。长远来看,地方志工作的重心由实体管理转向信息管理,再由信息管理转向知识化管理和服务,是地方志工作的发展趋势,而档案地情信息知识网站的出现则是顺应这一发展趋势的举动。档案地情知识管理作为知识管理时代背景下催生的新范式,自有其存在的合理性和科学的进步性,实现这个转换并将它应用到网络环境下,不仅让我们对传统科学视野中的问题有了新的认识,更重要的是拓展了传统学术空间和专业领域空间,提高了学科研究的生命力。

        参考文献:

        《广东省地方志工作规定》, 2007(11)。

        黄小红、钱丹丹:《试论数字方志馆建设》,《广东省地方史志》2007(6)。

        刘剑、兰成:《基于概念检索的数字档案馆馆内搜索引擎的设计与实现》,《档案与建设》2008(5)。

        邱君瑞:《自然语言处理与信息检索系统》,《情报杂志》2002(3)。

        曹瑞玲:《档案知识管理与实体管理之探析》,《工会论坛》 2006-11。

        李海军:《档案信息转化为“档案知识”的技术框架探讨》,《山西档案》2007(1)。

        聂云霞、韩亚兰:《档案网站建设的功能定位和内容建设》,《数字兰台》2007-01。

        姜永常:《基于知识构建的数字图书馆知识服务研究》,《黑龙江大学学位论文》2007(6)。

        李菊花:《术与知识服务的思考》,《科技情报开发与经济》2007-01-l4。

       陈巍、张燕、刘明:《谈知识与信息的关系》,《黑龙江交通科技》2006(8)。

(责任编辑 吉文成)