探析数据挖掘技术在情报处理中的应用

发表时间:2020/5/25   来源:《科学与技术》2020年第2期   作者:杨子义 单兰琪
[导读] 目前,数据仓库和数据挖掘已经成为学术界研究
        摘要:目前,数据仓库和数据挖掘已经成为学术界研究、商业应用和管理热点。本文总结目前数据挖掘技术在情报处理中的用途,以期促进数据挖掘技术更好地为情报工作服务。
        关键词:数据挖掘   情报处理  应用
       
        数据库中的知识发现和数据挖掘是20世纪80年代出现的一门新兴学科。它可以自动、并智能地将大量数据转换成有用的信息和知识。目前,数据仓库和数据挖掘已经成为学术界研究、商业应用和管理热点。当前的在线和商业数据库包含大量有用的信息,这就需要一种新的、更有效的技术来挖掘这些海量数据。因此,有必要引入数据挖掘技术来提高我国情报研究的水平和能力。
        互联网的发展导致信息量大量增长。信息的公开化给人们带来便利的同时,也存在着一些问题。首先,信息太多,难以消化。其次,很难确定信息的真实性。 第三,难以保证信息的安全性。第四,信息形式不一致,难以统一处理。 如何从大量的复杂信息中提取有价值的信息,同时进行深入的研究即情报研究,已成为最紧迫的任务。
        一、在情报处理中的数据挖掘应用
        情报是向决策者和组织提供有关目标对象及其周围环境的知识。情报是信息的附加值,具有非共享、相关、动态、特定、认知、主观、现实和竞争等基本属性。信息和情报之间存在差距,信息是情报的基础。情报研究的主要手段是现代信息技术和软科学研究方法,以收集、选择、评估,分析和综合等系列化加工为基本过程,形成为不同层次的科学决策服务的社会化智能活动。
        1.1政府部门决策支持
        为了使政府决策具有科学性前瞻性和可实施性,必须充分利用所涉及的数据。政府管理决策所需的数据通常是一些不同的维数(每个维数代表对数据的特观察角度,例如区域、行业、时间等),不同级别的统计数据和计算(例如部门,单位、地区、国家等)。政府管理中涉及的数据源可能是文档、数据库、网络化结构化数据、反向列表数据库、关系数据库等,甚至是这些数据系统的混合,因此考虑各种数据库的统一使用。数据挖掘是从根本上改变了基于传统的数据库的决策支持系统的弊端,使数据信息更直接可用于帮助政府决策。
        1.2企业竞争情报服务
        企业需要始终保持竞争优势,而强大的竞争优势取决于企业的决策能力,而决策能力又取决于情报资源。在现代信息经济中的商业竞争,市场本身、竞争者,行业趋势、国家政策和其他竞争情报中,对它们的全面及时的掌握决定了企业的成败。基于数据挖掘技术的智能系统使原本在企业内部和外部散乱无章、零散的信息变成可以指导企业决策的清晰逻辑的竞争情报。为企业提供可能出现的机会和危机的预警、对竞争对手的动向进行监控和评估,同时,还可以利用情报服务功能来组织信息的有序存储,成为企业的知识系统。提供内部信息交流、外部环境检测、战略决策支持。
        1.3技术发展预测研究
        所谓技术发展预测是对未来较长时期的科学技术、经济和社会发展进行系统研究的活动,目的是确定研究的战略领域并选择对经济和社会贡献最大的技术群的活动。该过程主要是收集该地区关键地区的经济和社会发展(科学和技术需求)的技术和项目,对数据处理,选择重点技术,在系统集成分析的基础上选择关键技术,撰写综合研究报告,建立技术和项目数据库,并通过应用大量文献调查和比较的方法来预测发展趋势。任何预测研究领域的成功取决于两件事:研究人员发现过去发展模式的规律和确定未来发展所需的信息或数据的可用性。面向预测研究的信息集是一个庞大的数据库,它使用数据挖掘技术进行分析和预测,希望从海量数据中发现关联规则,根据现有信息预测未来趋势,从各种信息中获取知识。战略分析包括信息收集、信息处理、信息检索、信息分析、信息应用等各个部分,通过完整的价值链系统,将信息文献升级为关于技术发展方向的情报。


        1.4科技项目的定题跟踪和检索查新
        定题服务是根据客户需求提,情报人员主动进行调查,提供必要的情报和相应的文档,它被定义为积极、持续、系统地为客户提供服务。定题服务需要从大量复杂信息中提取有价值的信息,进行深入的处理和情报研究,动态信息。定题服务和检索查新要求的文献源也呈多元化,并且信息量呈几何级数快速增长。仅Dialog国际联机系统就囊括了600多个大型数据库,涵盖了广泛的领域,包括自然科学、社会科学、工程学、人文科学、商业和经济学,报纸和新闻。谷歌、搜索引擎现在拥有超过20亿个网站,超过30亿个网页,其中超过3000万是中文。除了需求之外,数据挖掘技术还可以科学地制定搜索策略和程序,确定解决问题的正确途径,还需要以数据挖掘技术为核心的情报系统的支持。情报系统需要从传统的服务模式提供的固定检索,变成广博的网上资源和数据库中自动挖掘,通过互联网主动地的推送给客户。
        1.5拓展研究领域
        在传统的信息环境下,我国的情报研究主要依靠图书馆等有特定历史背景的档案机构。在这种环境下,情报分析研究者或机构一般会研究一个或几个学科领域。 由于受传统的信息环境和技术条件的限制,他们不能及时、广泛地获取信息,也不具备组织和处理大量信息的技术手段,不能满足信息的分析和研究的要求.然而,网络化和计算机技术的发展使信息收集和研究发生了一些变化,信息资源网络化,用户可以更方便地获得信息资源;信息资源的扩展,用户可以通过数据库和搜索引擎获得更多的信息资源。信息处理是系统化的,让用户将收集到的信息资源输入到系统中进行初步分析。情报收集子系统是情报系统提供决策支持的基础。在情报收集阶段,信息来源主要通过互联网资源、各种商业数据库、在线数据库等平台存储在数据仓库中。 这时候的情报是杂乱的,表现形式也是多种多样的,包括报告、报表、图文、声音、视频和演示文稿等。 无论大量分布式知识或信息的形式和渠道如何,情报收集子系统都应该能够收集到,并进行储存和组织。
        二、结束语
        数字时代信息科学的新使命就是,根据发展情况创造新的理论,利用最先进的方法和工具为决策者和组织提供真实的信息,数据挖掘是最重要的技术之一。 利用数据挖掘技术对数据进行充分分析,高效的为领导决策提供情报,已成为研究热点。情报研究的过程中,首先要解决情报用户的需求及其目的、范围、重要性、环境问题,进行具体分析,确定研究方向,并在研究领域内做好进一步的资料收集工作,同时对整个过程时间进行控制,保证资料收集的时效性。
        目前大量的、重复的、不完整的、嘈杂的、模糊的、随机的各类信息大量存在。通过现有的态势处理或态势显示等工具能够直观地看到某一个或几个目标 活动的轨迹,然而,你无法看到这些活动的规律。我国对数据挖掘技术的应用才刚刚起步,尤其是在智能处理领域,这种技术的应用,可以通过已有大量的数据来掌握其内在的活动规律,这对情报人员在复杂的信息中心获取潜在的有价值的情报信息有很大的帮助。
       
       
        参考文献:
        [1]   陈京民.数据仓库原理、设计与应用[M],北京:中国水 利水电出版社,2004.
        [2]   施宏,郝英川.线形光纤传输宽带射频信号技术及实 现[J].无线电工程,2007,37(4) :42 - 44.
        [3]   员建厦.基于数据仓库的信息处理系统及关键技术研 宄P].西安:西安电子科技大学,2006:78 - 88.
       
        作者简介:杨子义(1988-),男,汉族,山西河曲人,大专。
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: