哈希算法在电子数据取证中的应用研究

发表时间:2021/3/26   来源:《中国科技信息》2021年3月   作者:刘凯
[导读] 文章主要是分析了电子数据取证的含义,在此基础上讲解了电子数据取证的现状,最后探讨了政府部门工作中电子数据取证的实际应用情况,望可以为有关人员提供到一定的参考和帮助。

南京理工大学资产经营有限公司  刘凯 210094

摘要:文章主要是分析了电子数据取证的含义,在此基础上讲解了电子数据取证的现状,最后探讨了政府部门工作中电子数据取证的实际应用情况,望可以为有关人员提供到一定的参考和帮助。
关键字:电子数据;取证;鉴别
        1、前言
        为对银行信息造假方面的取证、鉴别,特别是要查清楚影响到其界定罪以及定罪量刑的事实,而对其的认定只能通过收集证据进行验证。文章对电子数据取证在鉴别中的应用展开了研究和分析。
        2、哈希算法的含义
        计算机科学中的哈希一般指hash函数,也经常称作“散列”。哈希值在电子数据取证领域常用作校验数据的完整性,它的地位相当于法医的DNA检验、笔迹鉴定的书写动力定型、指纹鉴定的细节特征组合。
        3、哈希算法特点
       (1)只要原始信息更改哪怕一个字节,哈希计算的结果都会完全不同,要找到同一哈希值的两个不同源数据,在计算上来说是基本不可能的。
       (2)在哈希函数中的输入有可能会得到相同的哈希值,因此不可能通过哈希值来逆向确定唯一的输入值。通俗的讲就是,哈希算法不能从结果推算出输入。
        4、哈希算法应用
        由于哈希算法经常用于对数据库的帐户密码进行保护,很多数据库中不保存密码明文而保存密码的哈希值,不少人都将哈希算法也当成是一种加密算法,实际上哈希算法和加密算法存在本质的差异。哈希算法为不可逆算法,无法通过哈希值推测出原文内容;加密算法主要分为对称加密算法和非对称加密算法,对称加密算法的加解密密钥相同,非对称加密算法的加解密密钥不同,但都可以由密文通过密钥计算出明文。哈希算法在电子数据取证中最重要的运用是数据一致性校验。
        为了保证流程的严谨、证据链的完整,证据保全期间制作镜像时应计算源数据及目标数据(克隆盘或镜像文件)的哈希。在取证分析及电子数据鉴定的各个环节,应校验数据的哈希值以确保数据的原始性和完整性。数据的完整性校验值一般也是某种哈希值。电子数据取证工作中,常使用?MD5、SHA-1及SHA-256等哈希算法计算数据的哈希值或对进行数据的一致性校验;计算的对象可以是硬盘、分区或特定文件。


通常相同的数据使用同一种哈希算法计算得到的消息摘要值完全一致,而不同的数据,哪怕只改变1bit,使用同一种哈希算法计算得到的消息摘要值则不同,这称之为哈希算法的雪崩效应。CNAS认可的司法鉴定/法庭科学机构认可领域分类(详见CNAS─AL13文件)中电子数据鉴定一共有三类,分别是电子数据的提取、固定与恢复和电子数据真实性(完整性)鉴定以及电子数据同一性、相似性鉴定。其中电子数据的同一性鉴定需要用到国家标准GB/T?29361-2012《电子物证文件一致性检验规程》,该标准中要求的最重要也是计算并比较样本的哈希值。
        哈希算法在电子数据中另一个重要应用是哈希库(Hash?Library)功能。
        美国NIST国家标准研究院基于常见的操作系统、应用软件等工具的相关文件进行了哈希计算,形成一个庞大的哈希库,因此,在电子数据取证中,国外取证人员常使用取证软件导入NIST的哈希库,将操作系统、应用软件等类型的文件进行排除。此外,国外也建立了一些重点文件哈希库(如儿童色情图片),一旦存储介质中(硬盘或手机等)存储了此类文件,即可进行快速比对,检查出与哈希库匹配的图片,从而提升现场取证的排查效率。哈希算法也可以用于对重要信息/数据的保护(如对数据库保存的用户密码的保护)。2013年国内知名的程序员网站CSDN因数据库信息泄露,数据库中存储的用户密码并未采用任何安全保护机制,因此,大量用户的明文密码直接泄露。后来,国内更加注重后台数据的安全保护,多数都采用哈希算法来保护明文密码,甚至采用基于salt加盐(随机数)的哈希计算,多轮哈希计算等方式提高安全性。
        5、结束语
        哈希算法广泛应用于信息安全、电子数据取证等诸多领域,部分哈希算法的碰撞概率对于安全通讯、加密应用(数字证书/数字签名)等均存在一定影响。虽然,在电子数据取证领域,MD5、SHA-1等哈希算法存在一定碰撞概率,但鉴于其碰撞概率并不高、计算摘要值效率高等因素,笔者认为它们仍可继续用于常见的文件及磁盘的一致性校验。随着计算机处理器计算能力的逐步提升,国内相关机构及标准也可以推荐或逐步强制使用更高标准的哈希算法(如SHA-256、SHA-512),或同时采用多种哈希算法,以减少哈希碰撞概率。
参考文献
[1]王冠. 哈希算法在电子数据取证中的应用研究[J]. 网络安全技术与应用, 2020, No.239(11):178-179.
[2]臧金明. 区块链技术在电子数据云取证中的应用[J]. 网络安全技术与应用, 2020, No.234(06):154-155.
[3]廖赟, 丁兆锟, 谢波,等. 基于2I的手机数据关联挖掘取证技术研究[J]. 信息系统工程, 2020(5):22-23.
[4]冯聿梦. 如何利用哈希算法,数字信封固定电子审计证据[J]. 中国审计, 2020(2):42-43.
[5]贾佳. 基于离散监督哈希的图片检索算法研究[D]. 2020.
[6]蔡明壮, 孔祥任. 基于机器学习与哈希算法的群智大数据优选——以车辆精准检测为例[J]. 电子世界, 2020, No.584(02):73-74.

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: