jdl008

大数据的分类(大数据的分类与应用图片素材)

jdl008 职业培训 2024-09-28 5浏览 0

  什么是大数据

  首先:大数据≠大量数据

  Wiki定义:利用常用软件工具来获取、管理、处理数据所消耗的时间超过可容忍时间的数据集。

  研究机构Gartner定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化 资产。

  iForensic针对电子取证领域大数据的理解:对于获取到的涉案检材数据处理量,难以通过单一的提取工具和方法进行线索和证据的筛查,或者获取和分析线索证据所需要的时间超出案件侦办常规时限范围的数据。

  举例一:单部手机获取到百万计社交聊天记录,固定后交由办案人员难以从中查看有价值的数据;

  举例二:涉及多部检材,不同对象之间关系复杂,或使用社交工具多样化的,整理分析工作量巨大;

  

  随着当前电子证据检验办案的重视程度不断提高,涉案电子证据的数据分析需求已经满足了大数据分析方法的基础条件,不仅仅因为数据量大,还有分析工作量大,目标数据多样化等诸多因素。

  大数据的4V特性

  

  电子取证中的4V特性

  

  电子取证大数据分析方法的基础,满足大数据的4V特性,主要表现在如下方面:

  数据规模大

  随着电子证据检验的重视程度不断提高,无论是从案件送检量而言,还是从涉案数据量上来看,都呈现爆炸式增长,然而具有丰富经验的办案技术人员的增长比例相比捉襟见肘。人均办案量的呈翻倍增长在各地都屡见不鲜。

数据种类多

  可用于线索和证据的数据类型多样化。从电子取证初期的短信、通话记录,到现在的微信(文字、语音、图片、视频、朋友圈)、QQ、支付宝、微薄等,智能机的普及不仅仅是方便了生活,对于电子取证领域而言,需要关注的数据类型也丰富多样。

要求速度快

  电子物证检验办案工作中,尤其是以涉及到线索侦查类型的案件,时效性尤其重要,因此在检验工作中,快速的从繁杂而海量的数据中提取有价值的线索和证据,是当下电子证据取证分析工作的一个根本要求。

价值密度低

  随着信息流动的速度加快,各类新闻、广告、甚至是谣言,都在迅速的传播。随之而来的影响是,在电子物证检材中,真正有价值的线索或者证据有可能就是只言片语,有些甚至隐藏在多种数据背后。因此大数据的碰撞、挖掘、整理和归类能力,可以有效的在数据海洋中,获取低密度的精华数据。

  大数据处理电子证据的核心问题

获取有效数据

  全面和规范的获取数据,是后期分析正确结果,把握正确导向的首要条件。如果获取的数据存在瑕疵,即便是利用先进的分析方法,也容易出现误导。

选择正确的分析方法

  使用正确的分析方法,优化现阶段全盘数据导出的传统模式,结合案情和检验需求,充分对数据进行提炼和筛选,是高效处理电子证据的重要手段。也是提高电子证据检验分析工作效率的重要方法。

  

使用有效的显示方法

  大数据分析方法中,可视化显示是重要的组成部分。电子证据检验中,将传统的数据按照结构化和非结构化划分,结合图表化、图形化等多种可视化显示方法,可以直观的展现电子证据和线索,以及隐藏在数据背后的关系。

  

高效的数据处理能力

  针对规模大、种类多、结构复杂的涉案数据,需要依托后台强大的数据运算能力,其中分布式处理方法是实现快速分析和实时响应的重要基础。相比单机分析能力而言,能够更加充分发挥电子证据应有的线索和证据效力。

  

  目前,不少执法机构已经建设或者筹备建设基于大数据分析方法的取证云平台,电子取证行业专业公司也逐步加大取证云平台的开发建设力度,甚至也有从未接触过电子取证行业的公司介入到电子取证专业领域,如何选择和建设符合电子取证办案工作的取证云,也要考虑诸多因素,除了需要具备海量数据分布式处理能力,简洁直观的可视化显示方案以外,对于前端数据全面规范的固定提取、 符合实际办案需求的各类分析方法、强大的分析模块定制能力、全面的各类数据兼容能力、专业的技术服务支撑、稳定的升级更新等等都是需要考量的因素。

  总的来说,目前大数据将是电子取证发展再上一个台阶的最好时期。

  本文感谢杭州平航科技提供素材,部分内容受到版权保护,原作者已授权微信公众号:电子证据(eForensic)翻译发布,转发请注明出处,谢绝重复编辑,不得用于任何商业目的。如果您喜欢相关文章,欢迎关注我们。

  

  电子取证

  微信号:eForendisc

  专注电子取证领域技术和发展

版权声明

本文仅代表作者观点,不代表B5编程立场。
本文系作者授权发表,未经许可,不得转载。

继续浏览有关 大数据的分类 的文章
发表评论