扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共5页)
5、大数据收集
谈一谈数据增长:全球数据量预计每1~2年就会翻一番。这样的增长率意味着数据量将不可想象。
这会导致严峻的问题,大数据量会给软硬件、数据监督、电子发现和GRC带来怎样的影响,惊人的增长率会放缓数据收集的速度,而且同时会受到不同应用类型和存储位置等因素的影响。例如,现有的电子发现功能能很好地覆盖电子邮件,Sharepoint和文件次之。但是基于云的工具和呈爆炸性增长的社交媒体电子发现仍处于起步阶段。一些厂商还在寻找商业智能和信息管理的交点,以提供自动的分析、报告、灵敏的数据移动、项目级的工作流程洞察力,以及更多。
我们认为,数据收集工具在不断完善,但是快速增长的数据带来围绕着存储库、云存储、社交媒体、协作数字创造方面的持续挑战。收集工具的开发和完善必须与这些趋势同步,这对于收集工具提供商来既是机遇,也是挑战。机遇,是因为存在严重的收集技术壁垒;挑战,是因为有市场需求,而且需求增长很快。
6、预测编码
预测编码,是采用抽样数据来建立和执行数据集分析,是加速一些手动分析和审查的相当不错的工具。这并不新鲜,多家厂商利用预测编码来完善电子发现任务,例如分析聚合、创建优先级、分类等。这些操作可缩短审查周期,将不响应的文档以及组织结果分解成多个针对审查者的逻辑屏幕。
相比之下,针对自动审查的预测编码可取代手动审查以节约时间和成本,同时提高精确度。预测编码的实施,是逐步从专业律师审查实例中学习,然后将学习结果应用到更大的审查集中,返回用于质量控制的统计样本。理想的情况下,大型数据集采用防御性审查的时间,要远远少于一个审查小组所花费的时间。在事件中,这并不容易,但确实有利于多个审查任务。
我们认为,针对审查者的预测编码很有前途,但是没有针对机器自动文档审查的相关法律依据。这对于推行预测编码作为审查自动化方法的企业来说是一个严峻的问题。我们看到,推动预测编码普及的动力有三个:首先,创建优先级,帮助一些积极的实施者先完成;其次,企业客户对于审查成本和时间要求苛刻;最后,一些法律公司创建了具有竞争力的审查实践,他们更愿意尝试预测编码。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者