加入收藏 | 设为首页 | 会员中心 | 我要投稿 南通站长网 (https://www.0513zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

从垃圾数据到数据完整性的改变

发布时间:2022-03-23 09:47:08 所属栏目:大数据 来源:互联网
导读:数据产生的速度越来越快,这已经不是什么秘密。根据IDC的数据,由于在家里工作、学习和做事的人数突然增加,2020年产生和复制了更多的数据。此外,据预测,未来5年创造的数字数据量将是数字存储出现以来所创造数据量的两倍以上。 但这引出了一个问题,这些数
  数据产生的速度越来越快,这已经不是什么秘密。根据IDC的数据,由于在家里工作、学习和做事的人数突然增加,2020年产生和复制了更多的数据。此外,据预测,未来5年创造的数字数据量将是数字存储出现以来所创造数据量的两倍以上。
 
  但这引出了一个问题,这些数据有用吗?还是只是“垃圾”?答案在于组织如何管理他们的数据,那些做得好的组织不太可能遇到垃圾数据。但对于那些没有正确的工具来管理所有的数据来源的企业来说,答案是肯定的,他们正在处理垃圾数据。
 
  在我们讨论公司如何摆脱垃圾数据的麻烦(和成本)之前,让我们更深入地了解什么是垃圾数据。首先,我们应该解决什么是垃圾数据的问题:原始数据不是垃圾数据。这包括从交易系统、产品、设备和其他来源创建的任何数据。
 
  什么是垃圾数据?
  另一方面,垃圾数据是任何不受治理的数据,当你创建了一个数据副本,然后为一个特定的使用案例进行操作,而没有将改进的数据返回到原始数据存储,为下一次使用提高质量时,就会产生垃圾数据。Salesforce将垃圾数据分为四类:缺失的信息、不准确的信息、过时的数据和重复的数据。
 
  当个人从一个更大的数据集中为一个特定的用例复制数据,对其进行修改,然后不将这些修改整合到更大的数据集中时,垃圾数据就开始积累。例如,如果你在你的记录系统中有一个正式的客户地址数据库,只复制了那些在芝加哥地区的客户,并更新了该数据的子集,而没有更新源数据,你就创造了垃圾数据。有了垃圾数据,你就没有一个明确的脉络或省份,它就不能被其他人轻易地访问和使用;更糟糕的是,你有多个不一致的“真相”版本。这最终会在一个组织内产生多个一次性的数据集,而这些数据并不能为所有用户提供价值。垃圾数据带来了问题。
 
  在更大的范围内,如果一个组织的数据具有完整性,企业领导人就可以利用这些数据做出准确的业务决策,从而获得更好的结果。在垃圾数据的背景下,如果一个公司已经实现了数据的完整性,他们就不再需要花时间去解决数据的不一致性,纠正和审查数据。完整性的数据已经在手边,这些数据可靠并准备好,可以开始工作了。

  摆脱垃圾数据的最好方法是消除对它的需求。如果一个组织创建了具有高完整性的可访问数据资产,并在一个受管理的环境中确保数据可以按照公司的政策、权利和指导方针使用,那么员工将不再需要创建和维护数据的副本来执行一个特定的任务。通过花时间在前期投资其数据完整性,公司可以确保其数据资产的质量和安全性,并适当地提供给企业,最终节省时间和金钱。

(编辑:南通站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读