加入收藏 | 设为首页 | 会员中心 | 我要投稿 南通站长网 (https://www.0513zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

大数据和人工智能

发布时间:2021-04-06 15:38:50 所属栏目:评论 来源:互联网
导读:面对客户的大集团行业,应用的点也更多在针对性营销,推荐引擎,客户画像等方面。也就是说理想的应用场景很多,但是大量落地场景并不多。 很多企业建大数据平台,投入大量资源,时间和成本,虽然完成了统一的数据采集和存储,但是数据本身产生的价值并没有体

面对客户的大集团行业,应用的点也更多在针对性营销,推荐引擎,客户画像等方面。也就是说理想的应用场景很多,但是大量落地场景并不多。

很多企业建大数据平台,投入大量资源,时间和成本,虽然完成了统一的数据采集和存储,但是数据本身产生的价值并没有体现出来。

类似当前数据中台,实际也在谈一点,大数据平台不能是只做OLAP分析,做分析决策,更多的要考虑数据能力实时开放,反哺业务,为业务服务。

当你构建了大数据平台后,你会看到后续的数据运维,数据管控治理,数据分析均需要持续大量的人员投入,如果数据本身无法产生价值,那么平台最终被荒废掉也是合理之选。

大数据和传统BI

对于大部分企业来说,企业信息化发展本身也有一个过程。

其前期的数据分析更多的还是围绕结构化数据展开,这些数据采集集中后上PB级并不容易,同时也全部是结构化数据,这个时候传统的BI系统构建思路仍然适用,唯一的就是数据量大后你可能需要转到类似MPP分布式的数据分析库上来解决性能问题。

如果你完全采用类似Hadoop来构建大数据技术平台来解决上面这些问题,那么实际上完全没有必要,你会发现会引入更多的技术复杂度和业务建模复杂度。

为什么这样讲?

对于传统BI分析里面的维度分析,上钻下钻,切片等基于维度建模型形成的分析能力,在Hadoop存储和处理中并不合适。Hadoop在数据存储扩展,分析SQL运行效率上有明显提升,但是很多BI里面并不需要实时查询或即席查询能力。

也就是说企业如果没有这种数据实时分析结果反哺业务的需求,那么你更加没有必要马上去搭建这种大数据平台来解决你的问题。

相关性和因果关系

早期,《大数据时代》这本书可以说相当的活,作者在书中提出的“大数据三原则”:要全体不要抽样,要效率不要绝对精确,要相关不要因果。再次提到了大数据更加关注数据之间的相关性而非因果逻辑。

也就是大家熟知的啤酒和尿片的故事。

这个故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入,这就是“啤酒与尿布” 故事的由来。

认知逻辑-从机械思维到信息论

当今天重新回顾这个案例的时候,实际本身就是我们认知世界的方式在发生大的变化。

我们传统思考方式就是机械思维,其中牛顿之一个很大的贡献值,简单来说就是自然界发生的各自现象事件,一定有其内在的规律和原因,同时这个原因我们可以用抽象的公式或模型来进行表达。

那么当我们遇到同样的现象的时候,就可以用公式去解

 

(编辑:南通站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读