手机版 欢迎访问人人都是自媒体网站

当前位置:主页 > 体验 >

数据的能力和价值你真的了解吗?

时间:2021-07-29 09:40|来源:网络整理|编辑:|点击:

当前大家都在谈论一个话题——数据,到底数据具有什么“魅力”,能让无数人耗费心血地去研究。

 数据的能力和价值你真的了解吗?

大数据是一个持久发热的话题,而且热火朝天的人工智能依赖于大数据的发展。大家都在讨论数据能力,数据能力是一个很抽象的概念,那数据能力具体是什么?数据价值呢?

数据自身是没有价值或者说微乎其微的,价值是被赋予的,就像黄金一样,黄金的价值是他的应用前景或场景。数据的价值就是数据能力体现出的收益,或者说投资回报率。

今天我们就来聊聊数据能力和价值。

说到大数据就不得不提数据仓库,企业数据仓库演化至最终阶段或许会变为大脑中枢神经,如果要支撑起整个复杂的大脑和神经系统,需要一系列的复杂机制配合。

而这一套支撑体系在数据层面会形成大家口中长谈的数据能力,而数据能力是什么?支撑体系又是什么?那具备了这些能力后的价值又是什么,如何应用呢?

一、抽象的数据能力架构

我把数据能力抽象概括为四个方向:传输能力、计算能力、算法能力和数据资产量级,后面会讲述在这四个能力之上泛化出的数据应用和价值。

 数据的能力和价值你真的了解吗?

图1.1 抽象数据能力构成

1. 数据传输能力

数据大部分的使用场景必然会涉及到数据传输,数据传输性能决定了部分应用场景的实现,数据实时的调用、加工、算法推荐和预测等;而传输抽象出来的支撑体系是底层的数据存储架构(当然非同机房的传输还要考虑到网络环境等。单纯的小数据量调用等一般不会涉及到这些,但数据量级大、高并发且对SLA要求非常严格的时候,就是对数据传输能力的考验)。

从产品的角度我把数据传输能力分解为:底层数据传输效率应用层数据传输效率

底层的数据传输效率是指数据源进入后的预处理阶段的传输效率,即加工为产品所需的数据交付物之前阶段。

 数据的能力和价值你真的了解吗?

图2.1 数据应用链路

Ps:数据在可为产品所用之前需要很长的一段加工过程,应用层数据产品基本不涵盖底层数据加工环节,而数据产品会用到规定好的数据交付物(即已约定好的结构化或标准化的数据),而利用此数据交付物再经过产品对实际应用场景的匹配和加工来提供数据服务。即使涉及底层数据管理的相关产品也是对Meta元数据、使用日志或写好的shell等的调用。

底层数据加工计算所涉及到的传输效率,直接决定了支撑数据产品高性能、高可靠的自身需求;而应用层的传输影响了用户体验和场景实现。传输机制和体系就像毛细血管一样遍布全身错综复杂,但是流通速率直接决定了大脑供氧是否充足。

2. 数据计算能力

数据计算能力就像造血系统一样,根据多种来源的养分原料进行生产加工最终产出血液。而源数据通过高性能的底层多存储的分布式技术架构进行ETL(抽取、转换、装载)清洗后产出的是数据中间层通用化的结构化数据交付物。计算速度就像造血速度一样,决定了供应量。而计算速度直接决定了数据应用的时效性和应用场景。

目前最多最普遍的就是离线数仓,离线数仓大部分担任着事后诸葛亮的角色,即没办法保证数据的及时性而延后了数据分析及应用的产出,导致更多的是沉淀经验而难以做到实时决策。而实时数仓,甚至说对Data Lake(数据湖)的实时处理已经逐步开放应用多种场景。我们先不考虑越来越强烈的实时性要求带来的巨大成本是否真的可以创造等值的收益。

强实时可以更接近一个“未来”的状态,即此时此刻。这远比算法对未来的预测更有价值,因为把握眼前比构造多变的未来对一个企业更有价值。甚至说当数据过程快过神经元的传递,那么从获取到你脑电波的那一刻起,数据处理的驱动结果远比神经元传递至驱动四肢要快。

是不是与兵马未动,粮草先行的场景相似?当然这是以数据计算能力的角度来看待这个问题。跳出来以我个人的观点来说,整体数据能力强大到一定阶段后,会从主观改变个人的意愿,即通过引导你的大脑从而来控制或决定个人行为且不会让你感知,所以可以理解为从主观改变个人意愿。从人的角度来说,你并不知道或者直观意愿去凭空决定下一步要做什么,因为大脑是逻辑处理器,当然这又涉及到心理学,这些观点就不在此赘述了,等往后另起一个篇幅来说数据应用未来前景和假想。

3. 数据资产能力

Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP