手机版 欢迎访问人人都是自媒体网站
编辑导语:数据的时空观是我们认识数据价值的一种新角度,它研究的是数据在时间和空间两个维度上的价值规律与作用机制,那么该如何理解数据的时空观?本文作者基于数据的时空观问题展开了分析,看看如何才能从时空观中看出数据的取舍之道。
之前谈过数据的价值观,今天想谈一谈数据的时空观。
说到时空观,好像也是大数据领域比较忌讳的。因为一说到时空观就要扯到相对论了,在大数据领域来聊相对论的话题,大部分专家是不敢搬起石头砸自己的脚的。
没关系,反正笔者是大数据领域的一个小角色,胡说八道的聊几句,也不会掉自己的身价。
所以,今天笔者就打肿脸充胖子,在这里说说自己对数据时空观的理解。
一、什么是数据的时空观开门见山,先说说什么是数据的时空观。
笔者认为:数据的时空观是关于数据在时间和空间两个维度上的价值规律与作用机制的基本看法与认知。这里提到的数据是一种宽泛的说法——既包括传统的结构化数据,也包括音视频、文本等非结构化与半结构化数据。
由以上定义可知,数据的时空观要研究的是数据在时间序列和空间位置上价值变化规律。
时间和空间本身就是人类认知世界经常分析的两个维度:时间和空间一方面可以对应到数据的纵向深度和横向广度,另一方面还可理解为数据在三维立体世界中的生命力,数据的时空价值本身就是数据生命力的体现。
二、如何理解数据的时空观 1. 数据的时间观:数据是有温度的时间赋予数据以温度。
绝大部分数据是有时间上的延续性的,随着时间的推移,数据的温度或热度也随着变化。越是久远的数据,其“体温”就越低,而此时此刻的数据则是鲜活的,新鲜出炉的数据就有较高的温度。
企业根据数据的温度差异,可以对不同温度的数据进行差异化处理。
比如:在用户画像领域,可以将用户的数据分为冷数据、温数据和热数据三种类型。
冷数据:一般指三个月前的数据,这些数据通常比较稳定,长期以来不怎么变化,例如:年龄、性别、常住地、职业等;
温数据:指近三个月内的数据,是半冷不热的数据,比如:近一个月下载过哪些APP、玩过哪些游戏等等,这些都是具有一定时效性的数据;
热数据:指实时的数据,即此时此刻用户在做些什么,这些数据都有极高的时效性,把握这些热数据所产生的商机往往能考验企业与个人的灵敏度和实时营销能力。比如:对于滴滴司机来说,抢到更多的实时订单就意味着空载率越低,其在单位时间内的运营效率就越高,实时订单就是热数据,司机获得高价值的热数据越多,也就能赚到更多的钱。
商业领域,数据价值一般随着时间的流逝在衰减。
艾宾浩斯遗忘曲线告诉我们,遗忘是人类的天性,时间越久远的事物,人类大脑能记住的就越少。
而在商业领域,随着人类采集和存储数据的技术日益成熟,数据存储成本的快速降低,需要人类大脑记住的数据反倒越来越少了,数据的记忆工作大部分都交给了电脑、云盘、服务器等工具。
随着时间的推移,数据量在增加,数据存储成本也在增加。
但是,从数据价值的时效性来看,越是新鲜的数据其价值一般会越高,而同样的数据如果是半年前的,那么其价值就会大打折扣。伴随着时间的流逝,数据的价值一般呈衰减态势。
在某些特定领域,时间能为数据主体带来增值。并非在所有的领域,时间都会让数据及其主体的价值产生衰减效应。
比如:一些古董或考古文物,对于此类物品有浓厚兴趣的玩家,其年代越久远,物品的价值就越高。
数据此时虽说只是一种记录或者证明,但是数据珍藏的时间越长久,承载数据的主体其稀缺度就越高,在市场上的估价就越高。
再比如:在很多悬疑侦破类电视剧中,很多历史上的案件因为缺乏实际有效的证据而被搁置为悬案。此时历史上的证明资料,可能就是一段视频文件,这些视频资料的数据因其重要性和难获得性,其对于案件侦破的价值就显得非常高。
当然,还有一些经典的影像资料、音乐作品、艺术作品等,这些作品及其所承载数据也是随着时间的流逝而会呈现价值增值的。
数据的时间价值是相对的。
价值本身是一个相对的概念,数据在时间维度上的价值也是相对的:一方面与数据本身的价值有关,另一方面也与个人或组织对于数据本身的感知有关。
Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP