手机版 欢迎访问人人都是自媒体网站

当前位置:主页 > 体验 >

从负基础起步,掌握数据分析技能

时间:2021-07-21 09:22|来源:网络整理|编辑:|点击:

笔者向我们说明了学会数据分析对于运营人的重要性,并介绍了如何掌握数据分析技能。

 从负基础起步,掌握数据分析技能

作为一个在大学与统计、数学、计算机这些学科完全绝缘的语言学专业的毕业僧,同时又是一个从医疗销售半路出家转行到互联网的产品运营。连数据零基础都算不上,到现在玩得转SQL,写得了代码,利用这些工具极大地提升了工作效率,也帮助我获得了更多的职场机会。

这篇文章来说下,怎么掌握数据分析技能。

一、为什么学习数据分析 1. 运营的尴尬:运营人需要一个硬技能

每个初入行的新人都会察觉到,运营是一个似乎并没有自己的核心竞争力和安全感的工作。因为每天的工作好像都被各种琐事所围绕,而只有一个主题是永恒不变的,那就是——提需求,不断地提各种需求。

运营人需要一个硬核技能,提升自己的职业价值,提高自己的职业安全感,而不是每天都在各种的等排期:数据分析排期、产品设计排期、UI排期、开发排期。

运营迫切需要通过利用SQL/Python等工具,从数据中及时发现更多的业务价值,提高自己的产出。

2. 数据分析的前景

这几年随着人工智能的火热,数据分析技能也逐渐受到了更多的认可。从国外BA专业申请和国内数据分析培训的火热也可见一斑。但对于在职人士,从单纯的技能习得角度去看,BA的能力完全是可以自学获得的。

我认为:未来数据分析能力在运营人的能力模型中的比重仍会继续加大,将来甚至会挤压数据分析师的需求和生存空间。所以,对于数据分析,前景很好;而数据分析师,前景并不乐观。

二、学习数据分析需要做的准备 1. 明确方向

数据分析有两个方向:

业务向:如数据产品经理、数据分析师,对技术要求并不那么高;

技术向:需要懂数据挖掘、算法等,对技术的要求较高。

从自己的定位来看,并不打算做数据挖掘,因为自己的知识结构和时间上的投入产出比可能并不太高。主要希望通过数据分析技能,增强自己作为产品运营的竞争力。

2. 做好持久战准备

于我一个没有任何基础的纯小白而言,并不是能速成的,需要做好持续学习的准备。

三、做好数据分析需要具备哪些技能

统计学基础知识

Excel的熟练使用

SQL

Python

分析方法和思维

对业务的充分理解

从自身来看,主要需要弥补的为:SQL+Excel+统计+Python。主要以看书为主,视频为辅,不需要报任何的培训班。

1. SQL

SQL大概是互联网公司做数据分析用到的最多、最重要的工具了。在整个数据分析过程中,用SQL提取数据,可能要占到整个数据分析过程的50%-80%,以至于很多数据分析师都被戏称为“SQL Boy/Girl”。

MySQL数据库的功能可以用四个字概括:增删改查。

但是对于我们来说,我们能用到的只会有数据库查询功能,其它权限是不可能开放给你的。

如果数据库你觉得生涩的话,可以这么理解:

SQL? 就是一条存取数据的命令;

数据库? 就相当于一个文件夹;

数据表? 就相当于文件夹内的一个Excel文件。

表名就是文件名;表中的每一列有一个名字,就是列名,也可以成为字段。

SQL的学习可以分为三块:

简单查询

关联查询

函数引用

什么是查询呢?

在数据库建立之后,通过sql命令里最常用的语句SELECT,让我们查看数据库里保存的数据,并可以进行一定的分析和归纳。

 从负基础起步,掌握数据分析技能

(1)简单查询

SELECT语句的完整格式包含6个子句:

FROM 子句:查询数据的表,指定数据的来源;

WHERE 子句:查询数据的过滤条件;

GROUP BY 子句:对匹配 WHERE 子句的查询结果进行分组;

HAVING 子句:对分组后的结果进行条件限制;

ORDER BY 子句:对查询结果进行排序,后面跟 DESC 降序或 ASC 升序(默认);

LIMIT 子句:对查询的显示结果限制行数。

(2)关联查询

如果要进行多表查询,就需要用到连接。

连接查询是把两个或多个表连接在一起来获取数据,是关系型数据库中最主要的查询。表的连接方式主要包括内连接、外连接和交叉连接等。

from 指定查询表名、并给出别名;

left join 左外连接,左表全部记录及右表匹配记录出现在查询结果中;

inner join 内连接,左表和右表共同的记录出现在查询结果中;

right join 右外连接,右表全部记录及左表匹配记录出现在查询结果中;

on 指定关联条件。

表连接后的结果可以通过这个图清晰地展示出来:

 从负基础起步,掌握数据分析技能

(3)函数引用

利用函数可以提高sql的效率,经常用到的函数主要有:

逻辑运算:and、or、not;

数值运算:round、floor、ceil、rand、exp、sqrt等;

日期函数:from_unixtime、unix_timestamp、year、month、day、hour、minute、second、weekofyear、detediff、date_add、date_sub等;

条件函数:if、coalesce、case when等;

字符串函数:concat、substr、trim、reverse、split等;

集合统计函数:count、sum、max、min、percentile等。

推荐书目:

推荐下我们部门每个运营同学人手一本的必备书目:《SQL必知必会》

经典习题:https://blog.csdn.net/flycat296/article/details/63681089

Hive:

随着数据量的不断增加,很多时候mysql已经满足不了数据需要,很多公司开始使用hive或者presto。其实有了SQL的基础,HIVE学习还是比较简单的。

推荐书目:《HIVE编程指南》。

重点看下HQL的数据操作、查询、调优部分,与mySQL大同小异,只是一些语法需要单独注意下即可。

2. Excel

Excel大家多少都会一些,它的功能很强大,但是绝大多数人,可能使用了它的1%功能都不到。

Excel 可以进行各种数据的处理、统计分析和辅助决策等。

Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP