手机版 欢迎访问人人都是自媒体网站
数据来源:https://www.kesci.com/home/dataset/5ce889bed10470002b3394c2
数据分析工具:这是一个天猫双十一女性美妆的数据集,围绕产品及其销量和评论撰写。数据具有7特征,共有27599条记录,可以从多维度解析文本。由于是真实的商业数,所以做了匿名处理,数据集中对点名的引用被处理为产品的品牌以保护店家隐私。此次数据分析所用到的工具有:sql, excel,tableau
二、数据分析基本步骤(1)明确业务需求;
(2)数据采集 ;
(3)提出问题;
(4)数据处理
(5)数据探索分析
(6)数据可视化;
(7)综合数据分析;
1. 明确业务需求通过对数据多维度的分析获取产品的销售规律,分析不同品牌商在双十一使用的产品销售策略,以及用户对产品的喜爱等问题,为后续的营销推广及选品优化改进提供数据支持以及思路。
2. 数据采集本数据集(双十一淘宝美妆数据)包含了约27599个产品的销售数据明细(update_time,id,title,price,sale_count,comment_count, shop_name)。即数据集的每一行表示一个产品的销售情况,由统计时间(update_time),产品编号(id),产品名称(title),交易价格(price),销量(sale_count),评论数量(comment_count),店铺名称(shop_name)组成。
数据来源链接:和鲸社区https://www.kesci.com/home/dataset/5ce889bed10470002b3394c2
字段含义:
Update_time:统计时间
id:产品编号
title:产品名称
price:交易价格
Sale_count:销量
Comment_count:评论数量
Shop_name:店铺名称
3. 提出问题1) 订单量前10的产品id及title
2) 销售额前10的产品id及title
3) 订单量前10的品牌
4) 销售额前10的品牌
5) 关注度前10的产品id及title
6) 关注度前10的品牌
7) 天猫美妆每天产品总销售量(按销量排序)
8) 天猫美妆每天产品总销售额(按销售额排序)
9) 销售额前10的产品平均单价
4. 数据处理(1)导入表格
1) 创建数据库
2) 数据创建表,且导入数据(此时不对表做任何约束,后期导入后清洗)
(2)选择子集
因为我们研究的是双十一期间天猫美妆产品的销量,销售额,关注度等问题,因此在数据筛选时,所有的字段都是需要的,因此暂时不选择子集,选择全集数据;
(3)删除重复项
由于是针对双十一期间各品牌,产品,销量等的研究,由于日期选择为一段时期,故订单会产生重复值,每条数据都有研究意义,故无需做重复值删除操作。
(4)缺失值处理
结果显示2354条缺失值,为不影响分析的精确性,将其删除;
(5)一致化处理
修改update_time的数据类型
(6)异常值处理
由于数据按照不同时间段采集,不具有某种趋势性,在此不做异常值处理
5. 数据探索分析(1) 订单量前10的产品id及title
(2)销售额前10的产品id及title
(3) 订单量前10的品牌
(4)销售额前10的品牌
(5)关注度前10的产品id及title
(6)关注度前10的品牌
(7)天猫美妆每天产品总销售量(按销量排序)
(8)天猫美妆每天产品总销售额(按销售额排序)
(9)销售额前10的产品平均单价
(1)订单量前10的产品定价走向
(2)销售额前10的产品定价走向
(3) 品牌竞争力
(4)综合数据分析
1)从产品日销量上来分析:
Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP