CDA数据分析师出品
作者:Mika、泽龙
数据:真达
后期:泽龙
:今天我们来聊聊小朋友和大朋友们都爱不释手的乐高,Python技术部分请看第四部分。Showmedata,用数据说话!
六一儿童节到了,过节的不仅仅是儿童,还有很多不想长大的成年人。然而,儿童游乐场不好意思去跟小朋友抢,幼儿园里已经没有容身之地。这时,玩具可能是最后一件能让成年人过把瘾的方式了。
根据去年的天猫双11数据统计:双11玩具/童车/益智/积木品牌TOP20榜单中,在玩具领域,乐高位居首位,占据了1/5的市场份额,销售额超过1138万元,销量达14712件,妥妥的玩具领域大佬。今天我们就用数据来聊一聊,小朋友和大朋友们都爱不释手的乐高。
01、老少皆宜大IP联名,玩具居然可以这么玩?!
1932年,乐高公司在丹麦成立。商标“LEGO”是来自丹麦语“LEgGOdt”,意为“playwell”。
在10年前,乐高真是家庭水准的体现,小时候能有个乐高玩具,应该是很多人的梦想,但是长大了发现,现在拥有乐高玩具,也是梦想。有多少人在疫情期间想在淘宝买乐高玩具,也来挑战下千年隼75192,证明自己不再是手残党。
外国的乐高狂热粉丝用乐高拼了一辆能开的跑车,真的可以以每小时15公里的速度前进,这也算是人类创造能力的体现,本身乐高提倡的就是自由组装,playwell。创造力才是他们的核心,这也就证明了乐高从小孩玩具到创造力检测仪的进化。
桥水基金创始人:美国银行业危机影响的不仅仅是银行业:金色财经报道,在清华五道口全球金融论坛高端对话环节,国际货币基金组织原副总裁、中国人民银行原副行长朱民对话桥水基金创始人瑞·达利欧,就美国银行业危机、美联储政策路径抉择及影响、通货膨胀原因等热点议题进行探讨。关于美国银行业危机,瑞·达利欧表示,重要的是要认识到这是一个普遍存在的问题,影响的不仅仅是银行业,这个问题目前影响了许多银行,因为许多银行购买了政府债券。但其实许多实体都购买了政府债券。而且,这里指的不仅仅是购买美国政府债券的美国实体,还有因为货币政策而购买欧洲债券的欧洲实体等。[2023/5/21 15:16:48]
如今的乐高就像玩具界的Supreme,时不时就弄出套联名款,即使你不是乐高粉丝,也忍不住赶紧送上钱包。
之前,乐高就和暴雪合作推出了《乐高守望先锋系列》。
《乐高星球大战系列》,至今全球已经热销超过两千万套。其中“豪华千年隼”,更是被称为“乐高史上最大套装”。
从DC的蝙蝠侠到漫威的钢铁侠,热门电影的热度“能蹭就蹭”。
如果你是《哈利波特》迷,等不到送入学通知书的猫头鹰?没关系,乐高让你直接把霍格沃茨买回家。
声音 | PoS之父Sunny King:我们需要的不仅仅是货币 而是一个支持各种区块链应用的经济体系:PoS之父Sunny King于今日在与CMC创始人Brandon Chez对话中提到,其支持加密货币与比特币进行整合的趋势。他表示:“我们需要的不仅仅是货币,而是需要一个能够支持各种区块链应用的经济体系,这也是我现在主导V SYSTEMS区块链的初衷。基础货币对于经济的健康繁荣确实至关重要,但也仅是这个经济体系中很小的一部分。比特币是最早出现的加密货币,在技术的世界,比特币的主导地位将不断受到挑战。比特币的设计中存在风险因素,可能会在未来十到二十年内显现,届时比特币的新的增量已经非常小了。因此作为基础加密货币,比特币可能无法长期占据主导地位,对于成千上万的其他加密货币,大家要对它们寄予希望。”[2019/11/12]
02、都是哪些人在玩乐高?
那么都是哪些人在玩乐高呢?我们用Python获取“乐高中国”最新的三条微博(5.06日、5.08日、5.15日发布)后的评论和粉丝信息,分析粉丝画像,数据共4815条。
粉丝性别占比
首先看到乐高中国的微博粉丝性别占比,从数据可以看到,女性粉丝远超男性,占比高达到65.23%,男性占比34.77%
粉丝数量地区分布
都是哪些地区的人最爱玩乐高呢?
从图中可以看到,北上广位居前三,海外的粉丝也不少,位居第四。之后就是江苏、山东分别为第五和第六。
声音 | BM:当你是一个受监管的个体时,你要遵守得不仅仅只是合规,你需要承担更多:据MEET.ONE 报道,BM在电报群里发表了他对合规的看法:在BM看来,合规确实保护了人们,人们利用合规的法律效力预防竞争和管控公司。但是当你是一个受管制的个体时,你不仅仅要遵守合规,你还必须遵守一般政策或承担许可证被撤销和关闭的风险。简而言之,你基本上不是真正地拥有自己的业务。[2019/6/15]
粉丝年龄分布
18-25岁的粉丝最多占比高达38.69%,其次就是25-30岁的了,占比为24.01%,30-40岁的占比19.97%。总体来说,乐高在国内的粉丝还是比较年轻化的,既有喜欢玩乐高的年轻玩家,也有热衷给孩子买乐高玩的年轻父母。
微博评论词云
下面我们看到“乐高中国”微博下面的评论词云,可以看到提到最多的就是"乐高"。同时"齐天大圣"、"忍者神龟"等都是被提及最多的热门款。
03、哪款乐高卖的最好?
下面我们用Python进一步分析乐高在天猫和淘宝全网的数据,我们共搜集整理了乐高在淘宝的商品数据,一共4404条商品信息。以及天猫乐高旗舰店一共392条的数据。
乐高销量TOP10店铺
首先看到淘宝全网乐高销量店铺的排名。不用说,乐高官方旗舰店是妥妥的第一位,其次天猫超市的位居第二。
不仅仅比特币 全球股市出现大跌:分析人士指出,尽管比特币也出现了市场不景气的情况,但传统股票市场在截至3月25日的5天内经历了自2016年1月以来最糟糕的时期。本月,BTC价格跌至6600美元,为自2017年11月以来的第二低水平,全球市场也出现了看跌迹象。市场观点指出,3月19日至23日,美国股市下跌6%,欧洲股市同期下跌4%,日本股市下跌5%。而在比特币(Bitcoin)的主导下,加密货币资产的持续下跌。比特币在其200日移动均线之下,跌破7500美元支撑位。[2018/3/30]
乐高产地排名TOP10
乐高产地方面,我们可以看到,广东和上海是大头,位居第一和第二。北京位居第三。
不同价格区间商品数量
乐高的定价如何呢?我们可以看到0-50元的乐高商品是最多的,达到895件。其次100-200元的也不少,以701件位居第二。1000元以上的资深玩家款最少,为260件。
不同价格区间的销售额
这里就比较有意思了,1000元以上的销售额占比达到32.24%,果然是人民币玩家的专选。其次500-1000元的商品销售额占比15.91%。紧接着较为平价的100-200元款,销售额占比15.76%。
淘宝乐高商品标题词云
中国最大的IT社区创始人蒋涛:币圈的作用不仅仅是炒币,它是一种新型的协作手段:CSDN创始人&董事长蒋涛近日表示:关于区块链的应用,从2015年开始,人们把比特币的这种区块链核心技术拿出来,希望从技术层面上去对各个行业的一些旧有机制创造一些新的应用,但是这些应用的进展并没有想象的那么快。前几年,基本上搞区块链技术的人,大部分属于链圈,他们关注区块链技术能不能实际在行业里边落地,能找到哪些场景落地。2017年出现了一个爆炸性的增长,使得我们需要重新去认知所谓币圈的作用也不仅仅是炒币,它是一种新型的协作手段,这是新的认知。未来5-10年,信息、物体之间彼此的沟通、确认、交易,将基于区块链的技术来进行确权。通证系统加强了系统的流通性,对于每个做出真正贡献的人,其价值将被更好的放大。[2018/1/29]
下面看到淘宝乐高相关标题的词云,"乐高"、"玩具"、"积木"都是提及最多的关键词。同时"益智"、"系列"、"正品"等词也是标题中常有的词。
我们再具体看看哪款乐高产品卖得最好。
乐高旗舰店商品销量TOP10
让我们再看到乐高旗舰店的数据:
我们可以看到,孙悟空齐天大圣黄金机甲这款,以月销量4765件位居榜首。
其次第二位是R赛车成人送礼收藏车模,月销量2750件。然后云霄战机孙悟空齐天大圣位居第三,月销量达到2453件。
不同价格区间商品数量
在商品价格区间方面,可以看到数量最多的还是0-50元的平价款,共2082件商品,远远高于其他价格区间。其次50-100元的商品有495件。
不同价格区间销售额
最后,我们再看到不同价格区间的销售额:
这里与淘宝全网数据不同,销售额占比最高的是0-50元的商品,占比49.21%。其次是50-100元,占比16.13%。而1000元以上的销售额占比最少,仅为2.94%。这也说明,在购买1000元以上的收藏款时,大家更倾向于在其他渠道购买,而不是官方旗舰店。
乐高旗舰店商品标题词云
我们再看看在乐高旗舰店,商品标题都有什么特点。可以看到标题中,"积木"、"玩具"、"XX系列"都被常常提到。同时"送礼"、"创意"、"益智"、"收藏"等也常出现。
04、带你用Python分析乐高淘宝数据
我们使用Python分别获取了淘宝上的乐高商品数据、乐高旗舰店的店铺商品销售数据和微博乐高中国的评论和粉丝数据,进行了数据分析分析。此处展示淘宝商品分析部分代码。按照常规数据分析流程进行:
01数据读入
首先导入所需的库,并读入采集的数据集。其中pandas用于数据整理、jieba用于分词、pyecharts和stylecloud用于绘制可视化图形。
Billions项目组读入数据df_tb=pd.read_excel('../data/乐高淘宝数据.xlsx')df_tb.head()
查看一下数据框的大小,可以看到一共有4403个样本。
df_tb.info()
<class'pandas.core.frame.DataFrame'>RangeIndex:4404entries,0to4403Datacolumns(total5columns):goods_name4404non-nullobjectshop_name4404non-nullobjectprice4404non-nullfloat64purchase_num4404non-nullobjectlocation4404non-nullobjectdtypes:float64(1),object(4)memoryusage:172.1+KB
02数据处理
此处我们对各个字段进行以下处理以方便后续的数据分析工作,经过去重之后一共有3411个样本:
去除重复值goods_name:暂不处理shop_name:暂不处理price:暂不处理purchase_num:提取人数计算销售额=price*purchase_numlocation:提取省份
Billions项目组删除购买人数为空的记录df_tb=df_tb.str.contains('人付款')]Billions项目组purchase_num处理df_tb=df_tb.str.extract('(\d+)').astype('int')Billions项目组locationdf_tb=df_tb.str.split('').strdf_tb.head()
03数据可视化
数据可视化部分主要对以下的信息进行汇总和可视化分析,分析维度和使用图形如下:
乐高销量排名top10店铺-条形图乐高产地数量排名top10-条形图乐高产地国内销量分布-地图价格分布-饼图不同价格区间的销量表现-饼图商品标题词云图-词云图
乐高销量排名Top10淘宝店铺-条形图
shop_top10=df_tb.groupby('shop_name').sum().sort_values(ascending=False).head(10)Billions项目组地图map1=Map(init_opts=opts.InitOpts(width='1350px',height='750px'))map1.add("",,maptype='china')map1.set_global_opts(title_opts=opts.TitleOpts(title='国内各产地乐高销量分布图'),visualmap_opts=opts.VisualMapOpts(max_=172277),)map1.render()
天猫乐高价格分布
Billions项目组饼图bar3=Bar(init_opts=opts.InitOpts(width='1350px',height='750px'))bar3.add_xaxis()bar3.add_yaxis('',)bar3.set_global_opts(title_opts=opts.TitleOpts(title='不同价格区间的商品数量'),visualmap_opts=opts.VisualMapOpts(max_=900))bar3.render()
不同价格区间的销售额整体表现
Billions项目组数据对data_pair=Billions项目组读入停用词表stop_words=Billions项目组添加关键词my_words=foriinmy_words:jieba.add_word(i)Billions项目组条件筛选word_num_selected=return''.join(word_num_selected)Billions项目组绘制词云图stylecloud.gen_stylecloud(text,Billions项目组电脑字体路径icon_name='fasfa-heart',Billions项目组绘图尺寸output_name='淘宝乐高标题词云图.png'#输出png文件)
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。