前言
这几天,为了给我的网站(http://price.monitor4all.cn/) 提供数据,我爬取了京东手机数码类产品的大部分自营商品以及部分非自营商品数据,总共11162条。——2018.3.8
包括如下类别:(运营商类除外)
其中,
自营商品:4616条。
非自营商品:6546条。
数据分析
今天,让我们先来看看人们(我)最为关心的手机类别吧!
在排除了非自营手机和合约机后,我们得到了129部京东自营手机的产品信息:
接下来是一些数据:
在129部手机中,只有4个手机有PLUS会员价格,他们是:
根据店铺将手机分类,得到如下手机所属店铺条形图:
前三名分别是:华为小米三星。如果算上华为旗下荣耀系列,那么华为的产品线实属庞大。值得注意的是,魅族在产品数量上排名第四,超过了vivo和oppo。
价格区间分布:
可以看出,目前最热门的手机价格区间是1100-1600这个区间段,有29部之多。
当价格来到3500以上时,手机的数量大幅度下降,大概只有几个品牌才能在这个价格区间拥有竞争力。
总体来看,600-2000元这个价位的竞争相当激烈。
各品牌手机累计销量:
京东的累计销量是否将全部历史数据都统计在内我们不得而知,当该图依然具有很大参考价值。
小米凭借惊人的557w勇夺销量冠军。而这两年有上升势头的锤子手机也取得了很好的成绩,位列小米苹果之后。
oppo/vivo蓝绿大厂在电商的销量显然不占据优势,但是架不住人家实体店多呀。
接下来,让我们看看商品名称词云:
我们将所有自营手机的商品名称使用python的jieba库进行分词,用wordcloud进行词云绘制,并经过一系列排重和优化后,得到了下图。
词云给我们带来的信息还是很多的,并且十分有趣。
电信移动联通三大关键词,几乎每个手机的名称里都包含。
可以看出很多热词,例如:全网通/4GB/64GB/双卡。(把这些组合起来,就是一部标配手机啊哈哈)
我一直以为会有很多‘全面屏’相关的关键词,现在看来这种趋势还没有显现。
商品副标题词云
我们再将商品的副标题单独拿出来看看,副标题一般会包含一些促销信息。
可以看出,很多副标题都会卖力的介绍手机的特点,比如快充,尺寸,配置,摄像头像素等。当然,也少不了优惠信息,那个大大的100可是画在那呢。
后记
今天就先这么多,如果小伙伴们有什么好的想法,或者想要看到什么样的数据信息,都可以在下方留言讨论。
当然,我也欢迎你们与我交流爬虫与数据相关技术。
本文京东爬虫项目地址:https://github.com/qqxx6661/Price-monitor(求Star)
我做了一个京东商品监控网站:https://pricemonitor.online/
纯粹兴趣,完全免费。
功能为:
- 用户设置商品监控:自定义提醒价格,价格低于预期收到提醒邮件。
- 品类商品监控:监控整个品类商品价格,一但某些低于指定折扣,收到商品信息提醒邮件。
咱们有缘再见。
转载请注明本文地址!