数据运营:深度揭秘SEO电商数据抓取技术pdf/doc/txt格式电子书下载
本站仅展示书籍部分内容
如有任何咨询
请加微信10090337咨询
书名:数据运营:深度揭秘SEO电商数据抓取技术pdf/doc/txt格式电子书下载
推荐语:无数据不运营,突破抓取封锁,洞悉竞争对手运营机密
作者:邢波涛,郭娟
出版社:电子工业出版社
出版时间:2015-09-01
书籍编号:30451409
ISBN:9787121271588
正文语种:中文
字数:65762
版次:1
所属分类:互联网+-电子商务
版权信息
书名:数据运营:深度揭秘SEO电商数据抓取技术
作者:邢波涛 郭娟
ISBN:9787121271588
版权所有 · 侵权必究
序
认识本书作者老邢很多年了,他是个无论在工作还是生活中都特别认真的人。在电商这个十分年轻的行业里,老邢是较早进入淘宝生态体系的技术人员,对淘宝的发展变化有着自己的理解和认识。经营过淘宝店铺的人都知道,数据对于电商来说极其重要,整个店铺运营策略都是围绕数据展开的。流量、转化、销量、DSR这些数据的变化都会影响下一步的推广策略,可以说“无数据不运营”。
马云说世界经济正迅速从IT走向DT(数据处理技术)时代,未来属于那些掌握数据的人。从人类技术文明的发展过程来看,技术总是从复杂向简单、从高端向普及演进。数据抓取及分析最初只是IBM、谷歌、百度这些大公司才有机会使用的技术,现在已经进入到普遍使用的阶段。
通常电商网站也会采取技术手段防止其他公司或个人以技术手段抓取数据(淘宝早在2008年就屏蔽了百度爬虫),本书作者有五年淘宝数据抓取实战经验,对网站数据抓取尤其是电商网站的数据抓取有深刻的认识。十分感谢作者在书中毫无保留地把淘宝数据抓取的经验进行了分享,促进行业交流。
作为一个资深技术人员,作者有深厚的技术背景,能够跳出技术人员固有的思维方式,从店铺运营的视角,通过图文并茂的形式,深入浅出地介绍淘宝页面上主要运营数据的抓取方式,十分难得。对于有心学习如何抓取淘宝数据的运营人员,本书可以让你零基础掌握如何抓取淘宝页面上丰富的运营数据;对于初入电商领域的技术人员,本书也可以帮助你快速掌握淘宝核心数据抓取方式,不必重复发明轮子。
淘宝页面上的数据信息极其丰富,本书涉及内容基本覆盖了其中最重要的搜索结果、宝贝信息、销量信息、DSR、无线端、直通车、评价等,详细讲解了每一个数据的抓取方式,读来有疱丁解牛之感。
淘宝网站本身在不断发展变化,本书在讲解案例的同时,意在让读者通过参与分析一个个具体数据抓取过程,了解其本质,淘宝页面万般变化,变化的仅是数据表现方式,离不开本质。对于一个小白读者来说,可以轻松地掌握淘宝数据抓取的关键点,稍加分析,即可根据自己的需要对书中没有涉及的数据内容进行抓取。
随着技术的进步与普及,会有越来越多的数据被保存下来,人们的行为习惯会越来越多地通过量化数据的方式被分析出来,数据产生的价值也会越来越大。
掩卷而思,从社交网络到移动互联网,再到线上线下结合(O2O),再到李克强总理提出的“互联网+”,整个人类社会近一百年创造的文明成果已远远超过过去历史的总和。数据时代的来临不可避免,希望本书可以帮助更多的人加深对数据的理解,感谢老邢为数据抓取技术普及所做的努力。
华北区淘宝最大代运营商之一洪海龙腾公司首席运营官(COO)
陈权国
前言
我1996年大学毕业到现在(2015年),工作19年了,一直从事的都是软件开发工作。在2011年,我出版了自己的第一本面向程序员的图书《B2B2C网上商城开发指南——基于SaaS和淘宝API开放平台》,今天我为什么想写一本面向电商运营的图书呢?
这其实与我最近5年的工作经历有关。从2011年开始的前三年(2011年至2013年),我一直都是在围绕淘宝的App后台做工具软件的开发,例如进销存软件和微博营销软件。不过,由于种种原因,这款进销存软件和微博营销软件虽然试用客户上万,却并没有带来能够支撑团队运作的资金。而到了2013年年末,我在师弟天津商业大学宝德学院高学争老师的影响下,开始研究基于淘宝、天猫的SEO优化工作一直至今。在这个过程当中,我发现了一个有趣的问题,那就是从事淘宝、天猫SEO优化的运营人员和淘宝、天猫店长们,他们对业务能力的把握是很到位的。也就是说,运营人员对如何针对淘宝、天猫SEO优化的奇门绝技是很熟悉的。但是运营人员也有个致命的缺陷,就是SEO优化技巧所依赖的数据支撑,他们是没有能力获得的,他们只知道优化理论和技巧,却无法获得相应的数据支撑和验证。例如,针对大类目下的淘宝C店SEO优化最常见的下架时间问题,大家都知道下架时间很关键,却对如何获得关键词综合排名前1页甚至前5页、前10页宝贝的下架时间的数据,无能为力,那么宝贝根据下架时间卡位也就无从谈起了。当然,目前市面上有的公司也出了一些可以批量采集这些数据的工具软件,运营人员可以利用这些工具软件来完成相应的工作,但是他们对这些软件背后获取数据的原理是一无所知的。这也是我写这本书的目的,深度揭秘淘宝、天猫SEO优化背后数据获取的秘密。所以,本书就是针对电商运营相关人员,告诉他们如何获取淘宝SEO优化所必需的运营数据,使得运营能够更好地跟自己的SEO优化绝技相结合,从而使自己从手动获取运营数据的海量工作中解放出来,做一些更有意义的事情。
我写这本书的第二个目的,是因为关于淘宝SEO优化技巧的图书,市面上也出了很多本,但是如何批量获取SEO优化技巧背后所需要的运营数据,却一本也没有。这是因为绝大部分运营人员都没有软件程序员的工作经历。而我有19年的一线软件开发经验,又深度投入到了淘宝SEO优化的工作当中去,所以对运营人员(即使是全国最顶级的运营)来讲,我是一个牛X的资深程序员,而针对我的程序员同事和其他程序员,我又是一个已经入门的淘宝SEO优化和运营“专家”。从这方面来讲,我也算是“魔”“道”双修的,用朋友的一句话来说就是:流氓会武术,谁也挡不住。其实,从软件研发的角度来讲,我的职责其实是一个业务架构师+系统架构师的角色。
话又说回来,针对电商SEO优化运营技巧,从技术上讲,我也算入门和“专家”(针对我的程序员同行来讲)了,但是对真正的一线运营高手来讲,我又是只懂皮毛的外行。所以,这本书并不适用于想获得淘宝、天猫运营技巧的运营人员,本书适用的是已经熟悉淘宝SEO优化技巧,又想深度了解如何获得SEO优化技巧背后数据秘密的运营人员。
在我写这本书的过程当中,淘宝本身也在“丧心病狂”地采取各类反爬虫技术手段,妄图防止别人从淘宝公开的网页上很容易地获取到这些公开数据。所以,很多运营人员也可以看到,以前很好用的一些工具软件,现在也不能用了。不过,有矛就有盾,敌人再任性,狐狸再狡猾,我们也是可以找到一些特定的解决方案的。所以,本书写作的过程,也是跟淘宝技术做斗争的过程,但愿这本书能给已经熟悉淘宝SEO优化技巧,又想深度了解如何获得SEO优化技巧背后数据秘密的运营人员带来帮助。
第1章 淘宝/天猫做SEO优化对数据的需求
· 天猫、淘宝数据抓取背景
· 天猫、淘宝运营数据抓取技术概述
1.1 天猫、淘宝数据抓取背景
在针对淘宝/天猫SEO优化的问题上,有两类截然不同的观点:一类观点认为淘宝SEO优化至关重要,商品好坏无所谓,再差的宝贝(淘宝对商品的称呼,以下如果无特殊说明,宝贝和商品表达的是同一个意思,根据习惯不同就混合使用了)也能卖出去,所以在淘宝发展历史上也出现了一些专门针对淘宝SEO深度优化,甚至利用淘宝搜索引擎的缺陷而进行SEO作弊,从而达到快速出货的神店;另一类观点认为电商的本质是商,商品(宝贝)的好坏才是本质,一味追求电商SEO优化技巧是不足取的。个人认为,这两类观点都太偏执了。
针对第一类观点,在淘宝发展某个阶段也许是适用的,但由于产品不行,这些店铺也很难持续发展,所以淘宝历史上出现的那些神店,也只能昙花一现;而针对第二类观点,除非你真的拥有自己的知名产品品牌,这些品牌拥有大量的忠实粉丝,例如化妆品中的雅诗兰黛、箱包中的路易威登(LV),那么只考虑产品是没有问题的。而现实中淘宝800万卖家(有的说700万,有的说900万,估计2015年已经过千万了)中有多少卖家真正拥有自己的知名品牌产品呢?没有自己的核心产品,就不要谈电商的本质是商,商品(宝贝)的好坏才是本质。这就跟“好好学习,天天向上”这八个字是巨正确无比一样,落地是非常难的,对绝大部分卖家来讲,是不可能完成的任务。
所以,在货源和产品质量相对稳定的基础上,研究淘宝/天猫SEO优化技巧还是有意义的。电商大号@吴蚊米也在自己的微博上说——
“还没有开工,有卖家来问2015年怎么做,一般这种探讨宇宙起源的大问题我是拒绝回答的。可他说到了一点,活动效果越来越差。确实!活动真没几个流量,看2014年几个大促就知道流量基本靠搜索和老客,搜索能爆发5~10倍,看你怎么节骨眼卡位,算7天权重、30天权重,老客全部在自主访问里增长……所以你懂了吧”。
针对绝大部分卖家来讲,“搜索”和“老顾客”就是2015年最核心的两个板块。搜索说的其实就是SEO优化,例如@吴蚊米在微博中提到的卡位(下架时间、价格等)、7天权重、30天权重(包括产品销量、DSR评分、关键词质量得分等)。而“老顾客”我这里也多说两句:非品牌店或者妖店以及重复购买率极高的类目,就不要再幻想老顾客了。品牌店就是拥有自己核心知名品牌的店铺(一般是指线下传统知名品牌在淘宝/天猫开店)。妖店其实也是以产品为核心,但不像线下传统知名品牌那样面向全网的顾客,而是只针对喜欢自家产品风格的特定的顾客,只满足少数人的需求,这类店做大的有例如裂帛,还有不少没有裂帛那么大,但是每年销售额也过亿的小品牌店。而对于重复购买率极高的类目,例如化妆品类目、干果类目,这类商品的重复购买率极高,所以无论如何都需要关注老顾客。而绝大部分类目和卖家,即使是女装这个占淘宝40%销量的类目,针对老顾客,传统的营销措施(例如发短信、老客户分级分类、建立所谓的RFM模型)都是没有任何意义的。对绝大部分店铺来讲,顾客只忠实于价格和淘宝,所谓老顾客是淘宝全网的老顾客,而绝不是自己店铺的老顾客。
当然,我也不是只指出问题,而不给解决思路的专家,抱怨和找问题谁都会,问题是找出这些问题后如何落地?针对老顾客,我有两个建议。
建议一是熟悉阿里妈妈的达摩盘[1]。阿里妈妈内部的直通车和钻展一直在黑盒化地使用数据,即通过算法和数据来帮助广告主去做一些精准的定向。这虽然解决了一大批中小商家的营销需求,但是对于一些定制化的营销需求却仍然很难满足,一些商家希望根据他们特定的营销需求去定制自己的投放人群。因此,由商家自定义组合标签、选择目标人群进行投放,成为了达摩盘这个工具型基础设施平台的基本功能。例如,我们可以通过达摩盘针对全网做具有某类标签的老客户(即针对淘宝的老客户,而不是针对自己的店铺)的广告投放。
第1章 淘宝/天猫做SEO优化对数据的需求
· 天猫、淘宝数据抓取背景
· 天猫、淘宝运营数据抓取技术概述
1.1 天猫、淘宝数据抓取背景
在针对淘宝/天猫SEO优化的问题上,有两类截然不同的观点:一类观点认为淘宝SEO优化至关重要,商品好坏无所谓,再差的宝贝(淘宝对商品的称呼,以下如果无特殊说明,宝贝和商品表达的是同一个意思,根据习惯不同就混合使用了)也能卖出去,所以在淘宝发展历史上也出现了一些专门针对淘宝SEO深度优化,甚至利用淘宝搜索引擎的缺陷而进行SEO作弊,从而达到快速出货的神店;另一类观点认为电商的本质是商,商品(宝贝)的好坏才是本质,一味追求电商SEO优化技巧是不足取的。个人认为,这两类观点都太偏执了。
针对第一类观点,在淘宝发展某个阶段也许是适用的,但由于产品不行,这些店铺也很难持续发展,所以淘宝历史上出现的那些神店,也只能昙花一现;而针对第二类观点,除非你真的拥有自己的知名产品品牌,这些品牌拥有大量的忠实粉丝,例如化妆品中的雅诗兰黛、箱包中的路易威登(LV),那么只考虑产品是没有问题的。而现实中淘宝800万卖家(有的说700万,有的说900万,估计2015年已经过千万了)中有多少卖家真正拥有自己的知名品牌产品呢?没有自己的核心产品,就不要谈电商的本质是商,商品(宝贝)的好坏才是本质。这就跟“好好学习,天天向上”这八个字是巨正确无比一样,落地是非常难的,对绝大部分卖家来讲,是不可能完成的任务。
所以,在货源和产品质量相对稳定的基础上,研究淘宝/天猫SEO优化技巧还是有意义的。电商大号@吴蚊米也在自己的微博上说——
“还没有开工,有卖家来问2015年怎么做,一般这种探讨宇宙起源的大问题我是拒绝回答的。可他说到了一点,活动效果越来越差。确实!活动真没几个流量,看2
....
本站仅展示书籍部分内容
如有任何咨询
请加微信10090337咨询