当前位置:
首页 > 互联网+ > 大数据 > 一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载

一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载

书名:一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载

推荐语:大数据时代的大数据决策与应用!

作者:董超,卢桂林,胡青善

出版社:化学工业出版社

出版时间:2017-08-01

书籍编号:30399831

ISBN:9787122297266

正文语种:中文

字数:135877

版次:1

所属分类:互联网+-大数据

全书内容:

cover



前言


“大数据”成为近几年的热词。在互联网时代,数据本身就是资产,而大数据则意味着这些资产正在变得庞大无比,在现实生活中,善于运用大数据的企业已经从数据中获得了丰厚的回报。


2016年3月17日,中华人民共和国国民经济和社会发展“十三五”规划纲要发布。“十三五”规划纲要中指出:“实施国家大数据战略,把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。”


工信部解读大数据产业发展“十三五”规划,推动大数据产业持续健康发展,是党中央、国务院作出的重大战略部署,是实施国家大数据战略、实现我国从数据大国向数据强国转变的重要举措。2017年1月17日,工业和信息化部正式印发了《大数据产业发展规划(2016~2020年)》,全面部署“十三五”时期大数据产业发展工作,加快建设数据强国,为实现制造强国和网络强国提供强大的产业支撑。


目前,大数据已经渗透到了全世界市场中的各个领域,并逐渐成为重要的组成因素,对海量数据的运用将提升人们对市场以及未来走向的预知和把控。“让数据产生价值”,随着企业对大数据越来越重视,这个声音也正在变成企业的口号。


大数据的战略意义,一方面在于掌握庞大的数据信息;另一方面在于大数据与产业的结合,对海量数据进行专业化处理,实现数据的“增值”和应用的“价值”。但是中国的企业在信息技术发展上尚处于新的起跑线上,如何充分挖掘利用大数据资源,是企业当前面临的重大课题。


基于此,编者根据多年的经验,通过浅显易懂的方式编写了《一本书搞懂企业大数据应用》一书,把高深莫测的企业大数据知识普及给读者,供大家参考,以便起到抛砖引玉的作用。


《一本书搞懂企业大数据应用》主要包括企业大数据、医疗大数据、农业大数据、汽车行业大数据、工业大数据、服饰行业大数据、政策大数据、园区大数据、民非大数据、律师行业大数据、财税大数据、跨境贸易大数据、知识产权大数据、人才大数据、教育大数据以及金融大数据的行业知识介绍和如何落地等内容。


《一本书搞懂企业大数据应用》由安德互联数据服务有限公司总裁、资深架构师、大数据分析师董超以及安德互联数据服务有限公司副总裁、资深数据分析师、前贵阳大数据交易所会员部总监卢桂林联合编写,在编写过程中,傅冬晓、周翔、付东、赵春强、周鹏、骆相松、王浩鹏、朱祚缤、刘诚、罗星宇、史建湘、马静怡、叶坚镇、许泽香、王彦井、杨启江、程昭斌、杨妮、刘艳、蒋情焰、卫伟、李维正、李军、李辉、张海雷、陈超、孙小平、匡仲潇及冯永华参与了本书的编写工作,阿里巴巴高级技术专家崔亮、小米科技广告部资深研发工程师冀康、58赶集集团商业技术部高级技术经理邓柱中参与了本书的审定工作,全书由胡青善审核完成。在此,对他们一并表示感谢!


本书中部分图片与文字内容引自互联网媒体,其中有些未能一一与原作者取得联系,请您看到本书后及时与编者联系。


由于编者水平有限,书中不足之处在所难免,希望广大读者批评指正。


编者  

前言


“大数据”成为近几年的热词。在互联网时代,数据本身就是资产,而大数据则意味着这些资产正在变得庞大无比,在现实生活中,善于运用大数据的企业已经从数据中获得了丰厚的回报。


2016年3月17日,中华人民共和国国民经济和社会发展“十三五”规划纲要发布。“十三五”规划纲要中指出:“实施国家大数据战略,把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。”


工信部解读大数据产业发展“十三五”规划,推动大数据产业持续健康发展,是党中央、国务院作出的重大战略部署,是实施国家大数据战略、实现我国从数据大国向数据强国转变的重要举措。2017年1月17日,工业和信息化部正式印发了《大数据产业发展规划(2016~2020年)》,全面部署“十三五”时期大数据产业发展工作,加快建设数据强国,为实现制造强国和网络强国提供强大的产业支撑。


目前,大数据已经渗透到了全世界市场中的各个领域,并逐渐成为重要的组成因素,对海量数据的运用将提升人们对市场以及未来走向的预知和把控。“让数据产生价值”,随着企业对大数据越来越重视,这个声音也正在变成企业的口号。


大数据的战略意义,一方面在于掌握庞大的数据信息;另一方面在于大数据与产业的结合,对海量数据进行专业化处理,实现数据的“增值”和应用的“价值”。但是中国的企业在信息技术发展上尚处于新的起跑线上,如何充分挖掘利用大数据资源,是企业当前面临的重大课题。


基于此,编者根据多年的经验,通过浅显易懂的方式编写了《一本书搞懂企业大数据应用》一书,把高深莫测的企业大数据知识普及给读者,供大家参考,以便起到抛砖引玉的作用。


《一本书搞懂企业大数据应用》主要包括企业大数据、医疗大数据、农业大数据、汽车行业大数据、工业大数据、服饰行业大数据、政策大数据、园区大数据、民非大数据、律师行业大数据、财税大数据、跨境贸易大数据、知识产权大数据、人才大数据、教育大数据以及金融大数据的行业知识介绍和如何落地等内容。


《一本书搞懂企业大数据应用》由安德互联数据服务有限公司总裁、资深架构师、大数据分析师董超以及安德互联数据服务有限公司副总裁、资深数据分析师、前贵阳大数据交易所会员部总监卢桂林联合编写,在编写过程中,傅冬晓、周翔、付东、赵春强、周鹏、骆相松、王浩鹏、朱祚缤、刘诚、罗星宇、史建湘、马静怡、叶坚镇、许泽香、王彦井、杨启江、程昭斌、杨妮、刘艳、蒋情焰、卫伟、李维正、李军、李辉、张海雷、陈超、孙小平、匡仲潇及冯永华参与了本书的编写工作,阿里巴巴高级技术专家崔亮、小米科技广告部资深研发工程师冀康、58赶集集团商业技术部高级技术经理邓柱中参与了本书的审定工作,全书由胡青善审核完成。在此,对他们一并表示感谢!


本书中部分图片与文字内容引自互联网媒体,其中有些未能一一与原作者取得联系,请您看到本书后及时与编者联系。


由于编者水平有限,书中不足之处在所难免,希望广大读者批评指正。


编者  

第一节 大数据的认识


一、大数据的概念


国务院2015年8月31日印发的《促进大数据发展行动纲要》这样定义大数据:是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。具体如下图所示。


一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载


大数据的概念

二、大数据的基本特征


“大”是大数据的一个重要特征,但远远不是全部。麦肯锡全球研究所认为,大数据具有下图所示的“4V”特征。


一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载


大数据的特征


1.规模性


在互联网及移动互联网飞速发展的时代,从计算机端到移动端,再到云端,每天都在产生着大量的数据,这些数据都潜藏着它的价值,数据资产的体量大也是大数据的首要特点,所以才被称作“大数据”。


实质上,在某种程度上来说,数据的数量级的大小并不重要,重要的是数据具有完整性。数据规模性的应用有如下的体现。


比如,对每天12 tb的推特(Twitter)进行分析,了解人们的心理状态,可以用于情感性产品的研究和开发;基于脸书(Facebook)上成千上万条信息的分析,可以帮助人们处理现实中的朋友圈的利益关系。


2.多样性


多样性指有多种途径来源的关系型和非关系型数据。这也意味着要在海量、种类繁多的数据间发现其内在关联。互联网时代,各种设备通过网络连成了一个整体。进入以互动为特征的Web 2.0时代,个人计算机用户不仅可以通过网络获取信息,还成为了信息的制造者和传播者。


这个阶段,不仅是数据量开始了爆炸式增长,数据种类也开始变得繁多。除了简单的文本分析外,还可以对传感器数据、音频、视频、日志文件、点击量以及其他任何可用的信息进行分析。


比如,在客户数据库中不仅要关注名称和地址,还包括客户所从事的职业、兴趣爱好、社会关系等。利用大数据多样性的原理就是:保留一切你需要的对你有用的信息,舍弃那些你不需要的信息;发现那些有关联的数据,加以收集、分析、加工,使其变为可用的信息。


3.高速性


高速性主要表现为数据流和大数据的移动性。现实中则体现在对数据的实时性需求上。随着移动网络的发展,人们对数据的实时应用需求更加普遍,如通过手持终端设备关注天气、交通、物流等信息。高速性要求具有时间敏感性和决策性的分析——能在第一时间抓住重要事件发生的信息,如当有大量的数据输入时(需要排除一些无用的数据)或者需要马上做出决定的情况。


比如,一天之内需要审查500万起潜在的贸易欺诈案件;需要分析5亿条实时呼叫的详细记录,以预测客户的流失率。


4.价值性


价值性体现出的是大数据运用的真实意义所在。其价值具有稀缺性、不确定性和多样性。当数据量呈指数增长的同时,隐藏在海量数据中的有用信息却没有相应比例增长;相反,价值密度的高低常常与数据总量的大小成反比,这样反而使我们获取有用信息的难度加大。


以视频为例,一小时的视频,在不间断的监控过程中,可能有用的数据仅仅只有一两秒。

三、大数据的处理流程


在科技发展的同时,各种各样的行业和领域也在蓬勃发展,大量而又多样的数据渗透进了这些领域,又相应地产生了更多的数据。如今,已然是一个大数据横行的天下,数据已成为非常重要的生产因素。


大数据的整个处理流程可以概括为下图所示的四步。


一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载


大数据的处理流程


1.大数据的采集


大数据的采集需要有庞大的数据库的支撑,有的时候也会利用多个数据库同时进行大数据的采集,现在很多商家如一些购物网站都会通过关系数据库来存储事务数据,对于一些用户使用量或者访问量比较多的网站,事务数据的数据量惊人。


在大数据的采集过程中,因为这些网站的访问以及操作还在继续,对于大数据的采集中会有并发的访问量,对于数据库的负载以及多个数据库之间进行切换等都存在挑战,也是很多数据库系统需要考虑的设计因素。


2.大数据的预处理


将各个分散的数据库采集来的数据全部导入一个大的数据库,这样才能对数据进行集中的处理,也可以依据一些数据的特征或者需要进行大数据的分析,初步对各种数据进行粗选,这就是大数据的预处理。当然,因为数据量比较大,各个采集端的数据流入分析数据库中,也要考虑大数据库的容量。


3.大数据的统计


对已经汇总的数据进行分析并进行分类,这是大数据分析的过程,主要根据数据的特点进行筛选,可以利用一些大数据分析的工具,例如Infobright列式存储工具,对数据进行不同的分类之后,为下一步的批处理做准备。


大数据的统计过程中,由于涉及的数据量大,因此对于统计工具的使用以及需要分类的关键字等要求比较高,能不能让数据都精确地归类到相应的批次,这也是之后进行数据挖掘价值准不准确的基础。


4.大数据的挖掘


大数据的挖掘是指对之前已经做好统计的大数据基于不同的需求,利用数据挖掘算法进行挖掘。数据挖掘的算法都比较复杂,这也是考验人工的智能发展的一个环节,只有精确合适的算法才能得出有价值的数据分析结果,大数据的挖掘的过程中涉及的数据量和计算量也是庞大并且复杂的。

微看点


一个大数据的普遍的流程就是以上的四个,这个过程要涉及庞大的数据以及使用到不同的数据分析工具,是一个复杂的工作流程。

四、大数据的价值体现


巨量数据正在成为一种资源,一种生产要素,渗透至各个领域,而拥有大数据能力,即善于聚合信息并有效利用数据,将会带来层出不穷的创新。人们对于海量数据的运用,将预示着新一波生产率增长和消费者盈余浪潮的到来,具体如下图所示。


一本书稿懂企业大数据应用pdf/doc/txt格式电子书下载


大数据的价值体现


1.对于政府来说,大数据是提升效能的新手段


大数据可提高政府效率,也可有效监督政府的权力。有了大数据的支持,政府管理工作将会更高效、精准、科学,并能有效约束公职人员、监督公共资源的使用。国务院办公厅2015年7月发布的《关于运用大数据加强对市场主体服务和监管的若干意见》指出,大数据“有利于政府充分获取和运用信息,更加准确地了解市场主体需求,提高服务和监管的针对性、有效性”。


比如,国家工商总局与百度合作,开展大数据监管,打击假冒伪劣商品。北京市工商局联手互联网公司,把大数据运用到对电商的监管,利用搜索引擎和大

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示