当前位置:
首页 > 计算机 > 数据库 > 实时数据处理和分析指南pdf/doc/txt格式电子书下载

实时数据处理和分析指南pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

实时数据处理和分析指南pdf/doc/txt格式电子书下载

书名:实时数据处理和分析指南pdf/doc/txt格式电子书下载

推荐语:新型冠状病毒之战,举国战“疫”,领袖情怀,众志成城。全景式呈现疫情防控人民战争、总体战、阻击战壮阔画卷,真实故事有力量,精彩瞬间不容错过。

作者:(印度)希尔皮·萨克塞纳,吴志国,曾凤姝等译

出版社:人民邮电出版社

出版时间:2020-05-01

书籍编号:30611557

ISBN:9787115524867

正文语种:中文

字数:228813

版次:1

所属分类:计算机-数据库

全书内容:

cover









版权声明


Copyright ©Packt Publishing 2018. First published in the English language under the title


Practical Real-time Data Processing and Analytics (9781787281202).


All rights reserved.


本书由英国Packt Publishing公司授权人民邮电出版社有限公司出版。未经出版者书面许可,对本书的任何部分不得以任何方式或任何手段复制和传播。


版权所有,侵权必究。



内容提要


本书主要介绍实时大数据计算领域的相关技巧和经验,包括Flink、Spark和Storm等流处理框架技术。全书从搭建开发环境开始,逐步实现流处理,循序渐进地引导读者学习如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。


本书内容分为6个部分,分别是“导言——熟悉实时分析”“搭建基础设施”“Storm实时计算”“使用Spark实现实时计算”“使用Flink实现实时分析”以及“综合应用”。


在阅读本书之前,读者应具备基本的Java和Scala编程基础,还应熟悉Maven、Java和Eclipse的安装和配置流程。



作者简介


希尔皮·萨克塞纳(Shilpi Saxena)是IT从业者,也是一位技术布道者。她是一名工程师,曾涉足多个领域(机器对机器空间、医疗保健、电信、人才招聘和制造业)。在企业解决方案的构思和执行的所有方面,她都有着丰富的经验。过去3年来,她一直在大数据领域从事设计、管理和提供解决方案的工作。她还负责管理一个分布在世界各地的精英工程师团队。


希尔皮在软件行业的产品和服务方面有超过12年(大数据领域3年)的开发和执行企业解决方案的经验。她曾担任过开发者、技术负责人、产品负责人、技术经理等职位,可以说在这个行业阅历颇丰。她通过AWS的自动扩展,设计并完成了一些在大数据领域中基于Storm和Impala的前沿的产品实现。


希尔皮参与编写了Real-time Analytics with Storm and Cassandra一书(Packt 出版社出版)。


沙鲁巴·古普塔(Saurabh Gupta)是一名软件工程师,已有数十年的IT行业从业经验,在大数据领域有超过3年的工作经验,目前从事处理和设计在生产中运行的实时和批处理项目的相关工作,主要包括Impala、Storm、NiFi、Kafka等技术以及在AWS上部署Docker,他还参与了各种物联网项目,涉及电信、医疗保健、智能城市、智能汽车等领域。



cp kafka_2.11-0.10.1.1.tgz/home/ubuntu/demo/kafkacd/home/ubuntu/demo/kafkatar-xvf kafka_2.11-0.10.1.1.tgz

前        言


本书给出了实时大数据计算领域的许多技巧和经验,介绍了Flink、Spark和Storm等流处理框架技术。本书还归纳了一些实用的技术,以帮助读者像使用Hadoop批处理一样的方式实时处理无界流数据。读者可以从如何搭建开发环境开始,逐步实现流处理,然后学会如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。通过学习本书的内容,读者可以对NRT的基本原理及应用有透彻的理解,并能掌握如何将这些基础知识应用到任何适用的实际问题当中。


本书采用“菜谱”(Cookbook)式的写作风格,辅以丰富的实际案例,包括注释清楚的代码示例、相应的图表等。



第一部分 导言——熟悉实时分析 本部分主要带领读者熟悉实时分析领域,了解它的基础组件和基于此构建的系统,包括如下几章:



  • 第1章 实时分析简介
  • 第2章 实时应用的基本组件

第二部分 搭建基础设施 本部分主要讲解如何由基础组件搭建基础设施,包括如下几章:



  • 第3章 了解和跟踪数据流
  • 第4章 安装和配置Strom
  • 第5章 配置Apache Spark和Flink

第三部分 Storm实时计算 本部分主要关注Strom的计算能力和它的各种特性,包括如下几章:



  • 第6章 集成Storm与数据源
  • 第7章 从Storm到Sink
  • 第8章 Storm Trident

第四部分 使用Spark实现实时计算 本部分主要关注Spark的计算能力和它的相关特性,包括如下几章:



  • 第9章 运用Spark引擎
  • 第10章 运用Spark操作
  • 第11章 Spark Streaming

第五部分 使用Flink实现实时分析 本部分主要关注Flink的计算能力和它的相关特性,包括如下一章:



  • 第12章 运用Apache Flink

第六部分 综合应用 本部分包括如下一章:



  • 第13章 用例研究


本书旨在引导读者逐步掌握实时流处理技术。在阅读本书之前,读者应具备基本的Java和Scala编程基础,还应熟悉Maven、Java和Eclipse的安装和配置流程,以便运行示例程序。



如果读者是Java开发人员,想要安装相关软件并设计一个端到端的实时数据流的实用解决方案,那么本书非常适合作为参考书。掌握实时处理的基本知识是很有帮助的,了解Maven、Shell和Eclipse的基本原理也对读者大有裨益。



在本书中,读者会发现许多文本样式,可以据此区分不同种类的信息。下面给出了这些样式的一些例子,并对它们的含义进行了解释。文本中的代码、数据库表名、文件夹名、文件扩展名、路径名、虚拟URL、用户输入和Twitter句柄表示为:“下载kafka_2.11-0.10.1.1.tgz文件后,提取文件。”


代码块设置如下:


新术语和重要单词以粗体显示。读者在截屏图中看到的单词(例如,在菜单或对话框中)在文本中表示为:“为了下载新模块,我们将转到Files | Settings | Project Name | Project Interpreter。”


警告或重要注释的形式如下。





实时数据处理和分析指南pdf/doc/txt格式电子书下载 


警告内容





提示和窍门的形式如下。





实时数据处理和分析指南pdf/doc/txt格式电子书下载 


提示内容






审稿人简介


鲁本·奥利瓦·拉莫斯(Ruben Oliva Ramos) 是莱昂技术学院的计算机系统工程师,他毕业于墨西哥瓜纳华托州莱昂市的Salle Bajio大学,拥有该校计算机和电子系统工程、远程信息学和网络专业的硕士学位。他在开发Web应用程序方面有5年以上的经验,擅长用Web框架和云服务来控制和监控与Arduino和Raspberry Pi连接的设备,进而构建物联网应用程序。


鲁本·奥利瓦·拉莫斯在墨西哥的Salle Bajio大学的机电一体化系任教,是机电一体化系统设计和工程硕士生导师。他还在墨西哥瓜纳华托州莱昂市的一家机构(Centro de Bachillerato Tecnologico Industrial 225)工作,负责教电子、机器人和控制、自动化和微控制器等课程。他也是一些监控系统和数据记录仪项目的顾问和开发人员——用编程技术(如Android、iOS、Windows Phone、HTML5、PHP、CSS、AJAX、JavaScript、Augular和ASP.NET)、数据库(如SQlite、MongoDB和MySQL)、Web服务器(如Node.js和IIS)以及硬件编程(如Arduino、Raspberry Pi、Ethernet Shield、GPS和GSM/GPRS、ESP8266)来实现数据采集和编程的控制和监控系统。


他撰写了Internet of Things Programming with JavaScript一书,该书由Packt出版社出版,并参与了用Arduino和Visual Basic .NET为Alfaomega监控、控制和获取数据的项目。


感谢在参与这个项目的过程中给予我帮助和理解的人们,他们是:我亲爱的妻子Mayte、我两个可爱的儿子Ruben和Dario、我亲爱的父亲Ruben和母亲Rosalia、我的弟弟Juan Tomas和妹妹Rosalia。在我审阅这本书的过程中,他们给了我很多的支持,让我能够追求自己的梦想,并容忍我在忙碌的一天工作后不能陪伴他们。


胡安·汤玛斯·奥利瓦·拉莫斯(Juan Tomás Oliva Ramos)是一名环境工程师,毕业于墨西哥瓜纳华托 大学,获得了工程和质量管理的硕士学位。他在专利管理和开发、技术创新项目以及通过控制过程的统计来开发技术解决方案领域有超过5年的经验。自2011年以来,他一直担任统计、创业和项目技术开发的教师。他还是企业家导师,并在Instituto Tecnologico Superior de Purisima del Rincon开设了一个新的技术管理和创业系。


胡安是Alfaomega的审稿人,曾参与了Wearable designs for Smart watches, Smart TVs and Android mobile devices一书的工作。他还通过编程和自动化技术开发了用于改进操作的原型(这些原型已经注册了专利)。


感谢Packt让我有机会审校这本令人惊叹的书,并能有幸与一群敢于担当的人合作。


还要感谢我美丽的妻子Brenda、我的两个女儿Regina和Renata以及我们家的新成员Angel Tadeo——感谢你们给了我力量,让我幸福和快乐地度过人生中的每一天。谢谢你们成为我的家人。


普拉蒂克·巴蒂(Prateek Bhati)毕业于印度最为知名的私立大学——阿米提大学。他目前居住在新德里,就职于Accenture公司,已有4年的实时数据处理经验。



资源与支持


本书由异步社区出品,社区(https://www.epubit.com/)为您提供相关资源和后续服务。



本书为读者提供示例源代码。读者可登录异步社区本书页面进行下载。



作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎读者将发现的问题反馈给我们,帮助我们提升图书的质量。


读者如果发现错误,请登录异步社区,按书名搜索,进入本书页面,单击“提交勘误”,输入勘误信息,单击“提交”按钮即可。本书的作者和编辑就读者提出的勘误进行审核,确认并接受后,将赠予读者异步社区的100积分(积分可用于在异步社区兑换优惠券、样书或奖品)。


实时数据处理和分析指南pdf/doc/txt格式电子书下载



我们的联系邮箱是contact@epubit.com.cn。


如果读者对本书有任何疑问或建议,请发邮件给我们,并在邮件标题中注明本书书名,以便我们更高效地做出反馈。


如果读者有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区在线提交投稿(直接访问www.epubit.com/selfpublish/submission即可)。


如果读者来自学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。


如果读者在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请将怀疑有侵权行为的链接发邮件给我们。这既是对作者权益的保护,也是我们提供高品质内容的动力之源。



“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT技术图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT技术图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www.epubit.com。


“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社近30年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的Logo。异步图书的出版领域包括软件开发、大数据、

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示