当前位置:
首页 > 计算机 > 程序设计 > R语言经典实例(原书第2版)pdf/doc/txt格式电子书下载

R语言经典实例(原书第2版)pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

R语言经典实例(原书第2版)pdf/doc/txt格式电子书下载

书名:R语言经典实例(原书第2版)pdf/doc/txt格式电子书下载

推荐语:

作者:(美)J.D.隆,(美)保罗·蒂特,李洪成,潘文捷等译

出版社:机械工业出版社

出版时间:2020-05-01

书籍编号:30624426

ISBN:9787111656814

正文语种:中文

字数:500854

版次:1

所属分类:计算机-程序设计

全书内容:

R语言经典实例(原书第2版)pdf/doc/txt格式电子书下载

O’Reilly精品图书系列


R语言经典实例(原书第2版)


R Cookbook:Proven Recipes for Data Analysis,Statistics,and Graphics,Second Edition


(美)J.D.隆(J.D.Long) (美)保罗·蒂特(Paul Teetor) 著


李洪成 潘文捷 译


ISBN:978-7-111-65681-4



版权所有,侵权必究


客服热线:+ 86-10-68995265


客服信箱:service@bbbvip.com


官方网址:www.hzmedia.com.cn


新浪微博 @华章数媒


微信公众号 华章电子书(微信号:hzebook)

O’Reilly Media,Inc.介绍


O’Reilly以“分享创新知识、改变世界”为己任。40多年来我们一直向企业、个人提供成功所必需之技能及思想,激励他们创新并做得更好。


O’Reilly业务的核心是独特的专家及创新者网络,众多专家及创新者通过我们分享知识。我们的在线学习(Online Learning)平台提供独家的直播培训、图书及视频,使客户更容易获取业务成功所需的专业知识。几十年来O’Reilly图书一直被视为学习开创未来之技术的权威资料。我们每年举办的诸多会议是活跃的技术聚会场所,来自各领域的专业人士在此建立联系,讨论最佳实践并发现可能影响技术行业未来的新趋势。


我们的客户渴望做出推动世界前进的创新之举,我们希望能助他们一臂之力。


业界评论


“O’Reilly Radar博客有口皆碑。”


——Wired


“O’Reilly凭借一系列非凡想法(真希望当初我也想到了)建立了数百万美元的业务。”


——Business 2.0


“O’Reilly Conference是聚集关键思想领袖的绝对典范。”


——CRN


“一本O’Reilly的书就代表一个有用、有前途、需要学习的主题。”


——Irish Times


“Tim是位特立独行的商人,他不光放眼于最长远、最广阔的领域,并且切实地按照Yogi Berra的建议去做了:‘如果你在路上遇到岔路口,那就走小路。’回顾过去,Tim似乎每一次都选择了小路,而且有几次都是一闪即逝的机会,尽管大路也不错。”


——Linux Journal

译者序


本书的英文版自2011年出版第1版后在亚马逊美国网站上得到了极高的评价。机械工业出版社以极快的速度引进这本书,使国内读者在原版出版一年左右的时间里读到中文版。时隔8年,本书的第2版又与读者见面了。


根据R语言的最新进展,在第1版的基础上,第2版进行了大量的改进,很多方法改进为应用管道(pipe),并用较大篇幅介绍流行的R添加包之一——tidyverse。同时,在新版本中增添了两章内容,即第15章和第16章。


本书对从R软件的基础知识到高级技巧的应用进行了全覆盖,涉及R软件的安装、帮助系统、解决实际问题的途径、R数据结构、R的输入和输出等R基础知识,以及用R进行数据分析的具体方法,例如数据变换、概率和统计基础、R绘图、回归分析和方差分析、R常用技巧、高级数据分析方法和时间序列分析等,还有R语言的编程和文档(R Markdown)的生成。全书以问题、解决方案和对解决方案的讨论与拓展为主线来组织内容。读者既可以把本书作为学习R的一本教材,也可以根据自己的需要参考书中的某些具体方法(每一节为一个方法),找到自己问题的实际解决方案。


R本身是当前流行的数据分析软件,R的书籍和文档也是相当多的,但是缺乏一本适合R初学者的书籍,尤其是针对那些对R不甚精通但是急切需要用R来解决问题的R用户的书籍。本书以问题和解决方案的形式组织内容,脉络清晰,读者很容易找到自己需要的内容。不管是R初学者,还是熟练的R用户都能轻易从书中找到对自己有用的内容。


本书的翻译工作由李洪成和潘文捷共同完成,由于水平所限,可能会有翻译不当之处,希望读者多加指正。

前言


R软件是进行统计分析、绘图和统计编程的强大工具。现在成千上万的人用它来进行日常的重要统计分析。R是一个自由、开源的软件系统,它是许多聪明、勤奋工作的人的集体工作成果。R有超过10000个软件包插件,是其他商业统计软件包的强劲竞争对手。


但是,刚开始使用R软件时可能感到无从下手。对许多人来说,即便是一些基本的任务,R的实现也不是很明显。当了解了R的使用方法后,简单的问题自然能得心应手地解决,但学习“如何”使用R的过程有时会让人感到发狂。


本书介绍了如何使用R软件的一些方法,其中每一个方法对应解决某个特定的问题。介绍这些方法的途径为:首先给出待解决的问题,然后给出解决方案的简单介绍,之后再给出对解决方案的讨论,深入剖析解决方案,给出该方案的原理。我们知道这些方法实用,也知道这些方法可行,因为我们也在使用它们。


这些方法所涉及的范围较为广泛。首先,从基本的任务开始介绍,然后介绍数据的输入和输出、基本统计、图形以及线性回归。与R有关的工作都或多或少地涉及本书介绍的方法。


通过学习本书,初学者能快速了解R并上手。如果你对R软件有一定的了解,那么本书也能帮助你巩固已学的知识,拓宽你的思维(例如,“下一次我应该怎么使用Kolmogorov-Smirnov检验”)。


从严格意义上来说,本书并不是一本关于R软件的教程,但你将会从中学习到许多R软件的应用技巧。本书也不是一本关于R的参考手册,但它确实包含了许多实用的内容。本书更不是一个R软件的编程指南,但书中很多方法都可以应用到R的编程脚本中。


最后,本书不是统计学理论的参考书。本书假设读者对统计理论和方法有一定的了解,想知道的是如何在R软件中实现。


方法


本书介绍的大部分方法,都是由一两个R函数或命令来解决某一特定问题。需要注意的是,书中不会对某一函数的全部能力进行详细解释,而是仅介绍那些与需要解决的问题有关的函数能力。R软件中几乎所有的函数所具备的能力都远远不止本书中所介绍的,其中有的函数具有更强大的能力。因此强烈建议读者阅读这些函数的帮助页面,你可能会从中得到不少收获。


每个方法都为读者提供了解决某个问题的一条途径。当然对于每个问题有可能存在多个正确的解决方案。在这种情况下,我们一般会选择最为简单的方法。对于书中给出的任何问题,你自己或许可以找到其他一些解决方案。本书着重介绍解决问题的方法,类似“菜谱”书,而不是R软件的大全书。


尤其是,R软件有大量的添加包,这几千个R添加包都可以从网络下载。这些包中含有许多替代算法和统计方法。本书侧重于R基础发布版所带的核心功能,以及几个重要的放在一起统称为tidyverse的添加包。


tidyverse最简洁的定义来自Hadley Wickham——tidyverse的创始人和它的核心维护者之一:


“tidyverse是一组协调工作的添加包,它们共享通用数据表达式和API设计。tidyverse包旨在使其易于通过单个命令安装和加载核心包。了解tidyverse中的所有添加包以及它们如何组合在一起的最佳方式是阅读R for Data Science(http://r4ds.had.co.nz)一书。”


对术语的说明


每个方法旨在迅速地解决问题,而非长篇大论地进行论述。因此我们有时候会采用一些术语来简化相关内容的解释,这些术语有时候可能不精确,但是正确的。比如,术语泛型函数。我们把函数print(x)和plot(x)称为泛型函数,原因是它们能适当地处理多种输入参数x。计算机科学家可能会质疑这一术语,因为严格来说这些都不是简单的“函数”,它们是多态方法并且动态调度。但是,如果我们仔细地精确定义所有这样的技术细节,那么关键的解决方案将会埋没于这些细枝末节的技术问题中。所以为了便于阅读,我们就将它们称为函数。


另一个例子是统计学中的假设检验术语。若使用概率论的严格定义,就会使读者难以清晰理解这些检验的实际应用,所以我们以更通俗的语言来描述各个统计检验。更多有关假设检验方法的细节,请查看第9章的简介部分。


我们的目标是用通俗易懂而非严格的正式语言,让R软件能被更多的读者所理解和接受。因此希望各个领域的专家对于我们所给出的某些并不严谨的术语与定义予以谅解。


软件及平台说明


虽然R软件时常进行有计划的版本更新,但其语言定义和核心实现是稳定的。本书所介绍的方法适用于基础发布版的任何最新版本。


有些方法对于操作平台有特殊的要求,我们会在文中对其加以标注,这些方法大多数是一些软件本身的问题,如程序的安装和配置。据我们所知,书中的所有其他方法在R的三个主要平台(即Windows、macOS和Linux/Unix)上都能运行。


其他资源


如果你想进行更深入的阅读,下面是一些进一步阅读的建议。


网络


R项目网站(http://www.r-project.org)汇集了所有R软件的相关资源,从中可以下载R程序代码、R添加包、文档、源代码等。


除了R项目网站以外,我们建议使用一个针对R软件的搜索引擎,比如Sasha Goodman开发的RSeek搜索引擎(http://rseek.org),也可以使用谷歌这样的通用搜索引擎,但在搜索“R”关键词时可能会得到许多无关的搜索结果。更多有关网络搜索的细节参见1.11节。


浏览博客也是一种学习R软件和掌握R最新动态的有效方式。网络中有许多这样的博客,我们推荐其中两个:Tal Galili创建的R-bloggers(http://www.r-bloggers.com/)和PlanetR(http://planetr.stderr.org)。通过订阅这些网站,你可以得到许多相关网站上有趣且实用的文章的通知。


R软件参考书籍


市面上有许多学习和应用R软件的书籍。下面列出一些我们认为有用的R软件教程。R项目网站收录了大量与R相关的书目(http://www.r-project.org/doc/bib/R-books.html)。


我们所推荐的书目有:


Hadley Wickham和Garrett Grolemund所著的R for Data Science(http://oreil.ly/2IIWxCs)(O’Reilly),该书很好地介绍了tidyverse软件包,特别是在数据分析和统计中对该添加包的使用。该书也可以在线获得(http://r4ds.had.co.nz)。


由Winston Chang撰写的R Graphics Cookbook,2nd ed.(https://oreil.ly/2IhNUQj)(O’Reilly)对于创建图形是不可或缺的。Hadley Wickham撰写的ggplot2:Elegant Graphics for Data Analysis(Springer),是我们在本书中使用的ggplot2的权威参考。


在R中做任何图形工作的人都需要参考Paul Murrell所著的R Graphics(Chapman&Hall/CRC)。


O’Reilly公司出版的R in a Nutshell(https://oreil.ly/2wUtwyf)的作者是Joseph Adler,该书可以作为读者手边的R软件的使用参考,它比本书涵盖了更多的内容。


有关R编程的新书层出不穷。我们推荐Garrett Grolemund的Hands On Programming with R(https://oreil.ly/2wWPHUd)(O’Reilly)或者Normal Matloff的The Art of R Programming(No Starch Press)。Hadley Wickham所著的Advanced R(Chapman & Hall/CRC)既有印刷版的,也可以免费在线获得(http://adv-r.had.co.nz/),该书深入研究了高级R主题。Colin Gillespie和Robin Lovelace所著的Efficient R Programming(https://oreil.ly/2wXxK80)(O’Reilly)是另一本学习

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示