R语言统计分析与应用pdf/doc/txt格式电子书下载
本站仅展示书籍部分内容
如有任何咨询
请加微信10090337咨询
书名:R语言统计分析与应用pdf/doc/txt格式电子书下载
推荐语:
作者:汪海波,罗莉,汪海玲等编
出版社:人民邮电出版社
出版时间:2018-04-01
书籍编号:30611558
ISBN:9787115469823
正文语种:中文
字数:565767
版次:1
所属分类:计算机-程序设计
版权信息
书名:R语言统计分析与应用
编者:汪海波 罗莉 汪海玲
出版社:人民邮电出版社
出版时间:2018-04-01
ISBN:9787115469823
免责声明:本站所有资源收集整理于网络,版权归原作者所有。
本站所有内容不得用于商业用途。本站发布的内容若侵犯到您的权益,请联系站长删除,我们将及时处理!
内容提要
R统计软件是目前应用最广泛的统计软件之一,已广泛应用于医学、财经和社会科学等领域中进行数据管理和数据分析处理。本书以Windows操作系统下的R软件为基础,以实践中常用的统计分析方法为基本内容,介绍了R语言的编写以及结果解释。本书重点介绍了各种多元统计分析方法的基本原理及其应用,包括方差分析、多元线性回归、Logistic回归分析、生存分析、主成分分析、因子分析、聚类分析、判别分析以及典型相关分析等。每一章详细讨论了统计分析方法的基本原理和分析过程,介绍了R语言的使用方法及应用实例说明、结果解释及结论分析等。
本书可以作为数据分析和数据管理人员的参考用书,也可以作为高等院校相关专业的教材。
前 言
R是世界领先的信息系统,是一个大型规模化的集成应用软件,具有完备的数据存取、管理、分析和显示的功能。R统计分析软件使用灵活方便、功能齐全,R语言编程能力强且简单易学,其数据处理和统计分析融为一体,已被广泛应用于医学、财经和社会科学等领域中。R是一个开源项目,在很多操作系统上都可以免费使用,包括Windows、Mac OS X和Linux。R还在持续发展中,每天都在纳入新的功能。R已经成了统计、预测分析和数据可视化的全球通用语言。它提供各种用于分析和理解数据的方法,从最基础的到最前沿的,无所不包。R以能创建漂亮优雅的图形而闻名,但实际上它可以处理各种统计问题。基本的安装版本就提供了数以百计的数据管理、统计和图形函数。
本书是一本R指南,高度概括了该软件和它的强大功能。本书介绍了基本安装中最重要的函数,以及重要扩展包中的函数。整本书都是围绕实际应用展开的,你将学会理解数据,并能够与他人交流对数据的理解。通读本书,你会对R的原理和功能有基本的了解,并知道可以从什么地方学习更多的相关知识。你将能用各种技术实现数据可视化,还能解决各种难度的数据分析问题。
本书内容充实、重点突出、实用性强,不仅介绍了常用的统计分析方法,也详细阐述了多元统计分析方法及其应用,例如方差分析、生存分析等,是较完整地覆盖多元统计分析方法的一本参考书,适合不同层次的人员使用。本书对每一种多元统计分析方法的基本原理、分析过程进行了详细的阐述,并介绍了R函数的使用方法、应用实例说明、结果解释、结论分析等,使读者可以将统计分析方法与R软件应用结合起来学习,全面掌握统计分析方法。统计基础知识比较薄弱者可以忽略计算公式等理论部分,把重点放在对基本原理的理解和利用计算机解决实际问题上。统计基础知识较好者可以精读每一部分内容,使自己的统计分析能力达到更高的一个层次,并为今后进一步学习和研究打下扎实的实践基础。本书适合医学、经济学、农业等多个领域的人员参考。
本书在编写方法上有所创新。目前,许多统计分析教程存在理论和实践操作脱节,或者说计算例题和解决实际问题脱节的现象,使得多元统计在研究上的应用价值不能真正体现出来。本书从讲求实效的原则出发,将统计分析原理和R软件的输出结果有机地结合在一起,将理论学习与实际操作融为一体,使得读者有机会把各种统计分析方法的理论知识同解决实际问题的能力结合起来。
本书内容
本书第1章介绍了R的特点以及结构组成,R的获取、安装和启动,如何用网上的扩展包增强R基本安装的功能,R菜单操作,用户界面,如何以交互方式和批处理方式运行程序,R系统的文件管理。第2章介绍了R编程入门,包括数据集的建立以及各种操作方法等,同时讲解了向R中导入数据的诸多方法。这一章的前半部分介绍了如何用R来存储数据的数据结构,以及如何用键盘输入数据;后半部分介绍了怎样从文本文件、网页、电子表格、统计软件和数据库向R导入数据,涵盖了数据管理中函数(数学函数、统计函数、字符函数)以及常用运算符。第3章探讨了基本的数据管理,包括数据集的排序、合并、取子集,以及变量的转换、重编码和删除。第4章介绍了样本量和检验效能估计。第5章在第3章的基础上介绍了高级数据管理方法,涵盖了控制结构(循环、条件执行)的用法,然后介绍如何编写自己的R函数,以及如何用不同的方法整合数据。第6章概括地总结了定量资料基本统计分析方法的主要内容。从第7章开始逐个介绍了工作实践中常用的一些多元统计分析方法,内容包括各种多元统计分析方法的基本原理、计算方法、分析步骤、实例应用、R函数和使用方法,以及结果解释和结论分析等;介绍了针对一个数值型结果变量与一系列数值型预测变量间的关系进行建模的回归方法,并详细给出了拟合模型的方法、适用性评价和含义解释,包括t检验、方差分析、直线回归和相关、多元线性回归与相关、Logistic回归分析。第12章介绍了相对数的概念、率假设检验方法和R程序。第13章介绍了行×列表分析和交叉表。第14章探讨了非参数分析方法,包括配对及单样本秩和检验、两组样本比较的秩和检验、多组样本比较的秩和检验及两两比较、等级分组资料和随机区组设计资料比较的秩和检验及两两比较。第15章介绍了生存分析,主要涉及生存率的两种估计方法,乘积极限法和寿命表法,以及Cox模型。多元数据分析的一个难点是简化数据。后续章节介绍了如何将大量的相关变量转换成较少的不相关变量(主成分分析),以及如何发现一系列变量中的潜在结构(因子分析)。这些方法涉及许多步骤,每一步都有详细的介绍。第16~20章分别阐述了主成分分析、因子分析、聚类分析、判别分析和典型相关分析。从第21章开始探讨了R软件的拓展应用,包括ROC分析和统计图,所涉及的统计图包括条形图、饼图、散点图、折线图、箱线图、直方图、核密度图和点图。另外,本书每一章都给出了使用R软件进行数据分析的实例,以帮助读者理解和掌握各章的内容。
本书特色
- 由R资深专家执笔。作者深入理解了R的内涵和精髓,结合自己丰富的培训经验,以及大量的一线工程实践经验,潜心编写而成。
- 软件版本采用当前最新的R版本,在知识点讲解过程中穿插了新功能的讲述与应用。
- 知识全面、系统,科学安排内容的层次架构,由浅入深,循序渐进,适合读者的学习规律。
- 理论与实践应用紧密结合。基础理论知识穿插在知识点的讲述中,言简意赅、目标明确,其目的是使读者知其然,亦知其所以然,达到学以致用的目的。
- 知识点+针对每个知识点的小实例+综合实例的讲述方式,可以使读者快速地学习并掌握R软件操作及应用该知识点解决实践中的问题。综合实例部分,深入细致地剖析数据统计分析应用的流程、细节、难点、技巧,起到融会贯通的作用。
- 为了让本书内容尽可能接近各个领域的实际情况,作者从心理学、社会学、医学、生物、商业和工程等诸多领域选取了一些例子。所有的这些例子都不需要读者具备这些领域的专业知识。
本书附带所有实例操作的数据和R程序。
本书由汪海波、罗莉、汪海玲编著,参与编写的还有郝旭宁、李建鹏、赵伟茗、刘钦、于志伟、张永岗、周世宾、姚志伟、曹文平、张应迁、张洪才、邱洪钢、张青莲、陆绍强、李成。
读者对象
本书可以作为从事数据分析和数据管理工作人员的参考用书,以及有关科研人员和科研管理者进一步提高统计分析水平的参考书,也可以作为高等院校师生的统计教材。
因编者水平有限,不妥之处敬请读者提出宝贵意见,联系邮箱为zhangtao@ ptpress.com.cn。
编 者
install.packages(\"Rcmdr\")
第一篇 R基础与入门篇
第1章 R入门
学习目标
了解R系统的特点以及结构组成。
熟悉R的安装和启动。
掌握R菜单操作。
掌握R系统的文件管理。
内容概要
R是允许用户编辑算法并使用其他可编程工具的一种计算机语言,具有完备的数据存取、管理、分析和显示等功能,是现今最受欢迎的数据分析和可视化平台之一,是一种针对统计分析和数据科学的功能全面的开源统计语言。它是自由的开源软件,并同时提供Windows、Mac OS X 和Linux 系统的各种版本。它在商业、工业、政府部门、医药和科研等涉及数据分析的领域都有广泛的应用。
本章对R软件和R系统的特点进行了较详细的介绍,描述了R软件的要求和环境支持。希望大家对R系统能够有较全面的了解。首先简要介绍了R,以及它作为数据分析平台的诸多特性。本章主要介绍了R的获取,以及如何用网上的扩展包增强R基本安装的功能。另外,本章还介绍了用户界面,以及如何以交互方式和批处理方式运行程序。同时简要地介绍了R的安装和启动,对R菜单操作也进行了详细的讲解,尤其是那些R操作中经常应用的菜单。R虽然是编程软件,但是菜单操作仍有非常重要的作用。
1.1 R简介
R语言是从S统计绘图语言演变而来的,S语言在20世纪70年代诞生于贝尔实验室,由Rick Becker、John Chambers和Allan Wilks开发。基于S语言开发的商业软件Splus,可以方便地编写函数、建立模型,具有良好的扩展性,在国外学术界应用很广。1995年,新西兰奥克兰大学统计系的Robert Gentleman和Ross Ihaka基于S语言的源代码,编写了一个能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。
1.1.1 R特点
与起源于贝尔实验室的S语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。R的特点如图1-1所示。
具体来说,R有以下7个方面的特点。
(1)完全免费,软件本身及程序包的源代码公开。多数商业统计软件价格不菲,投入成千上万美元都是有可能的。
(2)丰富的资源,涵盖了多种行业数据分析中几乎所有的方法。R是一个全面的统计研究平台,提供了各式各样的数据分析技术,几乎任何类型的数据分析工作皆可在R中完成。
▲图1-1 R的特点
(3)交互式平台。R是一个可进行交互式数据分析和探索的强大平台,任意一个分析步骤的结果均可被轻松保存、操作,并作为进一步分析的输入。有各式各样的图形用户界面工具通过菜单和对话框提供了与R语言同等的功能。
(4)扩展性强。编写函数和程序包十分方便,跨平台,可以胜任复杂的数据分析、绘制精美的图形。R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能。
(5)适用性强。R可运行于多种平台之上,包括Windows、UNIX和Mac OS X。这基本上意味着它可以运行于你所能拥有的任何计算机上。R可以轻松地从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件,乃至专门的数据仓库。它同样可以将数据输出并写入这些系统中。
(6)应用面广。R适用于几乎任何应用的需要。目前在R网站上约有2400个程序包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。R可用来解决自然科学和社会科学领域中的各种问题,如统计学、社会学、经济学、生物、医疗卫生等,其功能包括图形显示、数据分析、数据输入、数据检查、数据管理、报表生成、统计计算、市场研究、销售管理、供应管理、调查分析和建立预测模型等。
(7)完备的帮助系统。每个函数都有统一格式的帮助,运行实例。
1.1.2 R支持资料
R的官方网页拥有大量英文学习资源,还可以参考http://cran.r-project.org/other-docs.html 上的中文翻译文档。统计之都BBS是一个不错的学习R的中文网站,你可以在这个论坛中找到大量学习资料或直接提出问题同大家探讨。
R 的帮助系统非常强大,可以直接使用\\?topic或help(topic)来获取topic的帮助信息,也可使用help.search(\"topic\")来搜索帮助系统。如果你只知道函数的部分名称,那么可以使用apropos(\"tab\") 来搜索得到载入内存所有包含tab字段的函数。如果还没有得到需要的资料,还有R Site Search:http://finzi.psych.upenn.edu/search.html,等价于在R平台上使用RSiteSearch()函
....
本站仅展示书籍部分内容
如有任何咨询
请加微信10090337咨询