当前位置:
首页 > 互联网+ > 人工智能 > scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载

scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载

书名:scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载

推荐语:

作者:(美)加文·海克(GavinHackeling),张浩然译

出版社:人民邮电出版社

出版时间:2019-02-01

书籍编号:30464517

ISBN:9787115503404

正文语种:中文

字数:251463

版次:2

所属分类:互联网+-人工智能

全书内容:

scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载









内容提要


近年来,Python语言成为了广受欢迎的编程语言,而它在机器学习领域也有着卓越的表现。scikit-learn是一个用Python语言编写的机器学习算法库,它可以实现一系列常用的机器学习算法,是一个不可多得的好工具。


本书通过14章内容,详细地介绍了一系列机器学习模型和scikit-learn的使用技巧。本书从机器学习的基础理论讲起,涵盖了简单线性回归、K-近邻算法、特征提取、多元线性回归、逻辑回归、朴素贝叶斯、非线性分类、决策树回归、随机森林、感知机、支持向量机、人工神经网络、K-均值算法、主成分分析等重要话题。


本书适合机器学习领域的工程师学习,也适合想要了解scikit-learn的数据科学家阅读。通过阅读本书,读者将有效提升自己在机器学习模型的构建和评估方面的能力,并能够高效地解决机器学习难题。

作者简介


加文•海克(Gavin Hackeling)是一名数据科学家和作家。他研究过各种各样的机器学习问题,包括自动语音识别、文档分类、目标识别以及语义切分。他毕业于北卡罗来纳大学和纽约大学,目前他和妻子以及小猫生活在布鲁克林。


 


感谢我的妻子Hallie,以及scikit-learn社区。

审稿人简介


奥列格•奥肯(Oleg Okun)是一位机器学习专家,他还是4本书、许多期刊文章和会议论文的作者/编辑。他的职业生涯已经超过四分之一个世纪。他受雇于包括他的祖国(白罗斯)和国外(芬兰、瑞典和德国)的学术机构和企业。他的工作经验涉及文本图片分析、指纹生物技术、生物信息学、在线/离线市场分析、信用评估和文本分析领域。


他对分布式机器学习和物联网感兴趣,目前居住在德国汉堡市。


我想对父母为我做的一切表示最深切的感激。

# In[1]: import sklearn sklearn.__version__ # Out[1]: \'0.18.1\'

标题: fig: 


这个图标表示警告或需要特别注意的内容。


图标2.tif  


这个图标表示提示或者技巧。


前言


近些年来,机器学习已经成为大家热衷的话题。在机器学习领域,各式各样的应用层出不穷。其中的一些应用(例如垃圾邮件过滤器)已经被广泛使用,却反而因为太成功而变得平淡无奇。很多其他的应用直到近些年才纷纷出现,它们无一不在昭示着机器学习带来的无限可能。


在本书中,我们将分析一些机器学习模型和学习算法,讨论一些常用的机器学习任务,同时也会学习如何衡量机器学习系统的性能。我们将使用一个用Python编程语言编写的类库scikit-learn,它包含了最新机器学习算法的实现,其API也很直观通用。



第1章,机器学习基础。本章给出了机器学习的定义:机器学习是对如何通过从经验中学习来改善工作性能的研究和设计。该定义提纲挈领地引出了后续的章节,在后续的每个章节中,我们都将分析一种机器学习模型,将其运用于现实工作中,并衡量其性能。


第2章,简单线性回归。本章讨论了将单个特征同连续响应变量联系起来的模型。我们将学习代价函数,以及使用范式函数优化模型的相关知识。


第3章,用K-近邻算法分类和回归。本章介绍了一个用于分类和回归任务的简单的非线性模型。


第4章,特征提取。本章介绍了将文本、图片以及分类变量表示为机器学习模型可用特征的技术。


第5章,从简单线性回归到多元线性回归。本章讨论了简单线性回归模型的扩展——多元线性回归模型,它能在多个特征上对连续响应变量进行回归。


第6章,从线性回归到逻辑回归。本章将多元线性回归模型做了进一步推广,并介绍了一个用于二元分类任务的模型。


第7章,朴素贝叶斯。本章讨论了贝叶斯定理和朴素贝叶斯分类器,同时对生成模型和判别模型进行了对比。


第8章,非线性分类和决策树回归。本章介绍了决策树这种用于分类和回归任务的简单模型。


第9章,集成方法:从决策树到随机森林。本章讨论了3种用于合并模型的方法,它们分别是套袋法(bagging)、推进法(boosting)和堆叠法(stacking)。


第10章,感知机。本章内容介绍了一种用于二元分类的简单在线模型。


第11章,从感知机到支持向量机。本章讨论了一种可用于分类和回归的强大的判别模型——支持向量机,同时还介绍了一种能有效将特性投影到高维度空间的技巧。


第12章,从感知机到人工神经网络。本章介绍了一种建立在人工神经元图结构基础上,用于分类和回归任务的强大的非线性模型。


第13章,K-均值算法。本章讨论了一种在无标记数据中发现结构的算法。


第14章,使用主成分分析降维。本章讨论了一种用于降低数据维度以缓和维度灾难的方法。



运行本书中的例子需要Python版本2.7或者3.3,以及pip—PyPA工作组推荐使用的Python包安装工具。书中的例子预期在Jupyter notebook环境中或者IPython解释器环境中运行。第1章详细说明了如何在Ubuntu、MacOS和Windows环境下安装scikit-learn 0.18.1版本类库及其依赖项目和其他类库。



本书的目标读者是希望了解机器学习算法是如何运行,想培养机器学习使用直觉的软件工程师。本书的目标读者也包含希望了解scikit-learn类库API的数据科学家。读者不需要熟悉机器学习基础和Python编程语言,但具备相关基础对阅读本书很有帮助。



在本书中,你会发现一些不同的文本样式,用以区别不同种类的信息。下面对一些样式及其意义举例进行说明。


代码片段、数据库表名、目录名、文件名、文件扩展名、路径名、URL、用户输入、以及推特用户名会如下印刷:“由于scikit-learn不是一个有效的Python包名称,该类库被命名为sklearn”。


新术语和重要语句会加粗印刷。


 

资源与支持


本书由异步社区出品,社区(https://www.epubit.com/)为您提供相关资源和后续服务。



本书提供配套源代码,要获得该配套资源,请在异步社区本书页面中单击scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载 ,跳转到下载界面,按提示进行操作即可。注意:为保证购书读者的权益,该操作会给出相关提示,要求输入提取码进行验证。


如果您是教师,希望获得教学配套资源,请在社区本书页面中直接联系本书的责任编辑。



作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。


当您发现错误时,请登录异步社区,按书名搜索,进入本书页面,单击“提交勘误”,输入勘误信息,单击“提交”按钮即可。本书的作者和编辑会对您提交的勘误进行审核,确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。


E:\\0在线编撰系统图书\\50391\\qy-web-resources\\image\\2.png



我们的联系邮箱是contact@epubit.com.cn。


如果您对本书有任何疑问或建议,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。


如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区在线提交投稿(直接访问www.epubit.com/selfpublish/submission即可)。


如果您是学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。


如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接发邮件给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。



“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT技术图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT技术图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www.epubit.com。


“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社近30年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、AI、测试、前端、网络技术等。


scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载


异步社区


scikit-learn机器学习(第2版)pdf/doc/txt格式电子书下载


微信服务号

# In[1]: import sklearn sklearn.__version__ # Out[1]: \'0.18.1\'

图标2.tif  


安装包命名为sklearn原因是scikit-learn并不是一个有效的Python包名。

$ pip install -U scikit-learn$ sudo apt install python-scikits-learn$ sudo port install py27-sklearn# In[1]: import sklearn sklearn.__version__ # Out[1]: \'0.18.1\'$ nosetest sklearn -exe$ pip install pandas pillow nltk$ sudo apt install python-matplotlib

第1章 机器学习基础


在本章中,我们将回顾机器学习中的基础概念,比较监督学习和无监督学习,讨论训练数据、测试数据和验证数据的用法,并了解机器学习应用。最后,我们将介绍scikit-learn库,并安装后续章节中需要的工具。



长久以来,我们的想象力一直被那些能够学习和模仿人类智慧的机器所吸引。尽管具有一般人工智能的机器(比如阿瑟· 克拉克笔下的HAL和艾萨克· 阿西莫夫笔下的Sonny)仍然没有实现,但是能够从经验中获取新知识和新技能的软件正在变得越来越普遍。我们使用这些机器学习程序去寻找自己可能喜欢的新音乐,找到自己真正想在网上购买的鞋子。机器学习程序允许我们对智能手机下达命令,并允许用恒温控制器自动设置温度。机器学习程序可以比人类更好地破译书写凌乱的邮寄地址,并更加警觉地防止信用卡欺诈。从研发新药到估计一个头条新闻的页面访问量,机器学习软件正在成为许多行业的核心部分。机器学习甚至已经侵占了许多长久以来一直被认为只有人类能涉及的领域,例如撰写一篇关于杜克大学篮球队输给了北卡大学篮球队的体育专栏报道。


机器学习是对软件工件的设计和学习,它使用过去的经验去指导未来的决策。机器学习是对从数据中学习的软件的研究。机器学习的基础目标是归纳,或者从一种未知规则的应用例子中归纳出未知规则。机器学习的典型例子是垃圾邮件过滤。通过观察已经被标记为垃圾邮件或非垃圾邮件的电子邮件,垃圾邮件过滤器可以分类新消息。研究人工智能的先锋科学家亚瑟·萨缪尔曾说过机器学习是“给予计算机学习的能力而无须显式地编程的研究”。在20世纪50年代到20世纪60年代之间,萨缪尔开发了多个下棋程序。虽然下棋的规则很简单,但是要战胜技艺高超的对手需要复杂的策略。萨缪尔从来没有显式地编程过这些策略,而是通过几千次比赛的经验,程序学习了复杂的行为以此打败了许多人类对手。


计算机科学家汤姆·米切尔对机器学习给出了一个更加正式的定义:“如果一个程序的性能在‘T’中体现,通过‘P’来衡量,并通过经验‘E’来提升,那么该程序可以被视为针对一些任务类型‘T’和性能衡量‘P’从经验‘E’中进行学习”。例如,假设你有一个图片集合,每一张图片描绘了一只狗或一只猫。任务是将图片分为狗图片类和猫图片类,而程序可以通过观察已经被分类好的图片来学习执行这个任务,同时它可以通过计算分类图片的正确比例来提升性能。


我们将使用米切尔关于机器学习的定义来组织本章内容。首先,我们将讨论经验的类型,包括监督学习和无监督学习。接着,我们将讨论可以用机器学习系统解决的常见任务。最后,我们将讨论能够用于衡量机器学习系统性能的标准。



机器学习系统经常被描述为在人类监督或无监督之下从经验中学习。在监督学习问题中,一个程序会通过标记的输入和输出进行学习,并从一个输入

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示