当前位置:
首页 > 互联网+ > 大数据 > Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

书名:Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

推荐语:

作者:王宇韬,钱妍竹

出版社:机械工业出版社

出版时间:2020-05-01

书籍编号:30618039

ISBN:9787111654711

正文语种:中文

字数:269802

版次:1

所属分类:互联网+-大数据

全书内容:

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

Python大数据分析与机器学习商业案例实战


王宇韬 钱妍竹 著


ISBN:978-7-111-65471-1



版权所有,侵权必究


客服热线:+ 86-10-68995265


客服信箱:service@bbbvip.com


官方网址:www.hzmedia.com.cn


新浪微博 @华章数媒


微信公众号 华章电子书(微信号:hzebook)

前言


在这个信息爆炸的时代,如何高效处理数据并利用数据推动决策显得尤为重要,这便是人们通常所说的“大数据分析”。与大数据分析相伴而生的机器学习(Machine Learning),有些人可能会感到陌生,然而说到战胜了众多人类围棋高手的智能机器人AlphaGo,想必大多数人都有所耳闻。AlphaGo背后的原理支撑就是机器学习,它通过模拟人类的学习行为,不停地分析海量的围棋数据,发现数据背后的规律,从而在已有条件下做出最为理性的决断,这个过程充满了机器美学。


大数据分析和机器学习面对的数据浩如烟海,原始的纸笔演算根本无力应对,幸运的是,飞速发展的信息技术为我们建造了一个“武器库”——从Excel、MATLAB等专业的应用软件,到Java、R、Python等程序设计语言,大大降低了大数据分析和机器学习的实现门槛,推动着这些先进技术在各行各业生根发芽。


Python是大数据分析和机器学习“武器库”中的一把“利刃”,其功能强大且简单易上手。本书就是一本专注于利用Python编程实现大数据分析与机器学习商业应用的实战型教程,讲解了线性回归模型、逻辑回归模型、决策树模型、朴素贝叶斯模型、K近邻算法模型、随机森林模型、AdaBoost与GBDT模型、XGBoost与LightGBM模型、PCA(主成分分析)模型、聚类与分群模型(KMeans与DBSCAN算法)、协同过滤算法模型、Apriori关联分析模型、神经网络模型等十余种机器学习模型,每种模型都配有一到两个典型案例,涵盖了多个行业的应用场景,如金融领域的大数据风控、量化金融交易,产品营销领域的产品智能定价与智能推荐、用户评论情感分析、客户精准营销与流失预警,医疗领域的疾病预测与关联规则分析,社会科学领域的收入预测、人脸识别,企业办公与管理领域的手写文字识别、员工离职预测等。


有的读者可能会在感慨机器学习之强大的同时发出疑问:机器学习这么厉害,我能学会吗?其实机器学习并不复杂,尤其是Python中的编程实现更加方便,你甚至无须完全了解模型的数学原理,便能用几行代码搭建出一个简单的模型,相信读者在阅读完3~5章之后就能体会到Python的数据分析之美。当然,知其然更要知其所以然,本书还会以简单易懂的方式讲解各个机器学习模型的数学原理,读者只需具备高中数学以上的基础便能理解。


为方便读者学习,本书所有案例均提供配套的素材文件、数据文件和源代码文件,并且附赠Python基础知识的电子书和教学视频,具体的获取方法见“如何获取学习资源”中的说明。


由于编者水平有限,本书难免有不足之处,恳请广大读者批评指正,除了扫描封底及勒口中的二维码关注公众号以外,也可加入QQ群930872583与我们交流。


编者


2020年3月

如何获取学习资源


本书的学习资源分为案例文件(包括素材文件、数据文件、源代码文件等)和视频课程两部分。获取学习资源的方法有两种,下面分别介绍。


方法1 百度网盘下载案例文件,在线观看视频课程

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

步骤1:扫描关注微信公众号


用手机微信扫描右侧二维码,关注我们的微信公众号。


步骤2:获取学习资源下载地址和提取密码


进入公众号,发送关键词“机器学习”,即可获得案例文件的百度网盘下载地址和提取密码,以及视频课程的在线观看地址和免费兑换码。


步骤3:提取文件


在计算机的网页浏览器中打开获取的案例文件下载地址,在页面的“请输入提取密码”文本框中输入获取的提取密码(输入时注意区分大小写),再单击“提取文件”按钮。


步骤4:下载文件


在资源下载页面中单击打开资源文件夹,将鼠标指针放在要下载的文件上,单击文件名右侧显示的“下载”按钮,即可将文件下载到计算机中。下载的文件如果为压缩包,可使用7-Zip、WinRAR等软件解压。


提示


不要直接单击文件名,而要单击文件名右侧的“下载”按钮。如果页面中提示选择“高速下载”或“普通下载”,请选择“普通下载”。


方法2 QQ群下载案例文件,在线观看视频课程

加入本书的服务QQ群930872583,可从群文件中下载案例文件。


在手机微信中进入公众号,发送关键词“机器学习”,即可获得视频课程的在线观看地址和免费兑换码。


提示


读者在下载和使用学习资源的过程中如果遇到自己解决不了的问题,请加入QQ群930872583,向群管理员寻求帮助。

第1章 Python与数据科学


本章首先介绍大数据分析的原理与应用领域、机器学习的基本概念及Python在数据科学中的作用,然后讲解如何安装Python及使用相关的代码编辑器,最后会提及如何快速掌握Python的基础知识。

1.1 大数据分析与机器学习概述


说到大数据分析与机器学习(Machine Learning),有的读者可能感觉比较陌生,然而说到击败了世界顶级围棋选手的智能机器人AlphaGo,想必大家都有所耳闻。AlphaGo背后的原理就是大数据分析。通过不停地进行机器训练与学习,AlphaGo在积累了海量数据后,逐渐掌握了大量围棋技巧,并凭借高速的计算能力击败了顶级围棋选手。机器学习便是模拟或实现人类的学习行为,以探寻大数据背后的规律。机器学习在某种程度上可以说是人工智能的核心。

1.1.1 大数据分析与机器学习的应用领域


除了围棋领域,大数据分析在其他领域也有很大的应用空间。在信息时代,我们每天都要接触海量的数据,通过人力在海量的数据中寻找规律有很大的局限性,而通过机器学习则可以高效、快速地对数据进行分析并提炼出规律。


下表简单展示了大数据分析与机器学习在8大领域的应用,我们将在后面的章节中通过实战讲解其中的部分案例。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

上表中的案例仅是大数据分析与机器学习的很小一部分应用场景。虽然不同行业的应用场景不同,但是其原理都是相通的,等学习完后面的章节,相信大家会对这些案例有更加清晰的认知。

1.1.2 机器学习的基本概念


机器学习是强有力的大数据分析工具。机器学习主要分为监督式学习与非监督式学习两大类,两者的区别在于训练数据中是否有目标变量(又称为预测变量)。


下面用两张图来解释两者的区别。监督式学习(训练数据中有目标变量)如下图所示,它的训练数据中有3个特征变量(体型、毛发、特点)和1个目标变量(品种),该机器学习的目的就是根据训练数据搭建模型来预测狗的品种。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

非监督式学习(训练数据中无目标变量)如下图所示,它的训练数据中只有特征变量,而没有目标变量(品种),所以它的学习目的不是预测品种。以第13章的聚类模型为例,非监督式学习可以根据这些特征将训练数据中的狗进行归类,如A类狗、B类狗、C类狗,那么对于一个新样本便可以根据它的特征来判别它属于哪一个分类。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

再细分来说,监督式学习主要分为回归分析(Regression)与分类问题(Classification),其特点与典型案例见下表。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

而非监督式学习主要分为数据聚类与分群(Clustering)与数据降维(Dimension Reduction),其特点与典型案例见下表。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

从机器学习模型的角度,可以将监督式学习和非监督式学习分成如下表所示的不同算法模型。这些模型的原理和应用将在后面的章节进行详细讲解,并且每一章都会通过商业案例实战来帮助大家理解和巩固。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

1.1.3 Python在数据科学中的作用


数据分析的工具有很多,如经典的MATLAB与R语言,以及目前非常火的Python。Python之所以能够成为如今大数据分析的主要工具,主要是因为它有很多现成的数据分析及机器学习的工具包(在Python中称为“库”),如NumPy库、pandas库、Scikit-Learn库(简称sklearn库)等。这些库里封装了很多已经写好的算法模型,我们在编程时可以直接调用,而不需要把精力花在数学表达式的构建上,大大提高了工作效率。


了解了Python的强大之处后,下面来讲解Python的安装方法及相关代码编辑器的基本使用方法。

1.2 Python编程环境部署与基本操作


本节主要讲解如何安装Python和编辑器PyCharm,并着重介绍编辑器Jupyter Notebook的使用(笔者推荐在Jupyter Notebook中运行机器学习的相关代码)。由于本书的侧重点是大数据分析与机器学习,所以本节的知识仅讲解核心要点,在本书附赠的相关视频和部分电子教材中有更详细的讲解。

1.2.1 Python的安装


学习Python的第一步是什么?自然是安装Python了。这里介绍一种非常方便的安装方法——Anaconda安装。Anaconda是Python的一个发行版本,安装好了Anaconda就相当于安装好了Python,并且里面还集成了很多关于Python科学计算的第三方库。


在浏览器中打开Anaconda的官网下载地址https://www.anaconda.com/distribution/,根据当前操作系统配置选择相应的版本下载即可。这里选择Windows系统的Python 3.7版本,如下图所示,默认为64位的版本。如果操作系统是32位,那么选择32位的版本下载,如果是macOS或Linux系统,选择相应版本下载即可。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

如果官网下载速度较慢,可以到清华大学开源软件镜像站下载安装文件,网址为https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/。


双击下载好的安装文件,进入安装界面。建议不要改变默认安装路径(防止可能出现的安装问题),然后在弹出的界面中单击多次“Next”按钮。安装到如下图所示的界面时,一定要勾选第一个复选框,其作用相当于自动配置好环境变量,对初学者来说比较方便。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

如果弹出的界面中询问是否安装Microsoft VSCode(Install Microsoft VSCode),单击“Skip”按钮跳过即可。最后单击“Finish”按钮,完成安装。


要输入和调试Python程序,还需要选择一款代码编辑器。Anaconda自带了一些不错的编辑器,如Spyder、Jupyter Notebook,此外常用的编辑器还有PyCharm。笔者通常用Jupyter Notebook进行机器学习的代码学习、调试与整理,最终在PyCharm中运行完整的项目。下面先简单介绍PyCharm的安装和配置方法,然后详细介绍Jupyter Notebook的基本操作。初学者重点学习Jupyter Notebook的使用。

1.2.2 PyCharm的安装与设置


PyCharm的特点是界面美观,并且能够快速识别常见的编程格式错误。例如,代码中的双括号“()”如果少了右括号“)”,PyCharm就会自动提示。PyCharm的官网下载地址为http://www.jetbrains.com/pycharm/download/,选择操作系统类型后,下载免费的Community版,如下图所示。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

双击下载好的安装文件即可开始安装,安装过程中,在大多数界面单击“Next”按钮和“Install”按钮,当出现如下图所示的界面时,要勾选两个复选框,这是为了选择64位的安装版本并关联扩展名为.py的Python文件。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

之后一直单击“Next”按钮,最后单击“Finish”按钮即可完成安装。


初次启用PyCharm时需要注意以下事项。


步骤1:单击“Do not import settings”单选按钮,如下图所示。

Python大数据分析与机器学习商业案例实战pdf/doc/txt格式电子书下载

步骤2:选择页面风格,建议选择默认的黑色风格。


步骤3:选择辅助工具,直接跳过,不做任何设置。


步骤4:单击“Create New Project”按钮,创建Python项目。


步骤5:为项目文件夹命名,这一步要展开“Project Interpreter”选项组,单击“Existing interpreter”单选按钮,

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示