当前位置:
首页 > 互联网+ > 人工智能 > 机器学习Web应用pdf/doc/txt格式电子书下载

机器学习Web应用pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

机器学习Web应用pdf/doc/txt格式电子书下载

书名:机器学习Web应用pdf/doc/txt格式电子书下载

推荐语:eBay公司EUAnalytics部门负责人DavideCervellin作序推荐,全面Python机器学习的图书学会在Web下构建机器学习系统的权wei指南

作者:(意)AndreaIsoni,杜春晓译

出版社:人民邮电出版社

出版时间:2017-08-01

书籍编号:30470983

ISBN:9787115458520

正文语种:中文

字数:241699

版次:

所属分类:互联网+-人工智能

全书内容:

机器学习Web应用pdf/doc/txt格式电子书下载








机器学习是什么?2016年,无论参加大会、研讨会,还是接受采访,很多人都让我给机器学习下个定义。人们对机器学习是什么,抱有诸多疑问。理解这一新鲜事物可能为生活带来的潜在影响以及它日后对我们有何种意义之前,天性要求我们先给出其定义。


跟其他陡升为显学的学科类似,机器学习并不是新生事物。科学社区多年来一直致力于研制算法,实现重复性工作的自动化。参数固定的算法叫作静态算法,其输出是可预测的,输出只是输入变量的函数。还有一种情况,算法的参数是动态变化的,算法的输出是外部因素(最常见的是同一算法先前的输出)的函数,这种算法叫作动态算法,其输出不仅仅是输入变量的函数。动态算法是机器学习的支柱:从先前迭代生成的数据中,学习到一组规则,以改善之后的输出。


科学家、开发人员和工程师研究和使用模糊逻辑、神经网络和其他类型的机器学习技术已有多个年头,但直到今天,随着机器学习应用离开实验室,进入市场营销、销售和金融行业,这门学科才流行起来,基本上来讲,需要重复执行相同运算的活动都可以受益于机器学习。


机器学习的影响很容易理解,它将给我们的社会带来巨大冲击。关于下一个5到10年,机器学习将给我们带来什么,我能想到的最佳描述方式是:不妨回想工业革命时期发生了什么。蒸汽机发明之前,很多人从事高度重复性的体力工作。为了赚取少得不能再少的工资,他们往往要冒着生命危险或以牺牲健康为代价。工业革命出现后,社会得以发展,机器接管了生产过程的重要步骤,这带来了产量的增加,并且产出的可预测性更强和更稳定。与之相应的是,产品质量的提升和新工种的出现,操控机器这类新兴的工作取代了体力劳动。我们将造物的责任委托给由我们设计和发明的工具,这在人类历史上可是第一次。机器学习将以相同的方式,改变执行数据运算的方式,减少人工干预的需要,将优化的工作交给机器和算法。数据处理人员将不再直接控制数据,而是通过控制算法间接控制数据。因此,运算的执行速度将会变得更快,更少的人将能控制规模更大的数据集,错误将会减少,从而结果的稳定性更高和可预测性更强。跟其他对我们生活产生重大影响的事物一样,爱慕和憎恶它的人都有。爱慕者称赞机器学习为他们生活带来便利;憎恶者批评,机器学习方法要有效,需要大量的迭代,因此需要大量数据。而通常来讲,我们“喂给”算法的数据可是我们的个人信息[1]


事实上,机器学习作为一种工具得以迅速发展,其主要应用在于提升市场营销和顾客支持的效率。为顾客提供个性化服务,促使他们购买而不只是浏览,或让他们高兴而不是失望,需要对顾客有着深入的理解。


例如,就市场营销而言,如今市场营销人员开始考虑位置、设备、购买历史、访问过的网站、天气状况等信息(仅举几个例子)来决定公司是否向一组特定顾客展示广告。


通过电视或报纸这样无法追踪的媒体传播营销信息的日子已然成为遥远的过去。如今,市场营销人员希望知道谁点击和购买了他们商品等一切信息,他们好优化创意和投入,合理分配预算,以充分利用他们手中的资源。这就要求提供前所未有的高度个性化服务,若使用合理,可以让顾客感到他们是受尊重的个体而不只是某一社会人口学分组的一部分。


机器学习既吸引人又充满挑战,但无疑下一个十年的赢家,将会是那些能够理解非结构化数据,并且能够基于这些数据以可扩展的方式做出决策的公司或个人:除了机器学习,我还没有看到哪种方式能实现这样的伟业。


Andrea Isoni的这本书朝这个世界迈出了一步;读它就好像是向下窥视兔子的洞穴,你能从中看到用机器学习技术实现的几个应用,作者将机器学习技术整合到Web应用中。访问用机器学习技术创建的个性化服务网站,顾客能从中体验到为他们个人提供的优化过的服务。


如果你想为日后的职业生涯提前做好准备,该书是你必须要读的;下一个十年跟数据打交道的任何人若想成功的话,都需要熟练掌握这些技术。


Davide Cervellin,@ingdave


eBay公司EU Analytics部门负责人



[1] 言外之意,隐私受到威胁。——译者注



译者序


20年前,IBM研制的深蓝计算机勉强战胜俄罗斯棋王卡斯帕罗夫,它在体力上的优势似乎比智力方面更明显。但刚刚过去的这一年,谷歌的AlphaGo计算机程序打败了围棋高手李世石,它的升级版Master威力更是了得,横扫中日韩高手,它擅长走快棋,招法狠毒,令人类高手胆颤。由此可见,近年来,人工智能技术随着硬件、大数据、机器学习技术的发展,取得了长足的进步。


机器学习技术作为人工智能的一个子领域,研究和应用热潮不减,研讨会、学习班和创业项目层出不穷;国内学者入选AAAI Fellow;该领域的书籍一印再印;人脸识别、自动驾驶、机器翻译、智能客服、物流无人机和家居、医疗、教育机器人等各种应用不断推向市场。从以上种种表现来看,我们处在人工智能时代的风口和前夕。作为该领域的从业者,我们不能满足于看热闹,应努力掌握背后的核心技术——机器学习,力求弄懂该技术,并努力探索其他可能的实现人工智能的方法,把人类智慧的边界向前推进一步。更令人鼓舞的是,大数据产业发展已上升到国家战略层面,我国要实现从数据大国向数据强国的转变,需要一批掌握了数据挖掘、机器学习等相关技术的人才。


本书讲解的是商业网站数据分析和挖掘所用到的机器学习理论和技术。作者先介绍了机器学习的基本概念、Python机器学习工具栈(NumPy、pandas和matplotlib等),接着分别讲解了无监督和有监督机器学习理论,每种方法都给出形式化描述,其间用到了大量概率统计、线性代数等数学知识,比如最小二乘、相关性、贝叶斯概率和奇异值分解等。作者的统计学背景在这一点上得到了很好的体现。这部分数学知识能够较好地满足有志于深入学习的读者的需要,水平高的读者可以从中感受机器学习模型的数学魅力。介绍完这两大类机器学习理论,作者又从Web结构和内容两个方面讲解了Web挖掘技术;介绍了信息检索模型、主题抽取模型LDA。讲解完机器学习理论和技术之后,作者引入了为Web开发完美主义者准备的Django框架,让昔日在幕后默默奉献的数据分析高手有机会走到台前,用自己研制的算法驱动一款Web产品。作者带领我们利用前面讲解的算法和挖掘技术,用Django框架搭建推荐系统和影评分析系统。学到这里,你会不由地感叹Python真是全栈工程师的好朋友。数据分析师用Python就能从头到尾打造一款智能Web产品,可见Python的应用范围之广。年初,Facebook更是开源了PyTorch深度学习框架,进一步巩固了Python在机器学习领域的地位。


当然,我们最终开发出的产品还比较初级,离最终面向用户的产品在用户体验上还有较大差距,但稍加打磨至少可作为一个最小可行性产品(MVP)先行投入市场,收集用户反馈,日后再图大的改进。此外,限于篇幅,作者也没有讲怎么将系统部署到生产服务器。感兴趣的读者可以试试Heroku、SAE等云应用平台,也可以尝试用Apache、mod_wsgi在自己的计算机上搭服务器。你可能还需要申请一个域名。这样,你就可以向朋友推荐自己开发的产品了,你具备了向全球用户提供智能Web产品的能力!嘿,伙计,快来看,这是我刚刚上线的Web推荐系统!用机器学习算法驱动的哦!


感谢人民邮电出版社的陈冀康编辑等为本书编校、出版辛勤付出的各位朋友。读者罗导运行了第1章的代码,并指出了原书及译者注中的几处问题。师妹瞿乔阅读了第2章译文,她本人也是一本Python图书的译者。泰安读者陈新光阅读了第6章译文,他正努力学习数据科学知识,祝他学有所成。翻译过程中,我向北京大学冷含莹、东京大学范超、上海健康学院姜萌等朋友请教过问题;我旁听了北大的统计学基础、随机过程等课程,了解了很多统计学概念,参考了市面上现有的多本著作,其中包括大名鼎鼎的西瓜书,查询了CSDN等网站的文章,在此一并表示衷心的感谢。感谢西安工业大学的李刚老师、重庆大学杨刘洋同学等读者对翻译工作的支持。最后,感谢我的家人,我翻译图书的时间是用他们的辛勤劳动换来的,因此也更加宝贵。


本人学识有限,且时间仓促,书中翻译错误、不当和疏漏之处在所难免,敬请读者批评指正。


杜春晓 


2017年2月



INSTALLED_APPS = ( … \'rest_framework\', \'rest_framework_swagger\', \'nameapp\', )python manage.py migrate

机器学习Web应用pdf/doc/txt格式电子书下载 


此图标表示警告或重要信息。


机器学习Web应用pdf/doc/txt格式电子书下载 


此图标表示提示或技巧。


前言


数据科学,尤其是机器学习,成为当下科技商业领域人们热议的议题。这类技术可用来处理用户产生的、数量在不断增长的数据。本书将讲解如何用Python语言、Django框架开发一款Web商业应用,还将讲解如何用一些现成的库(sklearn、scipy、NLTK和Django等)处理和分析(通过机器学习技术)应用生成或使用的数据。



第1章,Python机器学习实践入门,讨论机器学习的主要概念以及数据科学专业人士用Python处理数据所使用的几个库。


第2章,无监督机器学习,讲解为数据集分簇和从数据中抽取主要特征所用到的算法。


第3章,有监督机器学习,讲解预测数据集标签最常用的有监督机器学习算法。


第4章,Web挖掘技术,讨论Web数据的组织、分析和从中提取信息的主要技术。


第5章,推荐系统,详细介绍当今商业领域所使用的几种最流行的推荐系统。


第6章,开始Django之旅,介绍开发Web应用所用到的Django的主要功能和特点。


第7章,电影推荐系统Web应用,将介绍的机器学习概念付诸实践,动手实现为Web用户推荐电影的应用。


第8章,影评情感分析应用,再次通过一个实例,使用讲述的知识,分析在线影评的情感倾向和相关性。



读者应该准备一台计算机,装好Python 2.7,能够运行(和修改)书中各章讲解的代码。



任何有一定编程经验(Python)和统计学背景,对机器学习感兴趣和/或希望从事数据科学职业的读者均可从本书受益。



本书使用不同的文本样式来区分不同类别的内容。以下是常用样式及其用途说明。


正文中的代码、数据库表名、文件夹名、文件名、文件扩展名、路径名、URL地址、用户输入的内容和Twitter用户名显示方式如下:


“在终端输入以下命令,安装Django这个库:sudo pip install django。”


代码块样式如下:


所有的命令行输入或输出使用下面这种样式:


新的术语重要的词语使用黑体。出现在屏幕上的词语,例如菜单或对话框里,样式如下“如你所见,页面上有两个输入框,输入姓名和邮箱后,单击‘添加’,将其添加到数据库”。



我们热忱地欢迎读者朋友给予我们反馈,告诉我们你对于这本书的所思所想——你喜欢或是不喜欢哪些内容。大家的反馈对我们来说至关重要,将帮助我们确定到底哪些内容是读者真正需要的。


如果你有一般性建议的话,请发邮件至feedback@packtpub.com ,请在邮件主题中写清书的名称。


如果你是某一方面的专家,对某个主题特别感兴趣,有意向自己或是与别人合作写一本书,请到www.packtpub.com/authors 查阅我们为作者准备的帮助文档。



为自己拥有一本Packt出版的书而自豪吧!为了让你的书物有所值,我们还为你准备了以下内容。



如果你是从www.packtpub.com 网站购买的图书,用自己的账号登录后,可以下载所有已购图书的示例代码。如果你是从其他地方购买的,请访问http://www.packtpub.com/support网站并注册,我们会用邮件把代码文件直接发给你。也可以访问www.epubit.com.cn来下载示例代码。


代码文件下载步骤如下。


1.用邮箱和密码登录或注册我们的网站。


2.鼠标移动到页面顶部的SUPPORT选项卡下。


3.单击Code Downloads & Errata


4.在搜索框Search中输入书名。


5.选择你要下载代码文件的图书。

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示