当前位置:
首页 > 互联网+ > 人工智能 > Java机器学习pdf/doc/txt格式电子书下载

Java机器学习pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

Java机器学习pdf/doc/txt格式电子书下载

书名:Java机器学习pdf/doc/txt格式电子书下载

推荐语:利用Java机器学习常见库设计、构建、部署你自己的机器学习应用

作者:(斯洛文尼亚)BostjanKaluza,武传海译

出版社:人民邮电出版社

出版时间:2017-09-01

书籍编号:30387320

ISBN:9787115466808

正文语种:中文

字数:147129

版次:1

所属分类:互联网+-人工智能

全书内容:

Java机器学习pdf/doc/txt格式电子书下载







前言

机器学习是人工智能的一个分支,它在算法与数据的协助下,让计算机像人类一样学习和行动。针对给定的数据集,机器学习算法会学习数据的不同属性,并对以后可能遇到的数据属性进行推断。


本书教你如何使用Java创建并实现机器学习算法,既有基础概念的讲解,也有示例供你学习。当然,还会介绍一些常用的机器学习库,如Weka、Apache Mahout、Mallet等。阅读本书后,你将懂得如何为特定问题选择合适的机器学习方法,以及如何比较与评估不同技术的优劣。书中还会讲解性能提升技术,包括输入预处理以及合并不同方法产生的输出。


我们将探讨使用Java库进行机器学习的技术细节,并配有清晰易懂的示例。同时,你还将学习如何准备要分析的数据、如何选择机器学习方法,以及如何衡量流程的有效性。


本书内容


第1章 机器学习应用快速入门。讲解机器学习的基础知识、常见概念、原理,以及机器学习的应用流程。


第2章 面向机器学习的Java库与平台。介绍各种机器学习专用的Java库与平台。你将了解每个库提供的功能,以及可以用于解决哪些问题。涉及的机器学习库有Weka、Java-ML、Apache Mahout、Apache Spark、Deeplearning4j和Mallet。


第3章 基本算法——分类、回归和聚类。从最基本的机器学习任务入手,使用小巧又易懂的数据集,介绍分类、回归和聚类的关键算法。


第4章 利用集成方法预测客户关系。深入研究一个真实的客户营销数据库,目标是对可能流失以及可进行追加推销与交叉推销的客户进行预测。我们将使用集成方法解决这个问题,并且采用在KDD Cup竞赛中获胜的解决方案。


第5章 关联分析。讲解如何使用关联规则挖掘分析共生关系。我们将通过“购物篮分析”了解顾客的购买行为,并讨论如何将这种方法应用到其他领域。


第6章 使用Apache Mahout制作推荐引擎。讲解一些基本概念,帮助你了解推荐引擎原理,然后利用Apache Mahout实现两个应用——基于内容的过滤与协同推荐器。


第7章 欺诈与异常检测。介绍异常和可疑模式检测的背景,然后讲解两个实际应用——保险索赔欺诈检测与网站流量异常检测。


第8章 利用Deeplearning4j进行图像识别。介绍图像识别与基本的神经网络架构,然后讨论如何利用Deeplearning4j库实现各种深度学习架构,以实现对手写体数字的识别。


第9章 利用手机传感器进行行为识别。借助传感器数据解决模式识别问题。这一章介绍行为识别过程,讲解如何使用Android设备收集数据,并提出一个分类模型以对日常生活行为进行识别。


第10章 利用Mallet进行文本挖掘——主题模型与垃圾邮件检测。讲解文本挖掘的基础知识,介绍文本处理管道,演示如何将其应用于两个实际问题(主题建模与文档分类)。


第11章 机器学习进阶。这是全书最后一章,提供关于如何部署模型的实用建议,并进一步给出提示,告诉你去哪里寻找更多资源、资料、场所和技术,以便深入了解机器学习。


阅读前提


为了实际运行书中示例,你需要一台安装有JDK的个人计算机。所有能下载的示例与源代码都假定你使用的是支持Maven(一个依赖管理与自动创建工具)与Git(版本控制系统)的Eclipse IDE开发环境。各章示例依赖Weka、Deeplearning4j、Mallet、Apache Mahout等各种库。关于如何获取与安装这些库,会在各章首次用到它们时进行讲解。


读者对象


本书为那些想学习如何使用Java机器学习库进行数据分析的人而写。或许你已经对机器学习有了一点了解,但从未用过Java;又或许你懂得一点Java,而在机器学习方面是个新手。不论你属于哪种情况,本书都能让你快速上手,并提供必需的技能,让你能够成功创建、定制,以及在实际生活中部署机器学习应用。如果你懂得一点基本的编程知识以及数据挖掘相关概念会更好,但不要求你必须拥有与数据挖掘程序包相关的开发经验。


配套资料


本书专门配有一个在线支持网站(http://machine-learning-in-java.com),从中可以找到所有示例代码、勘误表,以及其他入门资料。


排版约定


本书中,你会发现许多不同体例,它们用于区分不同类型的信息。下面给出一些例子,并对其含义进行说明。


正文中的代码、数据库表名、文件夹名、文件名、文件扩展名、路径名、伪URL、用户输入和Twitter用户名显示如下:


“比如,Bob拥有height、eye color、hobbies三个属性,对应值依次为185cm、blue、climbing与sky diving”。


代码块表示如下:

Bob={

height: 185cm,

eye color: blue,

hobbies: climbing, sky diving

}


所有命令行输入或输出写成如下形式:

12,3,7,2,0,1,8,9,13,4,11,5,15,10,6,14,16


新术语与重要词语使用黑体显示。你在屏幕上看到的词,比如菜单或对话框中的词,在正文中显示如下:“在项目属性上点击鼠标右键,选择Java Build Path,单击Libraries选项卡,选择Add External JARs。”


Java机器学习pdf/doc/txt格式电子书下载


警告或重要的注意事项。


Java机器学习pdf/doc/txt格式电子书下载


提示和技巧。


读者反馈


欢迎提供反馈,请将你对本书的看法告诉我们:哪些方面是你喜欢的,哪些方面你不喜欢。读者反馈对我们来说很重要,因为这可以帮助我们推出更符合读者需求的著作。


要给我们提供反馈,只需向feedback@packtpub.com发送电子邮件,并在邮件主题中指出书名。


如果你有擅长的主题,并有志于写书或撰稿,请参阅www.packtpub.com/authors的撰稿指南。


读者支持


购买本社图书后,你将获得各种帮助,让手中图书最大限度地发挥功效。


下载示例代码


你可以从本书配套网站(http://machine-learning-in-java.com)下载书中示例代码。导航到Downloads版块,点击到Git仓库链接。


当然,你也可以使用自己的账号登录http://www.packpub.com网站下载本书示例代码。不论你在哪里购买本书,都可以访问http://www.packtpub.com/support。注册之后,我们会使用电子邮件将示例代码直接发送给你。


下载示例代码时,请按照如下步骤进行:


(1)使用你的电子邮件地址与密码登录我们的网站,如果尚未加入会员,请先注册加入;


(2)移动鼠标到SUPPORT菜单之上;


(3)点击Code Downloads & Errata;


(4)在Search文本框中输入书名;


(5)选择你想下载代码文件的图书;


(6)从下拉菜单中选择你购买本书的地点;


(7)点击Code Download。


示例文件下载完成后,请使用如下最新版本的解压缩软件对文件进行解压。


WinRAR/7-Zip for Windows


Zipeg/iZip/UnRarX for Mac


7-Zip/PeaZip for Linux


勘误


虽然我们力图让图书内容准确无误,但错误仍不可避免。如果你在本社图书中发现错误(包括正文和代码),请告诉我们,我们将感激不尽。你这样做不仅可以让其他读者免遭同样的挫折,还可帮助我们改进该书的后续版本。无论你发现什么错误,都请告诉我们。为此,可以访问http://www.packtpub.com/submit-errata,输入书名,单击链接Errata Submission Form,再输入错误详情。提交的勘误得到确认后,将被上传到我们的网站或添加到既有的勘误列表。


要查看已提交的勘误,请访问https://www.packtpub.com/books/content/support,并在搜索框中输入书名,Errata栏将列出你搜索的信息。


打击盗版


网上散布的盗版材料是各类媒体屡禁不绝的问题。在保护版权和许可方面,本社的态度非常严肃。如果你在网上看到本社作品的非法复制品,请马上把网址或网站名告诉我们,以便我们能够采取补救措施。


请通过copyright@packtpub.com与我们取得联系,并提供可疑的盗版材料链接。


感谢你为保护我们的作者提供的帮助,也十分感激对于我们提供有价值内容的能力给予的保护。


答疑


只要有与本书相关的问题,都可通过questions@packtpub.com与我们联系,我们将尽力解决。


电子书


扫描如下二维码,即可购买本书电子版。


Java机器学习pdf/doc/txt格式电子书下载

Java机器学习pdf/doc/txt格式电子书下载

本章介绍机器学习的基础知识,包括常见主题与概念,这些内容将让你更容易理解相关逻辑以及所讲主题。本章的目标是让你快速了解应用机器学习的详细步骤,掌握机器学习的主要原理。本章涵盖以下内容:


介绍机器学习及其与数据科学的关系


讨论机器学习应用的基本步骤


讨论所处理数据的类型及其重要性


讨论收集数据以及对数据进行预处理的方法


使用机器学习理解数据


使用机器学习从数据获取有用信息并创建预测器


如果你已经熟悉机器学习,并急于开始编写代码,请跳过本章内容,直接阅读其他章节。然而,如果你想重温这些内容或者搞清一些概念,强烈建议你认真学习本章。


1.1 机器学习与数据科学


如今,每个人都在谈论机器学习与数据科学。那么,机器学习究竟是什么?它与数据科学有着怎样的联系呢?这两个术语常被混淆,因为它们经常使用相同的方法,有着明显的重叠。因此,下面先区分这两个术语。


Josh Wills在Twitter上说:


“所谓的数据科学家指这样一类人,他们比软件工程师更懂统计学,比统计学家更懂软件工程。”


更具体地说,数据科学包含从数据获取知识的整个过程,它综合运用统计学、计算机科学以及其他领域的各种方法,帮助人们从数据中获取有用的知识与信息。事实上,数据科学是一个不断反复的过程,包括数据的采集、清洗、分析、可视化和部署。


另一方面,机器学习主要涉及数据科学的分析与建模阶段使用的通用算法与技术。对于机器学习,Arthur Samuel在1959年提出如下定义:


“机器学习是指研究、设计与开发某些算法,让计算机获得学习的能力,而不需要明确的编程。”


1.1.1 机器学习能够解决的问题


机器学习方法主要有如下三种:


监督学习


无监督学习


强化学习


给定一组样本输入X与它们的结果Y,监督学习的目标是产生一个通用的映射函数f,使得每一个输入都有对应的确定输出,即f:X Y。


监督学习的一个应用例子是检测信用卡欺诈。学习算法会学习所有带有“正常”或“可疑”标记(向量Y)的信用卡交易(矩阵X),并最终产生一个决策模型(即f函数),对未见过的交易打标记(“正常”或“可疑”)。


相反,无监督学习算法所学的数据没有给定的结果标签Y,它主要学习数据的结构,比如将相似的输入数据归入某个聚类。因此,使用无监督学习能够发现隐藏在数据中的模式。无监督学习的一个应用例子是基于物品(Item-based)的推荐系统,其学习算法会发现购物者一同购买的相似商品,比如购买了书A的人也购买了书B。


强化学习从完全不同的角度处理学习过程。它假设有一个智能体(agent,可以是机器人、自动程序或计算机程序)与动态环境进行交互,以实现某个特定目标。环境由一组状态描述,智能体可以做出不同行为,以从一种状态变为另一种状态。有些状态被标为目标状态,如果智能体实现了这种状态,就会获得很大的奖励;而在其他状态中,智能体得到的奖励很少或没有,甚至还会被“惩罚”。强化学习的目标是找到最优策略,即映射函数,指定每个状态要采取的行为动作,而没有指导者(teacher)明确告知这样做是否会实现目标状态。强化学习的一个例子是汽车自动驾驶程序,其中“状态”与“驾驶条件”(比如当前速度、路况信息、周围交通状况、速度限制、路障)相对应,行为会驱动汽车做出诸如左转、右转、停止、加速、前行等动作。学习算法会产生一个策略,指定汽车在特定驾驶条件下要采取的动作。


本书中,我们把学习重点放在监督学习与无监督学习上,因为它们有许多相同的概念。如果强化学习激起了你的兴趣,建议阅读Rich

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示