基于深度学习的自然语言处理pdf/doc/txt格式电子书下载
本站仅展示书籍部分内容
如有任何咨询
请加微信10090337咨询
书名:基于深度学习的自然语言处理pdf/doc/txt格式电子书下载
推荐语:关于基于深度学习的自然语言处理的基础知识大全,内容全面且新颖,讲解专业且规范,是走上精通深度学习与自然语言处理之路的优秀范本。
作者:(美)卡蒂克·雷迪·博卡,赵鸣,曾小健,詹炜等译
出版社:机械工业出版社
出版时间:2020-05-01
书籍编号:30616187
ISBN:9787111653578
正文语种:中文
字数:105224
版次:1
所属分类:互联网+-人工智能
译者序
自然语言处理(Natural Language Processing,NLP)属于人工智能的一个子领域,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等进行操作和加工。它对计算机和人类的交互方式有许多重要的影响。
本书可划分为三大部分:第一部分包括第1、2章,主要介绍了NLP的常用基本技术,包括词嵌入、文本规范化、标记文本、词性标注等,并且附有练习,以帮助读者实际上手和巩固所学知识;第二部分涵盖第3章到第8章,这部分专门针对用于NLP任务的神经网络与深度学习技术进行讲解,包括CNN、RNN、GRU、LSTM等,特别是第8章讲解了最前沿的用于自然语言处理任务的技术,包括注意力机制、transformer及BERT等;第三部分(第9章)则是NLP在真正项目工作流中的体现。原理加项目代码实现是整本书的特点。希望读者可以多编码,加深记忆。
译者在本书翻译过程中参考了大量书籍和文献,但由于水平有限,译文中难免有不当之处,恳请读者批评指正。
曾小健
2020年伊始
前言
本书首先介绍自然语言处理领域的基本构件,接着介绍使用最先进的神经网络模型可以解决的问题,将深入涵盖文本处理任务中所需的必要预处理以及自然语言处理领域的一些热门话题,包括卷积神经网络、循环神经网络和长短期记忆网络。通过阅读本书,读者将理解文本预处理以及超参数调整的重要性。
学习目标
·学习自然语言处理的基础知识。
·了解深度学习问题的各种预处理技术。
·使用word2vec和GloVe构建文本的矢量表示。
·理解命名实体识别。
·使用机器学习进行词性标注。
·训练和部署可扩展的模型。
·了解神经网络的几种架构。
目标读者
对自然语言处理领域的深度学习感兴趣的有抱负的数据科学家和工程师。
他们将从自然语言处理概念的基础开始,逐渐深入到神经网络的概念及其在文本处理问题中的应用。他们将学习不同的神经网络架构及其应用领域。需要具备丰富的Python知识和线性代数技能。
方法
本书从自然语言处理的基本概念讲起,在了解了基本概念之后,读者将逐渐意识到自然语言处理技术在现实世界中的应用和问题。接下来本书针对这些问题领域介绍开发解决方案的方法。本书还讨论了作为基于解决方案的方法的一部分的神经网络的基本构造块。最后通过实例阐述各种现代的神经网络架构及其相应的应用领域。
硬件要求
为了获得最佳体验,我们推荐以下硬件配置:
·处理器:英特尔酷睿i5或同级产品
·内存:4GB内存
·存储:5GB可用空间
软件需求
我们还建议你预先安装以下软件:
·操作系统:Windows 7 SP164位、Windows 8.164位或Windows 1064位、Linux(Ubuntu、Debian、Red Hat或Suse)或OS X的最新版本。
·Python 3.6.5或更高版本,最好是3.7。可访问https://www.python.org/downloads/release/python-371/下载。
·Jupyter(访问网站https://jupyter.org/install下载,按照说明安装)。或者,你可以使用Anaconda来安装Jupyter。
·Keras(https://keras.io/#installation)。
·Google Colab这是一个免费的Jupyter笔记本环境,运行在云基础架构上。强烈建议你使用它,因为其不需要任何设置,并且预先安装了流行的Python包和库(https://colab.research.google.com/note-books/welcome.ipynb)。
安装和设置
每一次伟大的旅程都是从一个不起眼的步骤开始的,对于即将到来的数据领域的冒险也不例外。在能够用数据做令人敬畏的事情之前,我们需要准备好最高效的环境。
在Windows上安装Python
1)在官方安装页面(https://www.python.org/downloads/windows/)上找到你想要的Python版本。
2)确保根据你的计算机系统安装正确的“位”版本(32位或64位)。你可以在操作系统的“系统属性”窗口中找到此信息。
下载安装程序后,只需双击文件,并按照屏幕上显示的用户友好提示操作。
在Linux上安装Python
要在Linux上安装Python,需执行以下操作:
1)在命令提示符下运行python3--version验证尚未安装p\\Python 3。
2)要安装Python 3,请运行以下命令:
3)如果遇到问题,有许多在线资源可以帮助你解决问题。
在macOS X上安装Python
要在macOS X上安装Python,需执行以下操作:
1)通过按住“CMD+空格”组合键打开终端,在打开的搜索框中键入终端,然后按回车键。
2)通过命令行运行xcode--select--install来安装Xcode。
3)安装Python 3最简单的方法是使用homebrew,通过命令行运行ruby--e\"$(curl-fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)\"来安装。
4)将homebrew添加到你的PATH环境变量中。通过运行sudo nano~/.profile在命令行中打开你的配置文件,并在底部插入export PATH=\"/usr/local/opt/python/libexec/bin:$PATH\"。
5)最后一步是安装Python。在命令行中,运行brew install python。
6)注意,如果你安装Anaconda,最新版本的Python将自动安装。
安装Keras
要安装Keras,需执行以下步骤:
1)由于Keras需要另一个深度学习框架作为后端,你需要先下载另一个框架,建议使用TensorFlow。
要在你的平台上安装TensorFlow,请访问https://www.tensorflow.org/install/。
2)安装后端后,就可以使用以下命令安装Keras:
也可以从GitHub安装它,使用以下方法克隆Keras:
3)使用以下命令在Python上安装Keras:
现在需要配置后端。更多信息请参考链接https://keras.io/backend/。
下载示例代码及彩色图像
本书的示例代码及所有截图和样图,可以从http://www.packtpub.com通过个人账号下载,也可以访问华章图书官网http://www.hzbook.com,通过注册并登录个人账号下载。
第1章 自然语言处理
学习目标
本章结束时,你将能够:
·描述自然语言处理及其应用。
·解释不同的文本预处理技术。
·对文本语料库执行文本预处理。
·解释Word2Vec和GloVe的词嵌入功能。
·使用Word2Vec和GloVe生成词嵌入。
·使用NLTK、Gensim和Glove-Python库用于文本预处理以及生成词嵌入。
本章旨在为你提供自然语言处理基础知识以及深度学习中使用的各种文本预处理技术。
1.1 本章概览
本书将指导你理解和优化深度学习技术,以进行自然语言处理,从而进一步推动强人工智能的实际应用。读者将了解自然语言处理的概念、应用和实现,并学习深度神经网络的方法,利用神经网络使机器理解自然语言。
1.2 自然语言处理的基础知识
为了便于理解,我们将这个术语分为两部分:
·自然语言是一种有机且自然发展而来的书面和口头交流形式。
·处理意味着使用计算机分析和理解输入数据。
如图1-1所示,自然语言处理是人类语言的机器处理,旨在教授机器如何处理和理解人类的语言,从而在人与机器之间建立一个简单的沟通渠道。
图1-1 自然语言处理
自然语言处理的应用很广泛,例如,在我们的手机和智能音箱中的个人语音助手,如Alexa和Siri。它们不仅能够理解我们的说话内容,而且能够根据我们说的话采取行动,并做出反馈。自然语言处理算法促进了这种与人类沟通的技术。
在上述自然语言处理定义中要考虑的关键是:沟通需要以人类的自然语言进行。几十年来,我们一直在与机器沟通:创建程序来执行某些任务并执行。然而,这些程序是用非自然语言编写的,因为它们不是口头交流的形式,也不是自然或有机发展而来的。这些语言,例如Java、Python、C和C++,都是在主要考虑机器的情况下创建的,并且始终考虑的是“机器能够轻松理解和处理的是什么?”
虽然Python是一种对用户更加友好的语言,且易于学习和编码,但与机器沟通,人类必须学习机器能够理解的语言。自然语言处理、机器学习、深度学习的关系如图1-2所示。
图1-2 自然语言处理的维恩图
自然语言处理的目的与此相反。自然语言处理不是以人类顺应机器的方式学习如何有效地与它们沟通,而是使机器能够与人类保持一致,并学习人类的交流方式。其意义更为重大,因为技术的目的本来就是让我们的生活更为轻松。
我们用一个例子来澄清这一点,你的第一个程序是一段让机器打印“hello world”代码。这是你顺应机器并要求它用其理解的语言执行任务。通过向其发出这个命令来要求你的语音助手说“hello world”,并做出“hello world”的反馈,就是自然语言处理应用的一个例子,因为你用自然语言与机器通信。机器符合你的沟通形式,理解你所说的内容,处理你要求它执行的操作,然后执行任务。
自然语言处理的重要性
图1-3说明了人工智能领域的各个部分。
图1-3 人工智能及其一些子领域
与机器学习和深度学习一样,自然语言处理是人工智能的一个分支,因为其处理自然语言,所以它实际上是人工智能和语言学的交叉。
如上所述,自然语言处理使机器能够理解人类的语言,从而在两者之间建立有效的沟通渠道。然而,自然语言处理的必要性还有另一个原因。那就是,像机器一样,机器学习模型和深度学习模型对数值数据最有效。数值数据对人类来说很难自然产生。很难想象我们用数字而不是语言交谈。因此,自然语言处理与文本数据一起工作,并将其转换成数值数据,从而使机器学习模型和深度学习模型能够适用于文本数据。因此,它的存在是为了通过从人类那里获取语言的口头和书面形式,并将它们转换成机器能够理解的数据,来弥合人类和机器之间的交流差距。得益于自然语言处理,机器能够理解并回答基于自然语言的问题、解决使用自然语言的问题以及用自然语言交流等。
1.3 自然语言处理的能力
自然语言处理有许多有益于人类生活的现实应用。这些应用程序属于自然语言处理的三大功能:
·语音识别
机器能够识别自然语言的口语形式,并将其翻译成文本形式。比如智能手机上的听写,你可以启用听写功能并对着手机说话,它会将你所说的一切转换成文本。
·自然语言理解
机器能够理解自然语言的口语和书面语。如果给机器一个命令,它就能理解并执行。例如,在你的手机上对Siri说“嘿,Siri,打电话回家”,Siri就会自动为你打电话回家。
·自然语言生成
机器能够自己生成自然语言。例如,在手机上对Siri说“Siri,现在几点了?”Siri回复说:“现在是下午2:08”。
这三种能力用于完成和自动化许多任务。让我们来看看自然语言处理的一些应用。
注意 文本数据被称为语料库(corpora)或一个语料(corpus)。
1.4 自然语言处理中的应用
图1-4描述了自然语言处理的一般应用领域。
图1-4 自然语言处理的应用领域
·自动文摘
包括对语料库生成摘要。
·翻译
要求有翻译工具,以从不同的语言翻译文本,例如,谷歌翻译。
·情感分析
这也被称为情感的人工智能或意见挖掘,它是从书面和口头语料库中识别、提取和量化情感和情感状态的过程。情感分析工具用于处理诸如客户评论和社交媒体帖子之类的事情,以理解对特定事物的情绪反应和意见,比如新餐厅的菜品质量。
·信息提取
这是从语料库中识别并提取重要术语的过程,称为实体。命名实体识别属于这一类,将在下一章中解释。
·关系提取
关系提取包括从语料库中提取语义关系。语义关系发生在两个或多个实体(如人、组织和事物)之间属于许多语义类别之一。例如,如果一个关系提取工具被赋予了关于Sundar Pichai的内容,以及他是谷歌的CEO,该工具将能够生成“Sundar Pichai就职于谷歌”作
....
本站仅展示书籍部分内容
如有任何咨询
请加微信10090337咨询