当前位置:
首页 > 互联网+ > 人工智能 > OpenCV计算机视觉编程攻略(第3版)pdf/doc/txt格式电子书下载

OpenCV计算机视觉编程攻略(第3版)pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

OpenCV计算机视觉编程攻略(第3版)pdf/doc/txt格式电子书下载

书名:OpenCV计算机视觉编程攻略(第3版)pdf/doc/txt格式电子书下载

推荐语:OpenCV3编程入门及算法精解教程人工智能开发教程人脸识别三维重建图形图像识别方法

作者:(加)罗伯特·拉戈尼尔(RobertLaganière),相银初译

出版社:人民邮电出版社

出版时间:2018-05-01

书籍编号:30443748

ISBN:9787115480934

正文语种:中文

字数:237591

版次:1

所属分类:互联网+-人工智能

全书内容:

OpenCV计算机视觉编程攻略(第3版)pdf/doc/txt格式电子书下载






译者序


计算机视觉:人工智能的眼睛


如今科技界最热门的词语,非人工智能莫属。人工智能就是要让机器跟人一样,能听懂,能看懂,会思考。在这些技能中,“看懂”是最重要的,因为不管是在现实世界还是网络空间中,大部分信息都是通过视觉获取的。“一图胜千言”说的就是这个道理。如果看不懂外部世界,不能感知外部场景的变化并做出反应,是很难称为“智能”的。


计算机视觉就是人工智能的眼睛,是机器认识世界、感知变化的窗口,让机器能真正看懂外部世界。在工商业领域,计算机视觉的应用越来越多,比如人们用它来识别图片或视频中有没有人,判断图中的人是谁,判断前方有没有车辆或行人、有什么交通标志,等等。


本书特色


本书全面而系统地介绍了计算机视觉领域最著名的开源程序库——OpenCV。本书不只是简单列出了各种函数和类,而是由浅入深地介绍了OpenCV及有关算法,并通过详细的实用案例,让读者从零开始学习计算机视觉和OpenCV,真正掌握相关程序的开发方法。


通过阅读本书,你将了解计算机视觉的基础知识,知道有关算法的来龙去脉,掌握OpenCV的总体架构和常用功能,学会用OpenCV解决具体问题。本书将带你进入图像和视频分析的世界,揭开图像识别、三维重建、目标跟踪、人脸识别等技术的神秘面纱。


第3版简介


这几年计算机视觉领域发展迅猛,OpenCV也在持续升级。本书第3版针对OpenCV最新版本进行了修改,调整了很多函数和算法说明,还增加了立体图像深度检测、运动目标跟踪、人脸识别、人脸定位、行人检测等内容。


致谢


本书的翻译得到了朱巍老师的支持和帮助,在此表示感谢。由于本人水平有限,书中难免有疏忽和错误,恳请读者朋友们批评指正。


2018年1月于深圳

  • 本书中文版的读者可免费注册iTuring.cn,至本书页面(http://www.ituring.com.cn/book/1962)下载。——编者注
  • 中文版勘误请至本书页面(http://www.ituring.com.cn/book/1962)查看和提交。——编者注
    前言
    如今,计算机视觉和图像分析技术的应用越来越广泛,例如增强现实、辅助驾驶、视频监控等,但是要让计算机真正看懂现实世界,还有大量的工作要做。随着高性能又廉价的计算设备和视觉传感器的出现,创建复杂的图像处理程序比以往任何时候都要容易。虽然在图像和视频处理领域有很多软件工具和库可以选用,但如果想开发出智能的计算机视觉程序,OpenCV是很好的选择。
    OpenCV(Open source Computer Vision)是一个开源程序库,包含了500多个用于图像和视频分析的优化算法。该程序库建立于1999年,目前在计算机视觉领域的研发人员社区中非常流行,被用作主要开发工具。OpenCV最初由英特尔公司的Gary Bradski带领一个小组开发,其目的是推动计算机视觉的研究,促进基于大量视觉处理、CPU密集型应用程序的开发。在一系列beta版本后,1.0版于2006年发布。第二个重要版本是2009年发布的OpenCV 2,它做了一些重要改动,特别是本书所用的新C++接口。OpenCV于2012年改组为一个非营利基金会(http://opencv.org/),依靠众筹进行后续开发。
    OpenCV在2013年升级到OpenCV 3,主要的变化是提升了易用性。此外,OpenCV的结构也有所调整,去掉了一些不必要的依赖项,一些较大的模块被分割成多个小模块,还简化了API。本书为《OpenCV计算机视觉编程攻略》的第3版,首次引入了OpenCV 3的内容,并且对旧版本中的所有编程方法进行了审核和更新,还增加了很多新内容以更全面地覆盖程序库的主要功能点。本书介绍了程序库的很多功能,并且讲述了如何使用这些功能完成特定的任务,这样做并不是为了详细罗列OpenCV中的所有函数和类,而是为读者提供从零起步开发应用的方法。本书还探讨了图像分析的基本概念,介绍了计算机视觉的一些重要算法。
    本书将带你走进图像和视频分析的世界,但这只是个开始,因为OpenCV还在不断地演变和扩展。你可以访问OpenCV的在线文档(http://opencv.org/)获取最新资料,也可以访问本书作者的个人网站www.laganiere.name了解有关本书的最新信息。
    内容速览
    第1章将介绍OpenCV库,演示如何构建一个可以读取并显示图像的简单应用,并介绍基本的OpenCV数据结构。
    第2章将解释读取图像的过程,描述扫描图像的不同方法,让你能在每一个像素上执行操作。
    第3章涵盖各种面向对象设计模式的使用案例,这些设计模式能帮助你更好地构建计算机视觉程序。这一章也将讨论图像中有关颜色的概念。
    第4章将解释如何计算图像的直方图,以及如何用直方图修改图像。这一章还将介绍基于直方图的各种应用,包括图像分割、目标检测和图像检索。
    第5章将探讨数学形态学的概念,展示不同的算子,并解释如何用这些算子检测图像中的边界、角点和区段。
    第6章将讲解频率分析和图像滤波的原理,介绍低通滤波器和高通滤波器在图像处理中的应用,并介绍导数算子的概念。
    第7章将重点介绍几何图像特征的检测方法,解释如何提取图像中的轮廓、直线和连续区域。
    第8章将介绍图像的几种特征点检测器。
    第9章将解释如何计算兴趣点描述子,并用其在图像之间匹配兴趣点。
    第10章将探讨同一场景中两个图像之间的投影关系,以及如何从图像中检测出特定的目标。
    第11章将介绍如何重构三维场景,即利用多个图像重构某个场景的三维元素,并还原出相机的姿态。本章还将讲解相机标定的过程。
    第12章将提出一个读写视频序列和处理帧的框架,并且展示如何提取在摄像机前移动的前景物体。
    第13章将介绍跟踪运动目标的方法,包括如何计算视频中的表观运动,如何跟踪图像序列中的运动物体。
    第14章将介绍机器学习的基本概念,并利用图像样本构建物体分类器。
    阅读须知
    本书基于OpenCV库的C++ API展开介绍,因此你需要有使用C++语言的经验。另外,你还需要一个良好的C++开发环境以便运行和试用书中的例子,常用的开发环境有Microsoft Visual Studio和Qt。
    读者对象
    本书适合准备用OpenCV库开发计算机视觉应用的C++初学者,也适合想了解计算机视觉编程概念的专业软件开发人员。本书可作为大学计算机视觉课程的教材,也是一本非常优秀的参考书,可供图像处理和计算机视觉方面的研究生和科研人员使用。
    小标题
    本书将经常用到一些小标题(准备工作、如何实现、实现原理、扩展阅读、参阅)。为便于理解,对小标题的使用做出以下约定。
    准备工作
    这部分将对准备实现的功能做简要介绍,建立所需的软件环境并进行初步设置。
    如何实现
    这部分将讲解实现该功能的具体步骤。
    实现原理
    这部分将详细解释该功能的内部原理。
    扩展阅读
    这部分是补充知识,以便读者深入理解相关知识点。
    参阅
    这部分将列出一些相关的网址。
    排版规范
    本书使用不同的文本样式区分不同类型的内容,下面是一些样式示例和相关说明。
    程序代码、数据库的表、用户输入等内容以这种格式显示:“可以用include指令包含额外的内容。”
    代码块的格式为:
    // 用LaplacianZC类计算拉普拉斯值
    LaplacianZC laplacian;
    laplacian.setAperture(7); // 7×7拉普拉斯算子
    cv::Mat flap= laplacian.computeLaplacian(image);
    laplace= laplacian.getLaplacianImage();
    需要特别注意的代码行,用加粗字体表示:
    // 用LaplacianZC类计算拉普拉斯值
    LaplacianZC laplacian;
    laplacian.setAperture(7); // 7×7拉普拉斯算子
    cv::Mat flap= laplacian.computeLaplacian(image);
    laplace= laplacian.getLaplacianImage();
    新名词和重要内容会用黑体字表示。屏幕上菜单或对话框的显示形式为:“点击下一步进入下个页面。”
    读者反馈
    我们一贯欢迎读者的反馈意见。请告诉我们你对本书的看法,喜欢或不喜欢哪些内容。这些反馈能帮助我们创作出真正对读者有所裨益的内容。
    一般性的反馈意见,请直接发邮件到mailto:feedback@packtpub.com,并在邮件标题中注明书名。
    如果你是某一方面的专家并愿意参与写作或合作著书,请访问www.packtpub.com/authors查看作者指南。
    客户支持
    现在你已经拥有了一本由Packt出版的书,为了让你的付出得到最大的回报,我们还为你提供了其他许多方面的服务,请注意以下信息。
    下载代码
    你可以用http://www.packpub.comd的账号下载本书代码。如果你是从其他地方购买的本书英文版,那么可以访问http://www.packtpub.com/support并注册,然后会通过邮件接收到文件。
    下载代码文件的步骤如下所示。
    (1) 使用E-mail和密码登录网站。
    (2) 鼠标移动到SUPPORT标签。
    (3) 点击Code Downloads & Errata。
    (4) 根据书名搜索。
    (5) 选择需要下载代码的图书。
    (6) 在下拉列表中选择图书的购买方式。
    (7) 点击Code Download。
    也可以在Packt Publishing网站搜索本书,进入本书页面后点击Code Files下载代码。注意,登录后才能进行有关操作。
    可以用以下工具解压代码:
    WinRAR / 7-Zip (Windows);
    Zipeg / iZip / UnRarX (Mac);
    7-Zip / PeaZip (Linux)。
    此外还可以在https://github.com/PacktPublishing/OpenCV3-Computer-Vision-Application-Programming-Cookbook-Third-Edition下载代码。https://github.com/PacktPublishing/上还有其他图书的代码,欢迎下载。
    访问本书作者的代码库https://github.com/laganiere也能下载到最新代码。
    下载书中的彩色图片
    为方便读者理解输出中的变化,我们已将书中用到的截图、图表等彩色图片做成了一个PDF文件。要下载该PDF文件,可以访问https://www.packtpub.com/sites/default/files/downloads/OpenCV3ComputerVisionApplicationProgrammingCookbookThirdEditionColorImages.pdf。
    勘误
    我们已经尽最大努力确保内容准确,但错误仍在所难免。如果你发现书中有错(文字或代码错误),请告诉我们,这可免于让其他读者产生困惑,也可帮助我们在后续版本中加以改进。发现错误后,请访问http://www.packtpub.com/submit-errata,选择对应的图书,点击链接errata submission form(提交勘误表)登记错误详情。勘误通过核实后,你提交的错误信息会上传到网站或添加到该书已有的勘误表中。你可以在http://www.packtpub.com/support中通过书名查看已有的勘误表。
    举报盗版
    网络盗版是个老问题了。Packt非常重视版权和许可。如果你在网上见到我们作品的任何形式的非法复制品,请将网址或网站名称及时告知我们,以便我们
  • ....

    本站仅展示书籍部分内容

    如有任何咨询

    请加微信10090337咨询

    本站仅展示书籍部分内容
    如有任何咨询

    请加微信10090337咨询

    再显示