当前位置:
首页 > 计算机 > 数据库 > 大数据网络传播模型和算法pdf/doc/txt格式电子书下载

大数据网络传播模型和算法pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

大数据网络传播模型和算法pdf/doc/txt格式电子书下载

书名:大数据网络传播模型和算法pdf/doc/txt格式电子书下载

推荐语:国之重器出版工程,微软亚洲研究院专家帮助您深入细致地学习网络传播模型和算法

作者:陈卫著

出版社:人民邮电出版社

出版时间:2020-04-01

书籍编号:30611924

ISBN:9787115525543

正文语种:中文

字数:276036

版次:1

所属分类:计算机-数据库

全书内容:

大数据网络传播模型和算法pdf/doc/txt格式电子书下载








内容提要


信息和影响力在人际网络中的传播无处不在。大规模社交网络平台的普及和大数据技术的应用为研究信息和影响力在网络中的传播提供了全新的机会。本书系统总结了信息和影响力传播模型和算法方面的近二十年的研究成果。在传播模型方面,本书详细介绍了若干经典的随机传播模型,准确论述了模型之间的关系和模型的主要性质。在传播算法方面,本书以影响力最大化为主线,介绍了适用于不同场景的基于影响力传播的优化问题和算法。此外,本书也介绍了其他传播模型和基于数据的网络传播的推断和学习方法等。本书以扎实的理论论述为基础,将基础理论与多方面的应用背景结合,并介绍了相关方面的最新研究成果。

《国之重器出版工程》


编 辑 委 员 会


编辑委员会主任:苗 圩


编辑委员会副主任:刘利华 辛国斌


编辑委员会委员:


冯长辉 梁志峰 高东升 姜子琨 许科敏


陈 因 郑立新 马向晖 高云虎 金 鑫


李 巍 高延敏 何 琼 刁石京 谢少锋


闻 库 韩 夏 赵志国 谢远生 赵永红


韩占武 刘 多 尹丽波 赵 波 卢 山


徐惠彬 赵长禄 周 玉 姚 郁 张 炜


聂 宏 付梦印 季仲华


专家委员会委员(按姓氏笔画排列):


于 全 中国工程院院士


王 越 中国科学院院士、中国工程院院士


王少萍 “长江学者奖励计划”特聘教授


王建民 清华大学软件学院院长


王哲荣 中国工程院院士


尤肖虎 “长江学者奖励计划”特聘教授


邓宗全 中国工程院院士


甘晓华 中国工程院院士


叶培建 中国科学院院士


朱英富 中国工程院院士


朵英贤 中国工程院院士


邬贺铨 中国工程院院士


刘大响 中国工程院院士


刘怡昕 中国工程院院士


刘韵洁 中国工程院院士


孙逢春 中国工程院院士


苏彦庆 “长江学者奖励计划” 特聘教授


苏哲子 中国工程院院士


李伯虎 中国工程院院士


李应红 中国科学院院士


李新亚 国家制造强国建设战略咨询委员会委员、中国机械工业联合会副会长


杨德森 中国工程院院士


张宏科 北京交通大学下一代互联网互联设备国家工程实验室主任


陆建勋 中国工程院院士


陆燕荪 国家制造强国建设战略咨询委员会委员、原机械工业部副部长


陈一坚 中国工程院院士


陈懋章 中国工程院 院士


金东寒 中国工程院院士


周立伟 中国工程院院士


郑纬民 中国计算机学会原理事长


郑建华 中国科学院院士


屈贤明 国家制造强国建设战略咨询委员会委员、工业和信息化部智能制造专家咨询委员会副主任


项昌乐 “长江学者奖励计划” 特聘教授,中国科协书记处书记,北京理工大学党委副书记、副校长


柳百成 中国工程院院士


闻雪友 中国工程院院士


徐德民 中国工程院院士


唐长红 中国工程院院士


黄维中 国科学院院士、西北工业大学常务副校长


黄卫东 “长江学者奖励计划” 特聘教授


黄先祥 中国工程院院士


董景辰 工业和信息化部智能制造专家咨询委员会委员


焦宗夏 “长江学者奖励计划” 特聘教授

丛书总序


大数据、人工智能、云计算、物联网、移动互联网和产业互联网等成为新一代信息技术的特征,其中大数据与上述技术和应用都有密切关系。大数据来自于移动互联网、产业互联网和物联网等,其存储需要云计算,其挖掘依靠人工智能,而人工智能也有赖于大数据的支撑,大数据是产业互联网的重要基础。大数据不仅可以用于社会的精细化管理,更好地服务民生,大数据产业也将形成信息产业新的分支,其间接的产业影响将更大。可以说,大数据是数字经济的重要支柱。


很多国家都将大数据作为新时期的国家发展战略。2015年,国务院印发大数据发展的首个权威性、系统性文件《促进大数据发展行动纲要》,2016年国家发展和改革委员会批复了13个大数据领域的国家工程实验室,我国一些省市也纷纷制定大数据发展战略与规划。当前,我国在大数据共享开放、大数据资源开发、大数据技术研发、大数据挖掘应用、大数据产业培育、大数据安全管理、大数据人才培养和大数据法规研究等方面全面部署,为我国实现供给侧结构性改革,促进产业升级和转型,提升国家竞争力,争取在国际领域的话语权和实现跨越式发展起到了不可或缺的作用。


然而,我国的大数据发展也面临一些亟待解决的问题,例如基础研究薄弱、创新能力不强、产业链条缺口、数据资源封闭、法律法规滞后、数据安全不力、数据人才短缺和数据设施布局不合理及利用率不高等。为了使我国的大数据应用与产业可持续健康发展,需要多管齐下,其中普及大数据科学是重要的一环。为此,《学术中国·大数据》丛书编委会组织多个大数据领域优秀的研究团队的专家,基于国家“973”计划、“863”计划、国家自然科学基金、国家重点研究计划等科研项目的创新研究成果和国内外大数据应用的成功实践,编写了这套丛书,内容涵盖大数据存储、数据管理、数据挖掘、分析平台、优化算法等核心技术领域。


本丛书的出版对传播大数据科学知识、推动大数据的学术探讨、鼓励大数据领域的产学研用协同创新、促进大数据标准化研究、加快大数据核心技术研发、培训大数据技术人才、引导大数据应用与产业化发展以及完善大数据有关的制度建设,都将起到积极作用。

大数据网络传播模型和算法pdf/doc/txt格式电子书下载

2017年12月

前言


任何社会性动物在个体与个体、群体与个体之间都存在着相互影响的关系,例如个体依从群体的行为会有利于猎食或减少被猎食的可能。而人类作为具有复杂交流手段的高级社会性动物,人际和社会影响力(Social Influence)在人们的社会生活中更是无处不在。小到听一首歌曲、看一部电影、读一本新书、选一个餐馆,大到买一处房产、选择职业方向、选择生活的城市、确定政治观点等,我们的各种选择和决定常常受到家人、同事、朋友以及更广泛的大众倾向的影响。深入认识影响力的产生和传播模式有助于理解人类群体和个体的行为,从而使我们能够预测人们的行为,为政府、机构、企业等部门的决策提供可靠的依据和建议。比如企业在做新产品推广时,可以利用对用户影响力及其传播的了解,选择有影响力的用户和传播渠道,从而帮助产品推广;公益机构可以通过影响力传播推动公益事业的发展,比如增强全民健康意识,推动扶助贫困地区等;政府可以选择合适的影响力群体和渠道来扩大其政策的影响或抵御谣言的传播。很多通俗畅销书对影响力、社交网络及其对社会生活各方面的重要性进行了广泛的讨论[1]


社会影响力的研究在社会科学和市场学领域已有较长的历史,奠定了影响力传播研究的基础。比如Christakis和Fowler利用美国一个城市上万人32年的医疗记录数据验证了肥胖症和吸烟行为会在社交网络中相互影响和传播[2]。而伴随着互联网、在线社交网络和大数据的兴起及其日益广泛的应用,在更大规模下更深入地研究影响力的传播也成为可能。比如基于著名的社交网站脸书(Facebook)平台展开的两项大数据研究通过在线随机实验的方式,分别验证了影响力在选举意愿和应用选择中的存在性及其决定性因素[3]


对信息和影响力在网络中传播的研究属于典型的交叉学科研究领域。研究者们可以从计算机科学、复杂网络、统计物理、概率论、社会学、心理学、管理科学等多个角度对其各个方面进行研究探索。本书主要从计算机科学的视角,介绍、讨论影响力网络传播研究方面主要的研究成果,并辅助介绍相关的复杂网络等方面的成果。与其他学科领域相比,计算机科学研究的一个主要特点是强调算法的设计和分析,这也是贯穿本书的主要线索。正如本书的题目所示,本书的阐述主要围绕影响力网络传播的两个方面——模型和算法进行。我们先介绍影响力传播的基本模型,再介绍在基本模型上的主要优化问题及其算法;介绍完基本的模型和算法后,进一步展开介绍各种拓展模型及其在拓展模型上的优化算法。由于算法要在大数据环境下适用于大规模的网络,因此我们会专门详细介绍高效可扩展的优化算法的设计及其分析。


本书的写作力求在严谨地表述传播模型和算法的同时,给读者一些直观的洞见和启发,使读者了解一些模型和算法背后的思想和方法。本书涵盖了计算机科学领域在近20年中研究影响力传播的主要结果以及作者在这方面近期的一些研究成果。由于篇幅有限,而且这个领域的范围广泛并在不断更新,作者选择了一些主要的内容加以细致讨论,而其他相关内容以每章结尾的文献小结形式加以总结,并适当提示了一些可能的进一步研究方向。有些章节还加入了作者本人对相应问题的进一步理解和思考,超出了原始文献的讨论范围。


本书面向的读者首先包括广大对影响力和网络研究感兴趣或已投入研究的学者、专家和学生,希望这些读者能通过本书对这一领域有较为全面的、系统的了解,并从中找到感兴趣的进一步研究的方向。其次,本书对于众多业界的实践者(如大数据工程师、网络分析师等)了解这一仍在快速成长的领域也很有益处,这些读者可以从中了解网络传播研究的背景、基本问题和最新动态,从而发现有可能与实践相结合的机会。本书也可以作为高校网络科学和大数据技术课程的一部分授课内容。


本书的组织结构如下。第1章抽象概括了传播模型的一般形式,并对本书后续论述的模型在这个一般形式下加以分类。第2章详细介绍了影响力传播的基本模型,包括在后文中以及在整个研究领域中经常用到的独立级联模型、线性阈值模型、触发模型、通用阈值模型等,并介绍了与算法设计密切相关的传播模型的单调性和次模性。第3章集中介绍了基本影响力传播模型下的影响力扩展度计算问题,这一计算问题为后面的优化问题打下了基础。第4章介绍了影响力传播研究中的一个核心问题,即影响力最大化问题。简单地说,这个问题就是要在给定的网络和传播模型下,找到一定数量的结点使得它们的传播效果最好。这个问题直接对应了网络中的病毒式营销应用,它的变种也在其他方面(如信息传播监控、流言控制等)有很多应用。这一章着重论述了影响力最大化的计算复杂性及其主要近似算法,花了很大篇幅给出了一个高效可扩展的影响力最大化算法的完整分析,以及与其他算法的比较。作者希望这个详尽的分析讨论会对有志于从事这方面研究的学者和学生有很好的帮助,因而也可以说第4章是本书的一个核心章节。第5章将影响力最大化在一般单实体传播模型中进一步拓展,讨论了7个影响力最大化的拓展问题,这些都是当前学术界仍然很活跃的研究方向。第6章介绍了多实体的传播模型,这个方向涵盖了多实体相互竞争或相互补充的传播模型,并讨论了多实体传播模型下次模性质的变化和对算法设计的影响。第7章简要介绍了在文献中出现的其他传播模型,比如选举模型(Voter Model)、传染病模型、基于博弈论的模型等,也介绍了复杂网络研究中的一个重要课题,即网络传播的相变分析。第8章概述了网络传播中基于数据挖掘的若干方向,如影响力传播模型学习、传播源头推断等。结束语部分对本书做了一个总结,并简要讨论了该领域的进一步发展方向。本书的附录给出了书中常用的符号列表,以便于读者阅读查找。在所有技术章节的结尾,作者专门附上一节文献小结和补充资料,介绍本章主要内容的出处和扩展阅读资料,也提出了一些可以进一步研究的开放问题。


影响力的研究和应用是一个涵盖范围很广的课题,本书不可能覆盖其中所有的方面和文献,但作者尽量做到在突出重点的同时包括尽可能多的相关方向和资料。关于这个领域也有其他的综述文章和专著,其中作者和Lakshmanan、Castillo合著的《Information and Influence Propagation in Social Networks》是这方面的第一本专著,但从其成书的2013年到现在,这个方向又有了很多发展,因此本书包括很多上述专著没有包含的内容,如基于反向影响力采样的可扩展算法、自适应影响力最大化、在线影响力最大化等。其他的综述文章也简要介绍了这个领域一个或多个方向的近期研究结果[4],读者可参考阅读,相互印证。另外,网络科学是一个包含网络影响力传播的更大的研究领域,对于这一领域,作者建议读者参考阅读这方面的经典教科书[5]


本书包括了作者与众多合作者的研究成果。在此作者对所有的合作者表示由衷的感谢。在成书过程中,作者与李建、彭炳辉、赵浩宇等人的讨论帮助改进了书中的某些理论分析。左金航、盛翊伦等人帮助校对了部分章节。在此作者对这些人的帮助一并表示感谢。


陈 卫


2019年11月


注释

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示