《智能Web算法》

《智能Web算法》 《智能Web算法》

  • 书名:《智能Web算法》
  • 分类:国际互联网
  • 作者:Haralambos Marmanis,Dmitry Babenko
  • 出版社:电子工业出版社
  • 出版年:2011-11
  • 售价:65.00元
  • 装订:平装
  • 页码:374

《智能Web算法》 内容介绍:

本书涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web应用中的角色及要注意的问题。除了第1章的概要性介绍以及第7章对所有技术的整合应用外,第2~6章以代码示例的形式分别对这五类算法进行了介绍。 本书面向的是广大普通读者,特别是对算法感兴趣的工程师与学生,所以对于读者的知识背景并没有过多的要求。本书中的例子和思想应用广泛,所以对于希望从业务角度更好地理解有关技术的技术经理、产品经理和管理层来说,本书也有一定的价值。

作者Haralambos Marmanis,Dmitry Babenko介绍:

Haralambos (Babis) Marmanis 博士是一个把机器学习技术应用于工业界的先行者,也是供应管理的世界级专家。Dmitry Babenko曾经为银行、保险、供应链管理与商务智能公司设计过应用与基础架构。 本书拥有者可以通过 www.manning.com/AlgorithmsoftheIntelligentWeb在线获得作者的信息、样例代码与免费的电子版本。 Dr. Haralambos (Babis) Marmanis is a pioneer in the adoption of machine learning techniques for industrial solutions, and also a world expert in supply management. He has about twenty years of experience in developing professional software. Currently, he is the director of R&D and chief architect, for expense management solutions, at Emptoris, Inc. Babis holds a Ph.D. in applied mathematics from Brown University, an M.S. degree in theoretical and applied mechanics from the University of Illinois at Urbana-Champaign, and B.S. and M.S. degrees in civil engineering from the Aristotle University of Thessaloniki in Greece. He was the recipient of the Sigma Xi award for innovative research in 2000, and he is the author of numerous publications in peer-reviewed international scientific journals, conferences, and technical periodicals. Dmitry Babenko is the lead for the data warehouse infrastructure at Emptoris, Inc. He is a software engineer and architect with 13 years of experience in the IT industry. He has designed and built a wide variety of applications and infrastructure frameworks for banking, insurance, supply-chain management, and business intelligence companies. He received a M.S. degree in computer science from Belarussian State University of Informatics and Radioelectronics.

《智能Web算法》 目录大纲:

前言 XV
致谢 XIX
关于本书 XXI
1 什么是智能Web? 1
1.1 智能Web应用实例 3
1.2 智能应用的基本要素 4
1.3 什么应用会受益于智能? 5
1.3.1 社交网络 6
1.3.2 Mashup 7
1.3.3 门户网站 8
1.3.4 维基 9
1.3.5 文件分享网站 9
1.3.6 网络游戏 11
1.4 如何构建智能应用? 11
1.4.1 检查功能和数据 12
1.4.2 获取更多的数据 12
1.5 机器学习、数据挖掘及其他 16
1.6 智能应用中八个常见的误区 17
1.6.1 误区1:数据是可靠的 18
1.6.2 误区2:计算能马上完成 19
1.6.3 误区3:不用考虑数据规模 19
1.6.4 误区4:不考虑解决方案的可扩展性 19
1.6.5 误区5:随处使用同样的方法 19
1.6.6 误区6:总是能知道计算时间 20
1.6.7 误区7:复杂的模型更好 20
1.6.8 误区8:存在无偏见的模型 20
1.7 小结 20
1.8 参考资料 21
2 搜索 22
2.1 用Lucene实现搜索 23
2.1.1 理解Lucene代码 24
2.1.2 搜索的基本步骤 31
2.2 为什么搜索不仅仅是索引? 33
2.3 用链接分析改进搜索结果 35
2.3.1 PageRank简介 35
2.3.2 计算PageRank向量 37
2.3.3 alpha:网页间跳转的影响 38
2.3.4 理解幂方法 40
2.3.5 结合索引分值和PageRank分值 45
2.4 根据用户点击改进搜索结果 47
2.4.1 用户点击初探 48
2.4.2 朴素贝叶斯分类器的使用 50
2.4.3 整合Lucene索引、PageRank和用户点击 54
2.5 Word、PDF等无链接文档的排序 58
2.5.1 DocRank算法简介 58
2.5.2 DocRank的原理 60
2.6 大规模实现的有关问题 65
2.7 用户得到了想要的结果吗?精确度和查全率 67
2.8 总结 69
2.9 To Do 70
2.10 参考资料 72
3 推荐系统 73
3.1 一个在线音乐商店:基本概念 74
3.1.1 距离与相似度的概念 75
3.1.2 走近相似度的计算 80
3.1.3 什么才是最好的相似度计算公式? 83
3.2 推荐引擎是怎么工作的 84
3.2.1 基于相似用户的推荐 85
3.2.2 基于相似条目的推荐 94
3.2.3 基于内容的推荐 98
3.3 推荐朋友、文章与新闻报道 104
3.3.1 MyDiggSpace.com简介 105
3.3.2 发现朋友 106
3.3.3 DiggDelphi的内部工作机制 108
3.4 像Netflix.com那样推荐电影 114
3.4.1 电影数据集的介绍及推荐器 114
3.4.2 数据标准化与相关系数 117
3.5 大规模的实现与评估 123
3.6 总结 124
3.7 To Do 125
3.8 参考资料 127
4 聚类:事物的分组 128
4.1 聚类的需求 129
4.1.1 网站中的用户组:案例研究 129
4.1.2 用SQL order by子句分组 131
4.1.3 用数组排序分组 132
4.2 聚类算法概述 135
4.2.1 基于分组结构的聚类算法分类 136
4.2.2 基于数据类型和结构的聚类算法分类 137
4.2.3 根据数据规模的聚类算法分类 137
4.3 基于链接的算法 138
4.3.1 树状图:基本的聚类数据结构 139
4.3.2 基于链接的算法概况 141
4.3.3 单链接算法 142
4.3.4 平均链接算法 144
4.3.5 最小生成树算法 147
4.4 k-means算法 149
4.4.1 初识k-means算法 150
4.4.2 k-means的内部原理 151
4.5 鲁棒的链接型聚类(ROCK) 153
4.5.1 ROCK简介 154
4.5.2 为什么ROCK这么强大? 154
4.6 DBSCAN 159
4.6.1 基于密度的算法简介 159
4.6.2 DBSCAN的原理 162
4.7 超大规模数据聚类 165
4.7.1 计算复杂性 166
4.7.2 高维度 167
4.8 总结 168
4.9 To Do 169
4.10 参考资料 171
5 分类:把事物放到它该在的地方 172
5.1 对分类的需求 173
5.2 分类器的概述 177
5.2.1 结构分类算法 178
5.2.2 统计分类算法 180
5.2.3 分类器的生命周期 181
5.3 邮件的自动归类与垃圾邮件过滤 182
5.3.1 朴素贝叶斯分类 184
5.3.2 基于规则的分类 197
5.4 用神经网络做欺诈检测 210
5.4.1 交易数据中关于欺诈检测的一个用例 210
5.4.2 神经网络概览 212
5.4.3 一个可用的神经网络欺诈检测器 214
5.4.4 神经网络欺诈检测器剖析 218
5.4.5 创建通用神经网络的基类 226
5.5 你的结果可信吗? 232
5.6 大数据集的分类 235
5.7 总结 237
5.8 To Do 239
5.9 参考资料 242
6 分类器组合 244
6.1 信贷价值:分类器组合案例研究 246
6.1.1 数据的简要说明 247
6.1.2 为真实问题生成人工数据 250
6.2 用单分类器做信用评估 255
6.2.1 朴素贝叶斯的基准线 255
6.2.2 决策树基准线 258
6.2.3 神经网络的基准线 260
6.3 在同一个数据集中比较多个分类器 263
6.3.1 McNemar检验 264
6.3.2 差额比例检验 266
6.3.3 Cochran Q检验与F检验 268
6.4 bagging: bootstrap聚合(bootstrap aggregating) 270
6.4.1 bagging实例 272
6.4.2 bagging分类器底层细节 274
6.4.3 分类器集成 276
6.5 boosting:一种迭代提高的方法 279
6.5.1 boosting分类器实例 280
6.5.2 boosting分类器底层细节 282
6.6 总结 286
6.7 To Do 288
6.8 参考资料 292
7 智能技术大汇集:一个智能新闻门户 293
7.1 功能概览 295
7.2 获取并清洗内容 296
7.2.1 各就位、预备、开抓! 296
7.2.2 搜索预备知识回顾 298
7.2.3 一个抓取并处理好的新闻数据集 299
7.3 搜索新闻 301
7.4 分配新闻类别 304
7.4.1 顺序问题 304
7.4.2 使用NewsProcessor类进行分类 309
7.4.3 分类器 310
7.4.4 分类策略:超越底层的分类 313
7.5 用NewsProcessor类创建新闻分组 316
7.5.1 聚类全部文章 317
7.5.2 在一个新闻类别中聚类文章 321
7.6 基于用户评分的动态内容展示 325
7.7 总结 328
7.8 To Do 329
7.9 参考资料 333
附录A BeanShell简介 334
A.1 什么是BeanShell? 334
A.2 为什么使用BeanShell? 335
A.3 运行BeanShell 335
A.4 参考资料 336
附录B 网络采集 337
B.1 爬虫组件概况 337
B.1.1 采集的步骤 338
B.1.2 我们的简单爬虫 338
B.1.3 开源Web爬虫 339
B.2 参考资料 340
附录C 数学知识回顾 341
C.1 向量和矩阵 341
C.2 距离的度量 342
C.3 高级矩阵方法 344
C.4 参考资料 344
附录D 自然语言处理 345
D.1 参考资料 347
附录E 神经网络 348
E.1 参考资料 349
索引 350


微信扫一扫关注公众号

0 个评论

要评论图书请先登录注册

你也许想看:

物联网关键技术及系统应用

《物联网关键技术及系统应用》

张鸿涛, 徐连明, 张一文等编著.机械工业出版社.2012

“张鸿涛、徐连明、王小湘等编著的《物联网关键技术及系统应用》系统地介绍了物联网的概念、架构、实现技术及典型应用。首先讨论了...”

物联网的开发与应用实践

《物联网的开发与应用实践》

王仲东, 黄俊桥编著.机械工业出版社.2014

“本书是一本实践性较强的关于物联网开发与实践的书籍。本书在介绍了物联网基本知识、EPC与RFID技术、传感器技术及接口之后...”

P2P技术全面解析

《P2P技术全面解析》

张春红 ... 等编著..2010

“《P2P技术全面解析》对P2P技术进行了全面而又深入的讲解,内容涵盖了P2P的基础知识:P2P概述、无结构的P2P系统、...”

P2P对等网络原理与应用

《P2P对等网络原理与应用》

蔡康 ... [等] 编著..2011

“蔡康编著的《P2P对等网络原理与应用》较为系统地介绍了P2P的理论基础,对P2P的基础路由,如DHT算法、DHT性能作了...”

P2P技术揭秘

《P2P技术揭秘》

管磊..2011-1

“《P2P技术揭秘:P2P网络技术原理与典型系统开发》从一个全新的视角向读者展示了从P2P初步入门到应用实践的学习之路。《...”

物联网支撑技术

《物联网支撑技术》

张德干著..2011

“《物联网支撑技术》内容简介:物联网是下一代Internet的重要组成部分,有助于实现任何时刻、任何地点、任何人、任何物体...”

物联网基础与应用

《物联网基础与应用》

主编李蔚田..2012

“《全国本科院校电气信息类创新型应用人才培养规划教材:物联网基础与应用》本着科学性、理论性和实用性相结合、现实性和前瞻性相...”

Cisco网络技术教程

《Cisco网络技术教程》

王平, 魏大新, 李育龙编著..2012

“《Cisco网络技术教程(第3版)》作为思科认证体系中的入门级教材,主要讲述了网络的基本知识和思科设备的基本命令,以及路...”

安全的神话

《安全的神话》

John Viega著.东南大学出版社.2013

“如果你认为今天的互联网是安全的,那就再仔细思量一下这个结论,事实并非如此。如今有比从前更多的人上网——包括更多的坏蛋,这...”

网上冲浪快易通

《网上冲浪快易通》

康丞信息编著.中国铁道出版社.2005

“本书将引导您进入丰富多彩的Internet世界,在循序渐进的学习过程中,掌握浏览器使用、网络搜索、远程文件传输、电子邮件...”

互联网+

《互联网+》

阿里研究院.机械工业出版社.2015-4-1

“《互联网+:从IT到DT》内容简介:2015年,“互联网+”写入李克强总理的政府工作报告,“互联网+”成为国家经济社会发...”

物联网技术与应用

《物联网技术与应用》

石志国, 王志良, 丁大伟编著..2012

“《高等学校计算机科学与技术教材:物联网技术与应用》共10章分成三个部分,第一部分概述了物联网的发展历程、定义、体系结构等...”

JavaScript RIA开发实战

《JavaScript RIA开发实战》

(英)Dennis Odell.清华大学出版社.2010

“本书介绍如何采用最合理的方式为RIA编写可靠的、易于维护的HTML、CSS和JavaScript代码,以及如何使用Aja...”

物联网信息安全

《物联网信息安全》

于旭, 梅文编著..2014

“”

物联网组网技术

《物联网组网技术》

乔平安主编..2013

“《物联网组网技术(高等学校物联网专业系列教材)》全书共分10章,主要内容包括:绪论、物联网网络协议、IPv6技术、物联网...”

Web服务开发学习实录

《Web服务开发学习实录》

闫建强, 王瑞敬编著..2011

“《Web服务开发学习实录》以Web服务技术的原理为主线,详细讲解在.NET平台上的实现方式。内容涵盖Web服务的基础概念...”

物联网概论

《物联网概论》

张志勇 ... [等] 编著..2014

“”

物联网 : 连接一切物体的网络 : connecting objects to the Web

《物联网 : 连接一切物体的网络 : connecting objects to the Web》

(法) 哈基马·查奥奇编.国防工业.2011

“《物联网:连接一切物体的网络》特点:易读性较强。《物联网:连接一切物体的网络》主要从基本概念和原理对相关内容进行系统性介...”

物联网应用启示录 : 行业分析与案例实践

《物联网应用启示录 : 行业分析与案例实践》

陈海滢 ... 等编著.机械工业出版社.2011

“本书在内容上由理论推及应用,与产业实践结合紧密,重点较为突出,可供物联网企业以及政府机构等从事物联网研发、产业规划和应用...”

物联网的机遇与利用

《物联网的机遇与利用》

毛光烈著.中信出版社.2014

“”