机械工业出版社 2014
丛书名:大数据丛书
主题词: 数据管理
简介:本书分为四部分,高屋建瓴地阐述了在大型组织环境中,不同计算机系统之间传输数据,以及将异构数据进行集成所用到的技巧、技术和最佳实践,内容涵盖数据集成导论、批处理数据集成、实时数据集成和大数据集成等。
电子工业出版社 2016
丛书名:大数据丛书
主题词: 数据处理
简介:随着大数据分析方法的发展, 分析工具的改进, 大数据分析的门槛降低了。基于大数据算法平台, 数据分析师们已经不再被数据的“大”所困扰, 可以轻松地探索大数据, 挖掘大数据的价值。本书侧重介绍大数据分析方法和算法的应用, 适合对大数据分析感兴趣的读者阅读。在内容的组织上, 选取了10个不同领域的真实数据集, 针对每个数据的特点, 选择适合的方法和算法, 和读者一起体验数据探索、数据分析、建模预测的过程; 通过实例计算的结果, 读者会更加了解各种方法和算法的长处和局限。本书的实例都运行在大数据算法平台XLab上。
机械工业出版社 2017
丛书名:大数据丛书
主题词: 人工智能
简介:理论结果表明, 为了学习用于表示高层次的抽象 (例如视觉、语言以及其他AI级别的任务) 的复杂函数, 我们需要深度结构。深度结构的组成包括了多层次的非线性操作, 比如具有许多隐含层的神经网络, 或者重用了许多子公式的复杂命题公式。搜索深度结构的参数空间是一件很困难的任务, 但是最近提出的诸如用于深度信念网络等的学习算法, 对于探索这类问题取得了显著的成功, 在某些领域达到了最新的水平。本书讨论深度学习算法的方法和原理, 尤其是那些被充分用作基石的单层模型的非监督学习算法例如受限玻尔兹曼机 (RBM), 它用于构建深度信念网络等深度模型。
电子工业出版社 2019
丛书名:大数据丛书
主题词: 数据处理软件
简介:本书介绍了实时数据处理引擎Flink,讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理,以及指标度量与部署模式,分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联和关系,深入分析了多项式曲线拟合、分类算法、推荐算法的理论和FlinkML实现。
电子工业出版社 2019
丛书名:大数据丛书
主题词: 数据处理软件
简介:本书介绍了当下最流行的实时数据处理引擎Flink, 讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理FLinkCEP, 以及指标度量与部署模式。此外, 本书展开分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联关系; 深入分析了多项式曲线拟合、分类算法SVM、推荐算法ALS-WR的理论和FlinkML实现。希望快速上手Flink以开展实时大数据处理与在线机器学习应用的从业者, 本书是不二的选择: 本书首先介绍相关概念引入的原因、解决方案的演进过程、Flink的对应架构、编程案例以及开放式的思考问题。