大数据书单(100本)
大数据书单(100本)
序号 书名 作者 出版社
1 Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版) Tom White 清华大学出版社
2 Hive编程指南 卡普廖洛 (Edward Capriolo) / 万普勒 (Dean Wampler) / 卢森格林 (Jason Rutherglen) / 曹坤 人民邮电出版社
3 Hive性能调优实战 林志煌 机械工业出版社
4 大数据Hive离线计算开发实战 杨力 人民邮电出版社
5 HBase权威指南 [美] Lars George / 代志远 / 刘佳 / 蒋杰 东南大学出版社
6 HBase原理与实践 胡争 / 范欣欣 机械工业出版社
7 ZooKeeper : Distributed process coordination Flavio Junqueira / Benjamin Reed O’Reilly Media
8 Kafka权威指南 Neha Narkhede / Gwen Shapira / Todd Palino / 薛命灯 人民邮电出版社
9 深入理解Kafka与Pulsar:消息流平台的实践与剖析 梁国斌 电子工业出版社
10 Scala编程(第3版) 【德】Martin Odersky(马丁.奥德斯基) / 【美】Lex Spoon(莱·斯彭) / 【美】Bill Venners(比尔·凡纳斯) 电子工业出版社
11 Spark权威指南 Bill Chambers / Matei Zaharia 中国电力出版社
12 大数据处理框架Apache Spark设计与实现(全彩) 许利杰 / 方亚芬 电子工业出版社
13 图解Spark:核心技术与案例实战 郭景瞻 电子工业出版社
14 Spark SQL内核剖析 朱锋 / 张韶全 / 黄明 电子工业出版社
15 Spark快速大数据分析 [美] Holden Karau / [美] Andy Konwinski / [美] Patrick Wendell / [加] Matei Zaharia 人民邮电出版社
16 数据算法 : Hadoop/Spark大数据处理技巧 Mahmoud Parsian / 苏金国 / 杨健康 中国电力出版社
17 Spark实时大数据分析 基于Spark Streaming框架 [美] 祖贝尔·纳比 著,王胜夏,景玉 译 清华大学出版社
18 Flink基础教程 [美] 埃伦•弗里德曼 / [希] 科斯塔斯•宙马斯 人民邮电出版社
19 Flink核心技术 : 源码剖析与特性开发 黄伟哲 人民邮电出版社
20 Flink大数据分析实战 张伟洋 清华大学出版社
21 大数据技术原理与应用(第3版) : 概念、存储、处理、分析与应用 林子雨 人民邮电出版社
22 数据仓库 : (原书第4版) 荫蒙 / 王志海 机械工业出版社
23 数据仓库工具箱(第3版) : 维度建模权威指南 Ralph Kimball / Margy Ross / 王念滨 / 周连科 / 韦正现 清华大学出版社
24 DW2.0 : 下一代数据仓库的构架 W. H. Inmon / Derek Strauss / Genia Neushloss / 王志海 / 王建林 / 付彬 / 武婷婷 机械工业出版社
25 大数据分析 : 数据仓库项目实战 尚硅谷IT教育 电子工业出版社
26 Flume : 构建高可用、可扩展的海量日志采集系统 【美】Hari Shreedharan(哈里•史瑞德哈伦) / 马延辉 / 史东杰 电子工业出版社
27 ELK stack权威指南 饶琛琳 机械工业出版社
28 ClickHouse原理解析与应用实践 朱凯 机械工业出版社
29 ClickHouse性能之巅:从架构设计解读性能之谜 陈峰 机械工业出版社
30 高效使用Greenplum : 入门、进阶与数据中台 王春波 机械工业出版社
31 大数据架构师指南 朱进云 / 陈坚 / 王德政 清华大学出版社
32 大数据之路 : 阿里巴巴大数据实践 阿里巴巴数据技术及产品部 电子工业出版社
33 大数据架构和算法实现之路:电商系统的技术实战 黄申 机械工业出版社
34 大数据平台架构与原型实现:数据中台建设实战 耿立超 电子工业出版社
35 云原生数据中台:架构、方法论与实践 彭锋 / 宋文欣 / 孙浩峰 机械工业出版社
36 数字化转型架构:方法论与云原生实践 王思轩 电子工业出版社
37 用户画像:方法论与工程化解决方案 赵宏田 机械工业出版社
38 dataops实践手册 : 敏捷精益的数据运营 [美]哈文德.阿特瓦尔 / 马欢 机械工业出版社
39 运营之路 数据分析+数据运营+用户增长(新时代·营销新理念) 徐小磊 清华大学出版社
40 商业分析全攻略 用数据分析解决商业问题 接地气的陈老师 电子工业出版社
41 利用Python进行数据分析(原书第2版) 美] Wes McKinney / 徐敬一 机械工业出版社
42 深入浅出Pandas : 利用Python进行数据处理与分析 李庆辉 机械工业出版社
43 Python数据分析与挖掘实战(第2版) 张良均 机械工业出版社
44 Python金融大数据分析 第2版 [德]伊夫·希尔皮斯科(Yves Hilpisch) 人民邮电出版社
45 机器学习:软件工程方法与实现
某大型金融科技集团资深大数据与机器学习技术专家撰写,基于新近Python版本 将软件工程的思想、方法、工具和策略应用到机器学习实践中,提供高质量的代码设计、可直接复用的源码和工业应用框架 张春强 / 张和平 / 唐振 机械工业出版社
46 Python大数据分析与机器学习商业案例实战 王宇韬 / 钱妍竹 机械工业出版社
47 数据挖掘 概念与技术(原书第3版) (美)Jiawei Han / (加)Micheline Kamber / (加)Jian Pei 机械工业出版社
48 数据挖掘与分析 概念与算法 [美] Mohammed J. Zaki / [巴西] Wagner Meira Jr. 人民邮电出版社
49 数据挖掘与数据化运营实战 : 思路、方法、技巧与应用 卢辉 机械工业出版社
50 计算智能 : Computational Intelligence: Concepts to Implementations Russell C. Eberhart / Yuhui Shi 人民邮电出版社
51 计算广告:互联网商业变现的市场与技术(第3版) 刘鹏 / 王超 人民邮电出版社
52 程序化广告 个性化精准投放实用手册 梁丽丽 人民邮电出版社
53 程序化广告实战 : 私有化程序购买领域的布道者的一线实战笔记 吴俊 机械工业出版社
54 一本书读透Martech智慧营销 吴俊 / 李焱 / 党莎 机械工业出版社
55 数据赋能 : 数字化营销与运营新实战 宋星 电子工业出版社
56 华为数字化转型之道 华为公司企业架构与变革管理部 机械工业出版社
57 大数据技术及架构图解实战派 徐葳 电子工业出版社
58 精益数据方法论:数据驱动的数字化转型 史凯 机械工业出版社
59 财务数据治理实战 DAMA中国 郑保卫 清华大学出版社
60 一本书讲透数据治理:战略、方法、工具与实践 用友平台与数据智能团队 机械工业出版社
61 大数据实践之路:数据中台+数据分析+产品应用 林泽丰 / 许秋贵 / 陈斌 / 陈丽媛 电子工业出版社
62 大数据日知录 张俊林 电子工业出版社
63 数据驱动:从方法到实践 桑文锋 电子工业出版社
64 用数据讲故事(修订版) [美]科尔·努斯鲍默·纳福利克(Cole Nussbaumer Knaflic) / 陆昊 / 吴梦颖 人民邮电出版社
65 数据中台产品经理:从数据体系到数据平台实战 张小墨 电子工业出版社
66 DAMA数据管理知识体系指南(原书第2版) 数据管理协会(DAMA国际) 机械工业出版社
67 更好的数据可视化指南 Jonathan Schwabish / 易炜 电子工业出版社
68 对比Excel,轻松学习Python数据分析 张俊红 电子工业出版社
69 对比Excel,轻松学习SQL数据分析 张俊红 电子工业出版社
70 对比Excel,轻松学习Python报表自动化 张俊红 电子工业出版社
71 对比Excel,轻松学习Python统计分析 张俊红 电子工业出版社
72 数据治理:工业企业数字化转型之道 祝守宇 / 蔡春久 电子工业出版社
73 项目管理知识体系指南(PMBOK指南)(第6版) [美]项目管理协会 电子工业出版社
74 流程优化风暴:企业流程数字化转型从战略到落地 王磊 机械工业出版社
75 腾讯大数据构建之道 蒋杰 / 刘煜宏,陈鹏,郑礼雄 机械工业出版社
76 中台战略:中台建设与数字商业 陈新宇 罗家鹰 邓通 江威 机械工业出版社
77 SaaS商业实战 : 好模式如何变成好生意 代珂 机械工业出版社
78 穿越数据的迷宫:数据管理执行指南 [美]劳拉?塞巴斯蒂安-科尔曼(Laura Sebastian-Coleman) / 汪广盛 机械工业出版社
79 聚合架构:面向数字生态的构件化企业架构 付晓岩 机械工业出版社
80 ECharts数据可视化 : 入门、实战与进阶 王大伟 机械工业出版社
81 Android全埋点解决方案 王灼洲 机械工业出版社
82 iOS全埋点解决方案 王灼洲 机械工业出版社
83 Python网络爬虫技术与实战 赵国生 机械工业出版社
84 社交网站的数据挖掘与分析(原书第3版) Matthew,A.Russell,Mikhail,Klassen 苏统华 郭勇 潘巍 机械工业出版社
85 广告数据定量分析:如何成为一位厉害的广告优化师 齐云涧 机械工业出版社
86 电商数据分析与数据化运营 刘振华 机械工业出版社
87 数据科学工程实践 : 用户行为分析与建模、A/B实验、SQLFlow 谢梁 / 缪莹莹 / 高梓尧 / 王子玲 机械工业出版社
88 电商流量数据化运营 宋天龙 机械工业出版社
89 数据思维 : 人人必会的数据认知技能 [美] 乔丹·莫罗 / 耿修林 广东经济出版社
90 精益数据分析 [加] 阿利斯泰尔·克罗尔 / [加] 本杰明·尤科维奇 / 韩知白 / 王鹤达 人民邮电出版社
91 精益业务数据分析 CDA 数据科学研究院 电子工业出版社
92 大数据大创新:阿里巴巴云上数据中台之道 邓中华 电子工业出版社
93 企业IT架构转型之道:阿里巴巴中台战略思想与架构实战 钟华 机械工业出版社
94 华为数据之道 华为公司数据管理部 机械工业出版社
95 数据资产管理 : 盘活大数据时代的隐形财富 高伟 机械工业出版社
96 中台实践:数字化转型方法论与解决方案 陈新宇 / 罗家鹰 / 江 威 / 邓 通 机械工业出版社
97 主数据管理:企业数据化建设基础 张旭 / 陈吉平 / 杨海峰 电子工业出版社
98 大数据处理之道 何金池 电子工业出版社
99 金字塔原理 : 思考、表达和解决问题的逻辑 [美]芭芭拉•明托 / 汪洱 / 高愉 南海出版公司
100 金字塔原理 : 实战篇 [美] 芭芭拉·明托 / 罗若苹 南海出版公司
相关文章:
大数据书单(100本)
大数据书单(100本) 序号 书名 作者 出版社 1 Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版) Tom White 清华大学出版社 2 Hive编程指南 卡普廖洛 (Edward Capriolo) / 万普勒 (Dean Wampler) / 卢森格林 (Jason Rutherglen) / 曹坤 人民邮…...
python实战应用讲解-【语法基础篇】初识Python(附示例代码)
目录 前言 Python基础 基本概念: 为什么使用Python? Python2.x与3.x版本区别...
【2023保研夏令营】网安、CS(西交、华师、科、南等)
文章目录一、基本情况二、投递和入营情况三、考核情况1. 西交软院(面试)2. 川大网安(笔试面试)3. 华东师范数据学院(机试面试)4. 人大信息学院专硕(机试面试,保密)5. 南大…...

Qt COM组件导出源文件
文章目录摘要dumpcpp.exe注册COM组件COM 组件转CPP参考关键字: Qt、 COM、 组件、 源文件、 dumpcpp摘要 由于厂家提供的库不是纯净C库,是基于COM组件开的库,在和厂家友好交流无果下,只能研究下Qt 如何调用,好在Qt 的…...

各数据库数据类型的介绍和匹配
各数据库数据类型的介绍和匹配1. Oracle的数据类型2. Mysql的数据类型3. Sql server的数据类型4. 类型匹配5. Awakening1. Oracle的数据类型 数据类型介绍 VARCHAR2 :可变长度的字符串 最大长度4000 bytes 可做索引的最大长度749; NCHAR :根据字符集而定的固定长度字…...

Rancher 部署 MySQL
文章目录创建 pvc部署 MySQL前置条件:安装 rancher,可参考文章 docker 部署 rancher 创建 pvc MySQL 数据库是需要存储的,所以必须先准备 pvc 创建 pvc 自定义 pvc 名称选择已经新建好的 storageclass,storageclass 的创建可参考…...
Python语言零基础入门教程(二十五)
Python OS 文件/目录方法 Python语言零基础入门教程(二十四) 39、Python os.openpty() 方法 概述 os.openpty() 方法用于打开一个新的伪终端对。返回 pty 和 tty的文件描述符。 语法 openpty()方法语法格式如下: os.openpty()参数 无 返…...

蓝桥杯算法训练合集十五 1.打翻的闹钟2.智斗锅鸡3.文件列表
目录 1.打翻的闹钟 2.智斗锅鸡 3.文件列表 1.打翻的闹钟 问题描述 冯迭伊曼晚上刷吉米多维奇刷的太勤奋了,几乎天天迟到。崔神为了让VonDieEman改掉迟到的坏毛病,给他买了个闹钟。 一天早上,老冯被闹钟吵醒,他随手将闹钟按掉丢…...
CPU扫盲-CPU与指令集
指令集架构就像是特定的CPU的设计图纸,它规定了这个CPU需要支持那些指令、寄存器有那些状态以及输入输出模型。根据指令集结构的设计,在CPU上通过硬件电路进行实现,就得到了支持该指令集的CPU。指令集就像是我们编程语言中的接口,…...

VINS-Mono/Fusion与OpenCV去畸变对比
VINS中没有直接使用opencv的去畸变函数,而是自己编写了迭代函数完成去畸变操作,主要是为了加快去畸变计算速度 本文对二者的结果精度和耗时进行了对比 VINS-Mono/Fusion与OpenCV去畸变对比1 去畸变原理2 代码实现2.1 OpenCV去畸变2.2 VINS去畸变3 二者对…...

jmx prometheus引起的一次cpu飙高
用户接入了jmx agent进行prometheus监控后,在某个时间点出现cpu飙高 排查思路: 1、top,找到java进程ID 2、top -Hp 进程ID,找到java进程下占用高CPU的线程ID 3、jstack 进程ID,找到那个高CPU的线程ID的堆栈。 4、分析堆…...
Android 虚拟 A/B 详解(六) SnapshotManager 之状态数据
本文为洛奇看世界(guyongqiangx)原创,转载请注明出处。 原文链接:https://blog.csdn.net/guyongqiangx/article/details/129094203 Android 虚拟 A/B 分区《AAndroid 虚拟 A/B 分区》系列,更新中,文章列表: Android 虚拟分区详解(一) 参考资料推荐Android 虚拟分区详解(二…...

Python快速入门系列之一:Python对象
Python对象1. 列表(list)2. 元组(tuple)3. 字典(dict)4. 集合(set)5. 字符串(string)6. BIF (Built-in Function)7. 列表、集合以及字…...

【博客626】不同类型的ARP报文作用以及ARP老化机制
不同类型的ARP报文作用以及ARP老化机制 1、ARP协议及报文 2、不同类型的ARP报文作用 3、ARP工作原理 4、ARP老化机制 5、Linux ARP老化机制 ARP状态机: 在上图中,我们看到只有arp缓存项的reachable状态对于外发包是可用的,对于stale状态的…...

nacos discovery和config
微服务和nacos版本都在2.x及之后。1、discovery用于服务注册,将想要注册的服务注册到nacos中,被naocs发现。pom引入的依赖是:yml配置文件中:2、config用于获取nacos配置管理->配置列表下配置文件中的内容pom引入的依赖是&#…...
【算法数据结构体系篇class06】:堆、大根堆、小根堆、优先队列
一、堆结构1)堆结构就是用数组实现的完全二叉树结构2)完全二叉树中如果每棵子树的最大值都在顶部就是大根堆3)完全二叉树中如果每棵子树的最小值都在顶部就是小根堆4)堆结构的heapInsert与heapify操作5)堆结构的增大ad…...
试题 算法提高 最小字符串
资源限制内存限制:256.0MB C/C时间限制:2.0s Java时间限制:6.0s Python时间限制:10.0s问题描述给定一些字符串(只包含小写字母),要求将他们串起来构成一个字典序最小的字符串。输入格式第一行T,表示有T组数据。接下来T…...

已解决ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘
已解决from radiomics import featureextractor导包,抛出ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘异常的正确解决方法,亲测有效!!! 文章目录报错问题报错翻译报错原因解决方法联系博…...

乡村振兴研究:全网最全指标农村经济面板数据(2000-2021年)
数据来源:国家统计局 时间跨度:2000-2021年 区域范围:全国31省 指标说明: 部分样例数据: 行政区划代码地区年份经度纬度乡镇数(个)乡数(个)镇数(个)村民委员会数(个)乡村户数(万户)乡村人口(万人)乡村从业人员(万人…...

C语言中用rand()函数产生一随机数
在C语言中如何产生一个随机数呢?用rand()函数。 rand()函数在头文件:#include <stdio.h>中,函数原型:int rand(void);。rand()会返回一个范围在0到RAND_MAX(32767)之间的随机数(整数&…...

深入解析C++中的extern关键字:跨文件共享变量与函数的终极指南
🚀 C extern 关键字深度解析:跨文件编程的终极指南 📅 更新时间:2025年6月5日 🏷️ 标签:C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录 前言🔥一、extern 是什么?&…...

第 86 场周赛:矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词
Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有 从 1 到 9 的不同数字的 3 x 3 矩阵,其中每行,每列以及两条对角线上的各数之和都相等。 给定一个由整数组成的row x col 的 grid,其中有多少个 3 3 的 “幻方” 子矩阵&am…...
全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比
目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...

Android 之 kotlin 语言学习笔记三(Kotlin-Java 互操作)
参考官方文档:https://developer.android.google.cn/kotlin/interop?hlzh-cn 一、Java(供 Kotlin 使用) 1、不得使用硬关键字 不要使用 Kotlin 的任何硬关键字作为方法的名称 或字段。允许使用 Kotlin 的软关键字、修饰符关键字和特殊标识…...
在web-view 加载的本地及远程HTML中调用uniapp的API及网页和vue页面是如何通讯的?
uni-app 中 Web-view 与 Vue 页面的通讯机制详解 一、Web-view 简介 Web-view 是 uni-app 提供的一个重要组件,用于在原生应用中加载 HTML 页面: 支持加载本地 HTML 文件支持加载远程 HTML 页面实现 Web 与原生的双向通讯可用于嵌入第三方网页或 H5 应…...

Mysql中select查询语句的执行过程
目录 1、介绍 1.1、组件介绍 1.2、Sql执行顺序 2、执行流程 2.1. 连接与认证 2.2. 查询缓存 2.3. 语法解析(Parser) 2.4、执行sql 1. 预处理(Preprocessor) 2. 查询优化器(Optimizer) 3. 执行器…...

Windows安装Miniconda
一、下载 https://www.anaconda.com/download/success 二、安装 三、配置镜像源 Anaconda/Miniconda pip 配置清华镜像源_anaconda配置清华源-CSDN博客 四、常用操作命令 Anaconda/Miniconda 基本操作命令_miniconda创建环境命令-CSDN博客...

STM32---外部32.768K晶振(LSE)无法起振问题
晶振是否起振主要就检查两个1、晶振与MCU是否兼容;2、晶振的负载电容是否匹配 目录 一、判断晶振与MCU是否兼容 二、判断负载电容是否匹配 1. 晶振负载电容(CL)与匹配电容(CL1、CL2)的关系 2. 如何选择 CL1 和 CL…...

手机平板能效生态设计指令EU 2023/1670标准解读
手机平板能效生态设计指令EU 2023/1670标准解读 以下是针对欧盟《手机和平板电脑生态设计法规》(EU) 2023/1670 的核心解读,综合法规核心要求、最新修正及企业合规要点: 一、法规背景与目标 生效与强制时间 发布于2023年8月31日(OJ公报&…...

数据可视化交互
目录 【实验目的】 【实验原理】 【实验环境】 【实验步骤】 一、安装 pyecharts 二、下载数据 三、实验任务 实验 1:AQI 横向对比条形图 代码说明: 运行结果: 实验 2:AQI 等级分布饼图 实验 3:多城市 AQI…...