大数据书单(100本)
大数据书单(100本)
序号 书名 作者 出版社
1 Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版) Tom White 清华大学出版社
2 Hive编程指南 卡普廖洛 (Edward Capriolo) / 万普勒 (Dean Wampler) / 卢森格林 (Jason Rutherglen) / 曹坤 人民邮电出版社
3 Hive性能调优实战 林志煌 机械工业出版社
4 大数据Hive离线计算开发实战 杨力 人民邮电出版社
5 HBase权威指南 [美] Lars George / 代志远 / 刘佳 / 蒋杰 东南大学出版社
6 HBase原理与实践 胡争 / 范欣欣 机械工业出版社
7 ZooKeeper : Distributed process coordination Flavio Junqueira / Benjamin Reed O’Reilly Media
8 Kafka权威指南 Neha Narkhede / Gwen Shapira / Todd Palino / 薛命灯 人民邮电出版社
9 深入理解Kafka与Pulsar:消息流平台的实践与剖析 梁国斌 电子工业出版社
10 Scala编程(第3版) 【德】Martin Odersky(马丁.奥德斯基) / 【美】Lex Spoon(莱·斯彭) / 【美】Bill Venners(比尔·凡纳斯) 电子工业出版社
11 Spark权威指南 Bill Chambers / Matei Zaharia 中国电力出版社
12 大数据处理框架Apache Spark设计与实现(全彩) 许利杰 / 方亚芬 电子工业出版社
13 图解Spark:核心技术与案例实战 郭景瞻 电子工业出版社
14 Spark SQL内核剖析 朱锋 / 张韶全 / 黄明 电子工业出版社
15 Spark快速大数据分析 [美] Holden Karau / [美] Andy Konwinski / [美] Patrick Wendell / [加] Matei Zaharia 人民邮电出版社
16 数据算法 : Hadoop/Spark大数据处理技巧 Mahmoud Parsian / 苏金国 / 杨健康 中国电力出版社
17 Spark实时大数据分析 基于Spark Streaming框架 [美] 祖贝尔·纳比 著,王胜夏,景玉 译 清华大学出版社
18 Flink基础教程 [美] 埃伦•弗里德曼 / [希] 科斯塔斯•宙马斯 人民邮电出版社
19 Flink核心技术 : 源码剖析与特性开发 黄伟哲 人民邮电出版社
20 Flink大数据分析实战 张伟洋 清华大学出版社
21 大数据技术原理与应用(第3版) : 概念、存储、处理、分析与应用 林子雨 人民邮电出版社
22 数据仓库 : (原书第4版) 荫蒙 / 王志海 机械工业出版社
23 数据仓库工具箱(第3版) : 维度建模权威指南 Ralph Kimball / Margy Ross / 王念滨 / 周连科 / 韦正现 清华大学出版社
24 DW2.0 : 下一代数据仓库的构架 W. H. Inmon / Derek Strauss / Genia Neushloss / 王志海 / 王建林 / 付彬 / 武婷婷 机械工业出版社
25 大数据分析 : 数据仓库项目实战 尚硅谷IT教育 电子工业出版社
26 Flume : 构建高可用、可扩展的海量日志采集系统 【美】Hari Shreedharan(哈里•史瑞德哈伦) / 马延辉 / 史东杰 电子工业出版社
27 ELK stack权威指南 饶琛琳 机械工业出版社
28 ClickHouse原理解析与应用实践 朱凯 机械工业出版社
29 ClickHouse性能之巅:从架构设计解读性能之谜 陈峰 机械工业出版社
30 高效使用Greenplum : 入门、进阶与数据中台 王春波 机械工业出版社
31 大数据架构师指南 朱进云 / 陈坚 / 王德政 清华大学出版社
32 大数据之路 : 阿里巴巴大数据实践 阿里巴巴数据技术及产品部 电子工业出版社
33 大数据架构和算法实现之路:电商系统的技术实战 黄申 机械工业出版社
34 大数据平台架构与原型实现:数据中台建设实战 耿立超 电子工业出版社
35 云原生数据中台:架构、方法论与实践 彭锋 / 宋文欣 / 孙浩峰 机械工业出版社
36 数字化转型架构:方法论与云原生实践 王思轩 电子工业出版社
37 用户画像:方法论与工程化解决方案 赵宏田 机械工业出版社
38 dataops实践手册 : 敏捷精益的数据运营 [美]哈文德.阿特瓦尔 / 马欢 机械工业出版社
39 运营之路 数据分析+数据运营+用户增长(新时代·营销新理念) 徐小磊 清华大学出版社
40 商业分析全攻略 用数据分析解决商业问题 接地气的陈老师 电子工业出版社
41 利用Python进行数据分析(原书第2版) 美] Wes McKinney / 徐敬一 机械工业出版社
42 深入浅出Pandas : 利用Python进行数据处理与分析 李庆辉 机械工业出版社
43 Python数据分析与挖掘实战(第2版) 张良均 机械工业出版社
44 Python金融大数据分析 第2版 [德]伊夫·希尔皮斯科(Yves Hilpisch) 人民邮电出版社
45 机器学习:软件工程方法与实现
某大型金融科技集团资深大数据与机器学习技术专家撰写,基于新近Python版本 将软件工程的思想、方法、工具和策略应用到机器学习实践中,提供高质量的代码设计、可直接复用的源码和工业应用框架 张春强 / 张和平 / 唐振 机械工业出版社
46 Python大数据分析与机器学习商业案例实战 王宇韬 / 钱妍竹 机械工业出版社
47 数据挖掘 概念与技术(原书第3版) (美)Jiawei Han / (加)Micheline Kamber / (加)Jian Pei 机械工业出版社
48 数据挖掘与分析 概念与算法 [美] Mohammed J. Zaki / [巴西] Wagner Meira Jr. 人民邮电出版社
49 数据挖掘与数据化运营实战 : 思路、方法、技巧与应用 卢辉 机械工业出版社
50 计算智能 : Computational Intelligence: Concepts to Implementations Russell C. Eberhart / Yuhui Shi 人民邮电出版社
51 计算广告:互联网商业变现的市场与技术(第3版) 刘鹏 / 王超 人民邮电出版社
52 程序化广告 个性化精准投放实用手册 梁丽丽 人民邮电出版社
53 程序化广告实战 : 私有化程序购买领域的布道者的一线实战笔记 吴俊 机械工业出版社
54 一本书读透Martech智慧营销 吴俊 / 李焱 / 党莎 机械工业出版社
55 数据赋能 : 数字化营销与运营新实战 宋星 电子工业出版社
56 华为数字化转型之道 华为公司企业架构与变革管理部 机械工业出版社
57 大数据技术及架构图解实战派 徐葳 电子工业出版社
58 精益数据方法论:数据驱动的数字化转型 史凯 机械工业出版社
59 财务数据治理实战 DAMA中国 郑保卫 清华大学出版社
60 一本书讲透数据治理:战略、方法、工具与实践 用友平台与数据智能团队 机械工业出版社
61 大数据实践之路:数据中台+数据分析+产品应用 林泽丰 / 许秋贵 / 陈斌 / 陈丽媛 电子工业出版社
62 大数据日知录 张俊林 电子工业出版社
63 数据驱动:从方法到实践 桑文锋 电子工业出版社
64 用数据讲故事(修订版) [美]科尔·努斯鲍默·纳福利克(Cole Nussbaumer Knaflic) / 陆昊 / 吴梦颖 人民邮电出版社
65 数据中台产品经理:从数据体系到数据平台实战 张小墨 电子工业出版社
66 DAMA数据管理知识体系指南(原书第2版) 数据管理协会(DAMA国际) 机械工业出版社
67 更好的数据可视化指南 Jonathan Schwabish / 易炜 电子工业出版社
68 对比Excel,轻松学习Python数据分析 张俊红 电子工业出版社
69 对比Excel,轻松学习SQL数据分析 张俊红 电子工业出版社
70 对比Excel,轻松学习Python报表自动化 张俊红 电子工业出版社
71 对比Excel,轻松学习Python统计分析 张俊红 电子工业出版社
72 数据治理:工业企业数字化转型之道 祝守宇 / 蔡春久 电子工业出版社
73 项目管理知识体系指南(PMBOK指南)(第6版) [美]项目管理协会 电子工业出版社
74 流程优化风暴:企业流程数字化转型从战略到落地 王磊 机械工业出版社
75 腾讯大数据构建之道 蒋杰 / 刘煜宏,陈鹏,郑礼雄 机械工业出版社
76 中台战略:中台建设与数字商业 陈新宇 罗家鹰 邓通 江威 机械工业出版社
77 SaaS商业实战 : 好模式如何变成好生意 代珂 机械工业出版社
78 穿越数据的迷宫:数据管理执行指南 [美]劳拉?塞巴斯蒂安-科尔曼(Laura Sebastian-Coleman) / 汪广盛 机械工业出版社
79 聚合架构:面向数字生态的构件化企业架构 付晓岩 机械工业出版社
80 ECharts数据可视化 : 入门、实战与进阶 王大伟 机械工业出版社
81 Android全埋点解决方案 王灼洲 机械工业出版社
82 iOS全埋点解决方案 王灼洲 机械工业出版社
83 Python网络爬虫技术与实战 赵国生 机械工业出版社
84 社交网站的数据挖掘与分析(原书第3版) Matthew,A.Russell,Mikhail,Klassen 苏统华 郭勇 潘巍 机械工业出版社
85 广告数据定量分析:如何成为一位厉害的广告优化师 齐云涧 机械工业出版社
86 电商数据分析与数据化运营 刘振华 机械工业出版社
87 数据科学工程实践 : 用户行为分析与建模、A/B实验、SQLFlow 谢梁 / 缪莹莹 / 高梓尧 / 王子玲 机械工业出版社
88 电商流量数据化运营 宋天龙 机械工业出版社
89 数据思维 : 人人必会的数据认知技能 [美] 乔丹·莫罗 / 耿修林 广东经济出版社
90 精益数据分析 [加] 阿利斯泰尔·克罗尔 / [加] 本杰明·尤科维奇 / 韩知白 / 王鹤达 人民邮电出版社
91 精益业务数据分析 CDA 数据科学研究院 电子工业出版社
92 大数据大创新:阿里巴巴云上数据中台之道 邓中华 电子工业出版社
93 企业IT架构转型之道:阿里巴巴中台战略思想与架构实战 钟华 机械工业出版社
94 华为数据之道 华为公司数据管理部 机械工业出版社
95 数据资产管理 : 盘活大数据时代的隐形财富 高伟 机械工业出版社
96 中台实践:数字化转型方法论与解决方案 陈新宇 / 罗家鹰 / 江 威 / 邓 通 机械工业出版社
97 主数据管理:企业数据化建设基础 张旭 / 陈吉平 / 杨海峰 电子工业出版社
98 大数据处理之道 何金池 电子工业出版社
99 金字塔原理 : 思考、表达和解决问题的逻辑 [美]芭芭拉•明托 / 汪洱 / 高愉 南海出版公司
100 金字塔原理 : 实战篇 [美] 芭芭拉·明托 / 罗若苹 南海出版公司
相关文章:
大数据书单(100本)
大数据书单(100本) 序号 书名 作者 出版社 1 Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版) Tom White 清华大学出版社 2 Hive编程指南 卡普廖洛 (Edward Capriolo) / 万普勒 (Dean Wampler) / 卢森格林 (Jason Rutherglen) / 曹坤 人民邮…...
python实战应用讲解-【语法基础篇】初识Python(附示例代码)
目录 前言 Python基础 基本概念: 为什么使用Python? Python2.x与3.x版本区别...
【2023保研夏令营】网安、CS(西交、华师、科、南等)
文章目录一、基本情况二、投递和入营情况三、考核情况1. 西交软院(面试)2. 川大网安(笔试面试)3. 华东师范数据学院(机试面试)4. 人大信息学院专硕(机试面试,保密)5. 南大…...

Qt COM组件导出源文件
文章目录摘要dumpcpp.exe注册COM组件COM 组件转CPP参考关键字: Qt、 COM、 组件、 源文件、 dumpcpp摘要 由于厂家提供的库不是纯净C库,是基于COM组件开的库,在和厂家友好交流无果下,只能研究下Qt 如何调用,好在Qt 的…...

各数据库数据类型的介绍和匹配
各数据库数据类型的介绍和匹配1. Oracle的数据类型2. Mysql的数据类型3. Sql server的数据类型4. 类型匹配5. Awakening1. Oracle的数据类型 数据类型介绍 VARCHAR2 :可变长度的字符串 最大长度4000 bytes 可做索引的最大长度749; NCHAR :根据字符集而定的固定长度字…...

Rancher 部署 MySQL
文章目录创建 pvc部署 MySQL前置条件:安装 rancher,可参考文章 docker 部署 rancher 创建 pvc MySQL 数据库是需要存储的,所以必须先准备 pvc 创建 pvc 自定义 pvc 名称选择已经新建好的 storageclass,storageclass 的创建可参考…...
Python语言零基础入门教程(二十五)
Python OS 文件/目录方法 Python语言零基础入门教程(二十四) 39、Python os.openpty() 方法 概述 os.openpty() 方法用于打开一个新的伪终端对。返回 pty 和 tty的文件描述符。 语法 openpty()方法语法格式如下: os.openpty()参数 无 返…...

蓝桥杯算法训练合集十五 1.打翻的闹钟2.智斗锅鸡3.文件列表
目录 1.打翻的闹钟 2.智斗锅鸡 3.文件列表 1.打翻的闹钟 问题描述 冯迭伊曼晚上刷吉米多维奇刷的太勤奋了,几乎天天迟到。崔神为了让VonDieEman改掉迟到的坏毛病,给他买了个闹钟。 一天早上,老冯被闹钟吵醒,他随手将闹钟按掉丢…...
CPU扫盲-CPU与指令集
指令集架构就像是特定的CPU的设计图纸,它规定了这个CPU需要支持那些指令、寄存器有那些状态以及输入输出模型。根据指令集结构的设计,在CPU上通过硬件电路进行实现,就得到了支持该指令集的CPU。指令集就像是我们编程语言中的接口,…...

VINS-Mono/Fusion与OpenCV去畸变对比
VINS中没有直接使用opencv的去畸变函数,而是自己编写了迭代函数完成去畸变操作,主要是为了加快去畸变计算速度 本文对二者的结果精度和耗时进行了对比 VINS-Mono/Fusion与OpenCV去畸变对比1 去畸变原理2 代码实现2.1 OpenCV去畸变2.2 VINS去畸变3 二者对…...

jmx prometheus引起的一次cpu飙高
用户接入了jmx agent进行prometheus监控后,在某个时间点出现cpu飙高 排查思路: 1、top,找到java进程ID 2、top -Hp 进程ID,找到java进程下占用高CPU的线程ID 3、jstack 进程ID,找到那个高CPU的线程ID的堆栈。 4、分析堆…...
Android 虚拟 A/B 详解(六) SnapshotManager 之状态数据
本文为洛奇看世界(guyongqiangx)原创,转载请注明出处。 原文链接:https://blog.csdn.net/guyongqiangx/article/details/129094203 Android 虚拟 A/B 分区《AAndroid 虚拟 A/B 分区》系列,更新中,文章列表: Android 虚拟分区详解(一) 参考资料推荐Android 虚拟分区详解(二…...

Python快速入门系列之一:Python对象
Python对象1. 列表(list)2. 元组(tuple)3. 字典(dict)4. 集合(set)5. 字符串(string)6. BIF (Built-in Function)7. 列表、集合以及字…...

【博客626】不同类型的ARP报文作用以及ARP老化机制
不同类型的ARP报文作用以及ARP老化机制 1、ARP协议及报文 2、不同类型的ARP报文作用 3、ARP工作原理 4、ARP老化机制 5、Linux ARP老化机制 ARP状态机: 在上图中,我们看到只有arp缓存项的reachable状态对于外发包是可用的,对于stale状态的…...

nacos discovery和config
微服务和nacos版本都在2.x及之后。1、discovery用于服务注册,将想要注册的服务注册到nacos中,被naocs发现。pom引入的依赖是:yml配置文件中:2、config用于获取nacos配置管理->配置列表下配置文件中的内容pom引入的依赖是&#…...
【算法数据结构体系篇class06】:堆、大根堆、小根堆、优先队列
一、堆结构1)堆结构就是用数组实现的完全二叉树结构2)完全二叉树中如果每棵子树的最大值都在顶部就是大根堆3)完全二叉树中如果每棵子树的最小值都在顶部就是小根堆4)堆结构的heapInsert与heapify操作5)堆结构的增大ad…...
试题 算法提高 最小字符串
资源限制内存限制:256.0MB C/C时间限制:2.0s Java时间限制:6.0s Python时间限制:10.0s问题描述给定一些字符串(只包含小写字母),要求将他们串起来构成一个字典序最小的字符串。输入格式第一行T,表示有T组数据。接下来T…...

已解决ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘
已解决from radiomics import featureextractor导包,抛出ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘异常的正确解决方法,亲测有效!!! 文章目录报错问题报错翻译报错原因解决方法联系博…...

乡村振兴研究:全网最全指标农村经济面板数据(2000-2021年)
数据来源:国家统计局 时间跨度:2000-2021年 区域范围:全国31省 指标说明: 部分样例数据: 行政区划代码地区年份经度纬度乡镇数(个)乡数(个)镇数(个)村民委员会数(个)乡村户数(万户)乡村人口(万人)乡村从业人员(万人…...

C语言中用rand()函数产生一随机数
在C语言中如何产生一个随机数呢?用rand()函数。 rand()函数在头文件:#include <stdio.h>中,函数原型:int rand(void);。rand()会返回一个范围在0到RAND_MAX(32767)之间的随机数(整数&…...
Python爬虫实战:研究MechanicalSoup库相关技术
一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库,专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力,提供了直观的 API,让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...

YSYX学习记录(八)
C语言,练习0: 先创建一个文件夹,我用的是物理机: 安装build-essential 练习1: 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件,随机修改或删除一部分,之后…...

多种风格导航菜单 HTML 实现(附源码)
下面我将为您展示 6 种不同风格的导航菜单实现,每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...
Java毕业设计:WML信息查询与后端信息发布系统开发
JAVAWML信息查询与后端信息发布系统实现 一、系统概述 本系统基于Java和WML(无线标记语言)技术开发,实现了移动设备上的信息查询与后端信息发布功能。系统采用B/S架构,服务器端使用Java Servlet处理请求,数据库采用MySQL存储信息࿰…...
虚拟电厂发展三大趋势:市场化、技术主导、车网互联
市场化:从政策驱动到多元盈利 政策全面赋能 2025年4月,国家发改委、能源局发布《关于加快推进虚拟电厂发展的指导意见》,首次明确虚拟电厂为“独立市场主体”,提出硬性目标:2027年全国调节能力≥2000万千瓦࿰…...

Java设计模式:责任链模式
一、什么是责任链模式? 责任链模式(Chain of Responsibility Pattern) 是一种 行为型设计模式,它通过将请求沿着一条处理链传递,直到某个对象处理它为止。这种模式的核心思想是 解耦请求的发送者和接收者,…...
使用 uv 工具快速部署并管理 vLLM 推理环境
uv:现代 Python 项目管理的高效助手 uv:Rust 驱动的 Python 包管理新时代 在部署大语言模型(LLM)推理服务时,vLLM 是一个备受关注的方案,具备高吞吐、低延迟和对 OpenAI API 的良好兼容性。为了提高部署效…...

React、Git、计网、发展趋势等内容——前端面试宝典(字节、小红书和美团)
React React Hook实现架构、.Hook不能在循环嵌套语句中使用 , 为什么,Fiber架构,面试向面试官介绍,详细解释 用户: React Hook实现架构、.Hook不能在循环嵌套语句中使用 , 为什么,Fiber架构,面试向面试官介绍&#x…...
npm install 相关命令
npm install 相关命令 基本安装命令 # 安装 package.json 中列出的所有依赖 npm install npm i # 简写形式# 安装特定包 npm install <package-name># 安装特定版本 npm install <package-name><version>依赖类型选项 # 安装为生产依赖(默认&…...

ubuntu2404 gpu 没接显示器,如何保证远程显示的分辨率
1. 使用 xserver-xorg-video-dummy 创建虚拟显示器 如果系统在无物理显示器连接时无法识别显示输出,可以使用 xserver-xorg-video-dummy 驱动程序创建虚拟显示器。以下是设置步骤: 安装虚拟显示器驱动程序: sudo apt install xserver-xorg-v…...