当前位置: 首页 > news >正文

大数据发展史

一、hadoop发展史

        hadoop创始人Doug Cutting,主要为了实现Google类似全文搜索功能,该功能是基于Lucene框架进行优化升级,索引引擎;

        2001年底Lucence成为Apache基金会的一个子项目,当时为了解决存储海量数据困难,检索海量速度慢,可以说Google是hadoop的思想之源;

        GFS ---> HDFS

        MapReduce ---> MR

        BigTable ---> HBase

        2006年3月份,MapReduce和Nutch Distributed File System(NDFS)被纳入到Hadoop项目,Hadoop正式诞生;

二、hadoop三大发行版本

        Hadoop三大发行版本:Aapche、Cloudera、Hortonworks。

        Apache版本最原始(最基础)的版本,对于入门学习最好。

         Cloudera内部集成了很多大数据框架,对应产品CDH。

        Hortonworks文档较好,对应产品HDP。

        Hortonworks现在已经被Cloudera公司收购,推出新的品牌CDP。

三、hadoop优势

        1)高可靠性:hadoop底层维护多个数据副本,即使某个计算或者存储出现故障,也不会丢失数据;

        2)高扩展:集群可方便的扩展数以千计的节点;

        3)  高效性:在MapReduce下,Hadoop工作是并行的,这样能加速任务的处理速度;

        4)高容错性:能够自动将失败的任务重新分配;

相关文章:

大数据发展史

一、hadoop发展史 hadoop创始人Doug Cutting,主要为了实现Google类似全文搜索功能,该功能是基于Lucene框架进行优化升级,索引引擎; 2001年底Lucence成为Apache基金会的一个子项目,当时为了解决存储海量数据困难,检索海量速度慢,可以说Google是hadoop的思想之源; GFS…...

有关范数的学习笔记

向量的【范数】:模长的推广,柯西不等式_哔哩哔哩_bilibili 模长 范数 这里UP主给了说明 点赞 范数理解(0范数,1范数,2范数)_一阶范数-CSDN博客 出租车/曼哈顿范数 det()行列式 正定矩阵(Posit…...

如何通过MES系统提高生产计划效率?

导 读 ( 文/ 1730 ) 在现代制造业中,通过制造执行系统(MES)系统来提高生产计划效率是至关重要的。本文将介绍如何通过MES系统来优化生产计划,包括实时数据分析、智能排程和协同协作。通过这些关键方法,企业可以提高生产…...

持续提升信息安全运维保障服务能力,天玑科技助力企业快速实现数字化转型

近年来,以互联网、云计算、大数据、物联网为代表的新一代信息技术快速发展。给人们的生产生活方式带来方便的同时,也给信息系统的安全带来了严峻的挑战。我国信息化和信息安全保障工作的不断深入推进,以应急处理、风险评估、灾难恢复、系统测…...

【PostgreSQL启动,停止命令(重启)】

找到 /usr/lib/systemd/system文件夹路径看是否包含 postgresql服务 关闭服务: systemctl stop postgresql-12.service启动服务 systemctl start postgresql-12.service重启服务 systemctl restart postgresql-12查看状态 systemctl status postgresql-12.servi…...

TLS 详解

目录 TLS 定义HTTPS HTTP over TLS.加密记录层分片 (Fragmentation)记录压缩和解压缩 (Record compression and decompression)空或标准流加密 (Null or standard stream cipher)CBC 块加密 (分组加密)记录有效载荷保护 (Record payload protection)密钥计算 (Key calculation…...

【重拾C语言】十、递归程序设计

目录 前言 十、递归程序设计 10.1 计算n!——递归程序设计 10.2 程序设计实例 10.2.1 汉诺塔 10.2.2 齿轮 10.2.3 组合 10.3 计算算术表达式的值——间接递归 10.4 递归程序执行过程 前言 递归程序设计是一种编程技术,其中一个函数通过调用自身…...

SQL日期字段去时分秒

substring( convert(varchar,[申请日期],120),1,10) AS 申请日期 运行结果对比展示 申请日期申请日期2022-12-24 00:00:00.0002022-12-24 说明: substring(...): 这是SQL中用于提取字符串一部分的函数。 convert(varchar, 申请日期, 120): 这部分将日期值&#…...

NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道

一、说明 我的NLP项目在维基百科条目上下载、处理和应用机器学习算法。相关上一篇文章中,展示了项目大纲,并建立了它的基础。首先,一个 Wikipedia 爬网程序对象,它按名称搜索文章,提取标题、类别、内容和相关页面&…...

如何在Ubuntu 20.04.6 LTS系统上运行Playwright自动化测试

写在前面 这里以 Ubuntu 20.04.6 LTS为例。示例代码:自动化测试代码。 如果过程中遇到其他非文本中提到的错误,可以使用搜索引擎搜索错误,找出解决方案,再逐步往下进行。 一、 环境准备 1.1 安装python3 1.1.1 使用APT安装Py…...

c++ sort函数cmp比较参数传入

开始 假定有一个结构体 struct node{int p,r,val; };第一种 定义cmp函数&#xff0c;sort直接传入cmp bool cmp(node a,node b){return a.p<b.p;} sort(vec.begin(),vec.end(),cmp);第二种 lamada表达式&#xff1f;&#xff1f;这个中括号里面可以不为空&#xff0c;但是…...

【计算机网络笔记】什么是计算机网络?

前言计算机网络的定义交换网络什么是Internet从组成细节角度看从服务角度看 最后感谢 &#x1f496; 本篇文章总字数&#xff1a;1342字 预计阅读时间&#xff1a;5~10min 建议收藏之后慢慢阅读 前言 计算机网络通信技术计算机技术。 计算机网络是通信技术与计算机技术紧密结…...

极简C++(2) 类与对象

类与对象的基本概念 CLASS类将数据以及数据上的操作封装在一起 OBJECT对象是有具体类类型的变量 打个比方&#xff0c;类就像一个制作月饼的摸具&#xff0c;那么我们可以通过这个摸具来放入面粉和馅料编程一个月饼&#xff0c;那么摸具就是类&#xff0c;而各种各样的月饼便是…...

【Java 进阶篇】JavaScript流程控制语句详解

JavaScript是一门高级编程语言&#xff0c;具备丰富的流程控制语句&#xff0c;用于控制程序的执行流程。在本篇博客中&#xff0c;我们将深入探讨JavaScript的流程控制语句&#xff0c;包括条件语句、循环语句、以及其他一些控制语句。这篇博客将逐步介绍这些概念&#xff0c;…...

【Page-level Heap Fengshui -- Cross-Cache Overflow】corCTF2022-cache-of-castaways

前言 什么叫 Cross Cache 呢&#xff1f;其实就是字面意思&#xff0c;我们知道内核中的大部分结构体都有自己的专属 slab 内存池。那现在我们可以想象一下这个场景&#xff0c;我们拥有一个特定 kmem-cache 的溢出漏洞&#xff0c;那么我们该如何利用呢&#xff1f; 程序分析…...

vue-mixin

1.vue中&#xff0c;混入(mixin)是一种特殊的使用方式。一个混入对象可以包含任意的组件配置选项(data, props, components, watch,computed…)可以根据需求"封装"一些可复用的单元&#xff0c;并在使用时根据一定的策略合并到组件的选项中&#xff0c;使用时和组件自…...

力扣刷题 day43:10-13

1.完全平方数 给你一个整数 n &#xff0c;返回 和为 n 的完全平方数的最少数量 。 完全平方数 是一个整数&#xff0c;其值等于另一个整数的平方&#xff1b;换句话说&#xff0c;其值等于一个整数自乘的积。例如&#xff0c;1、4、9 和 16 都是完全平方数&#xff0c;而 3 …...

3、在docker 容器中安装tomcat

&#xff11;、在服务器上查找tomcat镜像,查看前5条 docker search tomcat --limit 5​​​​​​​ 2、拉取镜像到本地 拉取官方的tomcat到本地 docker pull tomcat:9.0.34-jdk8 3、查看本地镜像 docker images |grep tomcat 4、启动tomcat 服务 使用默认配置 docker ru…...

工业互联网系列1 - 智能制造中有哪些数据在传输

工业互联网以网络为基础&#xff0c;需要传输的数据种类多种多样&#xff0c;这些数据对于实时监控、生产优化、设备维护和决策支持等方面都至关重要。 以下是一些常见智能制造业中需要传输的数据类型&#xff1a; 传感器数据&#xff1a;制造设备上安装的传感器&#xff08;如…...

centos7部署Nginx和RabbitMQ

文章目录 Nginx安装部署【简单】简介安装 RabbitMQ安装部署【简单】简介安装 Nginx安装部署【简单】 简介 Nginx (engine x) 是一个高性能的HTTP和反向代理web服务器&#xff0c;同时也提供了IMAP/POP3/SMTP服务。Nginx可以托管用户编写的WEB应用程序成为可访问的网页服务&am…...

八大网盘直链解析工具:高效跨平台文件下载全攻略

八大网盘直链解析工具&#xff1a;高效跨平台文件下载全攻略 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 …...

别再死记硬背了!图解贪心算法:用‘小船过河’和‘区间覆盖’带你掌握核心思想

贪心算法实战&#xff1a;从生活场景到代码实现的思维跃迁 想象一下周末野餐时分配三明治的场景&#xff1a;你有一堆大小不一的三明治和一群饥饿的朋友。为了让最多人吃到食物&#xff0c;你会优先把小块三明治分给食量小的朋友——这种看似简单的决策背后&#xff0c;隐藏着计…...

开源可观测性平台SigNoz:一体化监控与分布式链路追踪实战

1. 项目概述&#xff1a;从可观测性痛点出发&#xff0c;为什么我们需要SigNoz在云原生和微服务架构成为主流的今天&#xff0c;一个应用可能由数十甚至上百个服务组成&#xff0c;它们分布在不同的容器、节点甚至云区域中。当用户反馈“页面加载慢”或“功能报错”时&#xff…...

OpenPencil Design Orchestrator:打通设计与代码的设计系统自动化工具

1. 项目概述&#xff1a;从开源仓库名到设计编排器的深度解读看到sorrowfulnessstaff973/openpencil-design-orchestrator这个仓库名&#xff0c;很多人的第一反应可能是好奇和困惑。这串字符背后&#xff0c;究竟隐藏着一个怎样的项目&#xff1f;作为一名长期混迹于开源社区、…...

基于Adafruit TRRS Trinkey构建低成本无障碍鼠标键盘模拟器与开关控制器

1. 项目概述&#xff1a;为无障碍交互打开一扇新窗在数字时代&#xff0c;鼠标和键盘是我们与计算机交互最直接的桥梁。然而&#xff0c;对于许多因运动神经元疾病、脊髓损伤、脑瘫或其他肢体障碍而无法使用传统输入设备的朋友来说&#xff0c;这座桥梁却显得遥不可及。作为一名…...

计算机 AI 方向 SCI 推荐|AI / 计算机 SCI 清单:3本 2区 + 1本 3区保底,无预警、对国人极度友好,易中稿,录用率拉满好投稿,硕博 / 青年教师首选,AI 科研人必藏!

投稿实用建议&#xff08;CSDN科研人专属&#xff09;优先选刊&#xff1a;追求高影响力、评职首选「Applied Soft Computing」&#xff1b;追求高录用率、快速毕业首选「Neurocomputing」。避坑提醒&#xff1a;所有期刊均为非预警刊&#xff0c;自引率均在安全范围&#xff0…...

Taotoken Token Plan套餐为高频用户带来的长期成本优势感知

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 Taotoken Token Plan套餐为高频用户带来的长期成本优势感知 对于高频使用大模型API的开发者或团队而言&#xff0c;项目开发中的模…...

稀疏矩阵运算全解析:从基础算术到高效求解与性能调优

1. 稀疏矩阵运算操作全景解析在数值计算、机器学习、图形学乃至各类工程仿真领域&#xff0c;处理大规模数据时&#xff0c;我们总会遇到一个“熟悉的陌生人”——稀疏矩阵。它不像密集矩阵那样&#xff0c;每个元素都占据着内存空间&#xff0c;而是像一个精打细算的管家&…...

告别Keil:用CLion+STM32CubeMX打造现代化STM32开发环境(含调试与串口打印)

1. 为什么选择CLion开发STM32&#xff1f; 作为一名在嵌入式领域摸爬滚打多年的开发者&#xff0c;我深知传统IDE&#xff08;如Keil&#xff09;的痛点。记得刚开始用Keil时&#xff0c;每次代码跳转都要等上几秒&#xff0c;智能提示基本靠猜&#xff0c;代码重构更是噩梦。…...

快速开发AI应用原型时Taotoken分钟级接入的价值

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 快速开发AI应用原型时Taotoken分钟级接入的价值 在黑客松、内部创新日或产品早期原型开发阶段&#xff0c;时间是最宝贵的资源。开…...