当前位置: 首页 > news >正文

【数仓】基本概念、知识普及、核心技术

一、数仓基本概念

  1. 数仓的定义

    • 数据仓库(Data Warehouse,简称DW或DWH)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。简言之,它是一个大型存储库,用于存储来自不同源的结构化和非结构化数据,并为分析目的提供数据。
  2. 数仓的特点

    • 面向主题:数据仓库中的数据是按照一定的主题域进行组织的,这些主题通常与企业的业务过程或分析需求相关。
    • 集成性:数据仓库中的数据是从各个不同的数据源中抽取、转换和加载(ETL)而来的,确保数据的一致性和准确性。
    • 稳定性:一旦数据进入数据仓库,通常就不会再进行修改或删除,而是作为历史数据被保留,用于分析目的。
    • 时变性:数据仓库中的数据会随着时间的推移而发生变化,通常包括添加新数据和更新现有数据。
  3. 数仓与数据库的区别

    • 目标不同:数据库主要用于事务处理,如记录系统的日常操作;而数据仓库主要用于分析和决策支持。
    • 数据组织不同:数据库通常按照应用程序的需求组织数据;数据仓库则按照主题和分析需求组织数据。
    • 数据稳定性不同:数据库中的数据经常发生变化,包括增加、删除和修改;而数据仓库中的数据相对稳定,主要用于查询和分析。
  4. 数仓的架构

    • 数据仓库通常包括多个层次,如数据源层、ETL层、数据仓库层和数据应用层。每个层次都有其特定的功能和作用。
  5. 数仓的应用

    • 数据仓库广泛应用于企业决策支持系统(DSS)、在线分析处理(OLAP)和数据挖掘等领域。它可以帮助企业更好地了解其业务运营情况,发现潜在的问题和机会,并做出更明智的决策。
  6. 数仓的发展趋势

    • 随着大数据和人工智能技术的不断发展,数据仓库正在向更智能化、更灵活和更高效的方向发展。例如,实时数据仓库可以处理和分析实时数据流,为企业提供更及时的决策支持。
  7. 数据建模

    • 数据建模是数仓设计的核心环节,它决定了数据仓库中数据的组织方式。常见的数据建模方法有星型模型(Star Schema)和雪花模型(Snowflake Schema)。了解这些模型的特点和适用场景,有助于设计出高效、易用的数据仓库。
  8. 数据抽取、转换和加载(ETL)

    • ETL是数仓建设中的关键过程,涉及从数据源抽取数据、对数据进行清洗、转换和加载到数据仓库中。了解ETL的原理、工具和技术,以及如何进行性能优化,对于数仓开发至关重要。
  9. 数据质量管理

    • 数据质量是数仓的生命线。了解如何定义和评估数据质量,以及如何进行数据清洗、校验和标准化,对于确保数仓数据的准确性和一致性非常重要。
  10. 数据安全与隐私

    • 随着数据泄露和隐私保护意识的提高,数据安全和隐私保护在数仓建设中越来越重要。了解如何对数据进行加密、访问控制、审计和匿名化处理,有助于确保数仓数据的安全性和合规性。
  11. 元数据管理

    • 元数据是关于数据的数据,描述了数据仓库中数据的结构、来源、含义和关系等信息。了解如何进行元数据收集、存储、查询和维护,有助于更好地管理和利用数仓中的数据。
  12. 数据仓库的性能优化

    • 数据仓库的性能直接影响到分析查询的速度和效率。了解如何进行数据分区、索引设计、查询优化和并行处理等性能优化技术,对于提高数仓的性能至关重要。
  13. 数据仓库与数据湖

    • 数据湖是一个相对于数据仓库而言的新概念,它强调数据的原始性和灵活性。了解数据湖的特点、适用场景以及与数据仓库的关系,有助于更全面地理解数据存储和分析的解决方案。
  14. 实时数据仓库

    • 随着实时分析需求的增加,实时数据仓库逐渐成为关注的焦点。了解实时数据仓库的架构、技术和挑战,有助于满足企业对实时数据分析的需求。
  15. 数据仓库的维护和升级

    • 数据仓库是一个持续发展的过程,需要定期进行维护和升级。了解如何进行数据备份、恢复、版本控制和迁移等操作,有助于确保数仓的稳定性和可持续性。

二、数仓架构由哪些部分组成?

数仓,即数据仓库(Data Warehouse),是一个大型、集中式的存储和处理数据的系统,通常用于支持企业或组织的决策分析处理。数仓的主要目标是提供决策支持,它整合来自不同业务系统的数据,并进行清洗、转换和加载,以提供一致、准确、及时的数据视图。

数仓通常由以下几个部分组成:

  1. 数据源层(Source Layer):这是数仓的起点,包括企业内部各个业务系统的数据库、外部数据源(如第三方数据提供商)以及实时数据流(如日志数据、传感器数据等)。
  2. ETL层(Extract, Transform, Load):ETL过程负责从数据源中提取数据,进行必要的转换和清洗,然后加载到数据仓库中。这一层通常包括数据清洗、数据转换、数据聚合等操作,以确保数据的质量和一致性。
  3. 数据仓库层(Data Warehouse Layer):这是数仓的核心部分,存储经过ETL处理后的数据。数据仓库层通常包括星型模型(Star Schema)或雪花模型(Snowflake Schema)等数据结构,以支持高效的数据查询和分析。
  4. 数据集市层(Data Marts):数据集市是数据仓库的一个子集,通常针对特定的业务部门或业务场景。数据集市可以提供更加细粒度的数据视图,以满足特定用户的需求。
  5. 前端展示层(Front-End Layer):这一层负责将数据仓库中的数据以可视化或报表的形式展示给用户。前端展示层可以包括各种数据可视化工具、报表工具以及数据分析工具等。

除了以上几个主要部分,数仓还可能包括数据质量管理、数据安全与隐私保护、数据备份与恢复等辅助功能和组件。

总之,数仓是一个集成了多个数据源、经过ETL处理、以支持决策分析处理的大型数据系统。它由多个部分组成,每个部分都扮演着不同的角色,共同协作以实现数仓的目标。

三、数仓的技术方案有哪些?

数仓的技术方案有多种选择,具体取决于企业的技术栈、业务需求、数据量以及预算等因素。以下是一些常见的数仓技术方案:

  1. 传统关系型数据库:如Oracle、SQL Server、MySQL等。这些数据库适用于数据量相对较小、查询性能要求较高的场景。在关系型数据库中,数据通常以表格的形式存储,通过SQL语言进行查询和分析。
  2. 分布式数据库:如Hadoop、Spark等。这些数据库适用于处理海量数据、对查询性能要求不高的场景。分布式数据库将数据分散存储在多个节点上,通过并行处理来提高数据处理效率。
  3. 列式数据库:如Vertica、Apache Drill等。列式数据库将数据按列存储,适用于大数据量、高并发查询的场景。列式数据库通过减少数据扫描量来提高查询性能。
  4. 内存数据库:如Redis、Memcached等。内存数据库将数据存储在内存中,具有极高的读写性能,适用于需要快速响应的场景。但需要注意的是,内存数据库的数据持久性相对较差,需要配合其他存储方案使用。
  5. 云原生数仓:云原生数仓将数据存储在云端,用户无需关心底层基础设施的运维和管理。云原生数仓通常提供丰富的查询和分析功能,以及良好的扩展性和弹性。
  6. 实时数仓:如Apache Kafka、Apache Flink等。实时数仓能够处理实时数据流,提供近实时的数据分析和查询能力。实时数仓通常与消息队列、流处理框架等技术结合使用,实现数据的实时采集、处理和分析。

在选择数仓技术方案时,需要综合考虑企业的业务需求、数据量、预算以及技术团队的能力等因素。同时,随着技术的不断发展,新的数仓技术方案也会不断涌现,企业需要保持对新技术的学习和探索,以便更好地满足业务需求。

四、搭建一个离线数仓的关键步骤

搭建一个离线数仓的步骤及其可能用到的技术方案如下:

  1. 需求分析与规划

    • 步骤内容:明确业务需求,确定数仓建设的目标,如报表生成、数据分析等。进行业务过程的梳理和选择,明确需要建模的业务范围。
    • 技术方案:业务过程梳理可以使用流程图工具,如Visio等,来帮助理解和规划。
  2. 数据源分析

    • 步骤内容:确定数据源的范围和格式,包括数据库、日志文件、API接口等。分析数据源的更新频率、数据量及质量。
    • 技术方案:可以使用数据剖析工具,如Apache Atlas、Informatica Metadata Manager等,进行数据源的分析和管理。
  3. 数据采集与清洗

    • 步骤内容:从数据源中提取数据,并进行清洗、转换和格式化,确保数据的准确性和一致性。
    • 技术方案:数据采集可以使用工具如Apache Sqoop(用于Hadoop与结构化数据存储之间的数据传输)、Logstash(日志数据采集)等。数据清洗和转换可以使用Python、Java等编程语言,结合Pandas、Spark等数据处理库。
  4. 数据建模

    • 步骤内容:根据业务需求,设计数据仓库的逻辑模型和物理模型,包括确定数据的存储结构、索引策略等。
    • 技术方案:逻辑模型设计可以使用ER图工具,如ERwin、Toad Data Modeler等。物理模型设计则需要考虑数据库的具体实现,如使用分布式数据库HDFS、关系型数据库MySQL等。
  5. ETL过程实现

    • 步骤内容:根据设计好的数据模型,编写ETL任务,将清洗后的数据加载到数据仓库中。
    • 技术方案:ETL工具可以选择Apache NiFi、Talend、Informatica等。这些工具都提供了丰富的功能,可以支持复杂的数据转换和处理需求。
  6. 数据存储与管理

    • 步骤内容:在数据仓库中存储和管理数据,包括数据的备份、恢复、安全和性能监控等。
    • 技术方案:数据存储可以选择HDFS、HBase等分布式存储系统,也可以选择关系型数据库如MySQL、Oracle等。数据管理可以使用数据库管理系统(DBMS)提供的工具,如MySQL Workbench、Oracle SQL Developer等。
  7. 数据分析与应用

    • 步骤内容:利用前端工具对数据进行查询、分析和挖掘,满足业务需求。
    • 技术方案:数据分析工具可以选择Tableau、Power BI等可视化分析工具,也可以使用编程语言如Python、R等结合数据分析库如NumPy、Pandas、Matplotlib等进行数据分析。
  8. 维护与优化

    • 步骤内容:定期对数仓进行维护,包括性能优化、错误修复等。根据业务需求的变化,对数仓进行扩展或调整。
    • 技术方案:可以使用数据库性能监控工具,如New Relic、Datadog等,进行性能监控和优化。对于错误修复和扩展调整,则需要根据具体情况选择适当的工具和技术。

五、数仓项目中用到的技术框架

在数仓项目中,用到的技术框架可以分为以下几类:

  1. 数据采集与传输

    • Flume:用于日志数据的采集、聚合和传输。
    • Kafka:分布式流处理平台,用于实时数据的采集和传输。
    • Sqoop:用于在Hadoop和结构化数据存储(如关系型数据库)之间传输数据。
    • Logstash:用于日志数据的收集、解析和传输。
    • DataX:用于大规模数据的离线同步和交换。
  2. 数据存储

    • HDFS(Hadoop Distributed File System):分布式文件系统,用于存储大规模数据。
    • HBase:分布式、可扩展、列式存储的NoSQL数据库。
    • Redis:内存中的数据结构存储系统,用作数据库、缓存和消息代理。
    • MySQL:关系型数据库管理系统。
    • MongoDB:面向文档的NoSQL数据库。
  3. 数据计算与处理

    • Hive:基于Hadoop的数据仓库工具,用于数据查询和分析。
    • Spark:大数据处理框架,支持批处理和流处理。
    • Flink:流处理和批处理的开源平台,用于实时数据分析。
    • Storm:分布式实时计算系统,用于处理大规模数据流。
    • Tez:Hadoop YARN的框架,用于优化Hadoop MapReduce计算。
  4. 数据查询与分析

    • Presto:分布式SQL查询引擎,用于大规模数据的实时查询。
    • Kylin:开源的分布式分析引擎,提供Hadoop上的SQL查询和多维分析(OLAP)能力。
    • Impala:用于查询存储在Hadoop集群中的大规模数据的SQL查询引擎。
    • Druid:高性能、列式、分布式数据存储和查询引擎,适用于OLAP场景。
  5. 数据可视化

    • Echarts:开源的JavaScript可视化库。
    • Superset:数据可视化和探索平台。
    • QuickBI:商业智能和数据可视化工具。
    • DataV:数据可视化大屏工具。
  6. 任务调度与资源管理

    • Azkaban:批处理工作流程调度器,用于运行Hadoop作业或其他脚本。
    • Oozie:Hadoop作业的工作流调度系统。
    • YARN(Yet Another Resource Negotiator):Hadoop的资源管理系统。
  7. 集群监控与管理

    • Zabbix:开源的分布式监控解决方案。
    • Cloudera ManagerAmbari:用于管理Hadoop集群的工具。
  8. 元数据管理

    • Atlas:Apache Atlas提供元数据管理和治理功能,用于Hadoop生态系统。

这些技术框架在数仓项目中根据具体需求和场景进行选择和组合使用。请注意,这里列举的是一些常见的框架,并不意味着它们是唯一或最佳的选择。在实际项目中,可能还需要考虑其他因素,如技术团队的熟悉程度、与现有系统的兼容性等。

六、实时数仓和离线数仓有什么区别

实时数仓和离线数仓在多个方面存在明显的区别:

  1. 架构选择:离线数仓通常采用传统的大数据架构,以Hadoop为核心,结合HDFS作为存储层,使用MapReduce、Hive、Spark等作为计算层。而实时数仓则倾向于采用Kappa架构方式搭建,注重实时数据的处理和分析。

  2. 数据时效性:离线数仓处理的数据结果一般是T+1,即延迟一天。而实时数仓则强调数据的实时性,统计结果通常是分钟级别、秒级别,甚至毫秒级别,能够满足对实时性要求较高的业务场景。

  3. 数据处理方式:离线数仓主要处理历史数据和复杂的分析任务,数据一般批量处理,不强调实时性。而实时数仓则主要处理实时数据流,强调数据的实时采集、清洗、转换、加载等操作,形成面向实时的数据模型。

  4. 数据质量:离线数仓通常具有较高的数据质量和准确性,因为可以对数据进行充分的清洗和校验。而实时数仓由于强调实时性,可能在一定程度上牺牲数据质量,但随着技术的发展,实时数仓的数据质量和准确性也在逐渐提高。

  5. 数据吞吐量:离线数仓的吞吐量一般很高,因为可以批量处理数据。实时数仓在实时处理大量数据时,对数据吞吐量有较高要求,但随着实时技术的发展,其实时吞吐量也在不断提高。

  6. 数据存储:离线数仓一般将数据存储在HDFS、Hive中,而实时数仓则更倾向于将数据存储在Kafka、Hbase、Redis、ClickHouse等系统中,以满足实时处理和分析的需求。

  7. 应用场景:离线数仓更适合处理历史数据和复杂的分析任务,如报表生成、数据挖掘等。而实时数仓则更适用于实时监控、实时分析、实时决策等场景,如电商平台的实时交易分析、金融行业的实时风险监控等。

总之,实时数仓和离线数仓在架构、数据时效性、数据处理方式、数据质量、数据吞吐量、数据存储和应用场景等方面都存在明显的区别。企业在选择搭建数仓时,应根据自身的业务需求和场景来选择合适的数仓类型。

性和高效性。

相关文章:

【数仓】基本概念、知识普及、核心技术

一、数仓基本概念 数仓的定义: 数据仓库(Data Warehouse,简称DW或DWH)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。简言之,它是一个大型存储库,用于存储来…...

ky10-server docker 离线安装包、离线安装

离线安装脚本 # ---------------离线安装docker------------------- rpm -Uvh --force --nodeps *.rpm# 修改docker拉取源为国内 rm -rf /etc/docker mkdir -p /etc/docker touch /etc/docker/daemon.json cat >/etc/docker/daemon.json<<EOF{"registry-mirro…...

Linux的gdb调试

文章目录 一、编译有调试信息的目标文件二、启动gdb调试文件1、查看内容list/l&#xff1a;l 文件名:行号/函数名&#xff0c;l 行号/函数名2、打断点b&#xff1a;b文件名:行号/函数名&#xff0c;b 行号/函数名 与 查看断点info/i&#xff1a;info b3、删除断点d&#xff1a;…...

IO多路复用-select模型

IO多路复用&#xff08;IO Multiplexing&#xff09;是一种高效的网络编程模型&#xff0c;可以同时监控多个文件描述符&#xff08;包括套接字等&#xff09;&#xff0c;并在有数据可读或可写时进行通知。其中&#xff0c;select模型是最常用和最早引入的一种IO多路复用模型。…...

班级事务管理系统设计与实现

** &#x1f345;点赞收藏关注 → 私信领取本源代码、数据库&#x1f345; 本人在Java毕业设计领域有多年的经验&#xff0c;陆续会更新更多优质的Java实战项目希望你能有所收获&#xff0c;少走一些弯路。&#x1f345;关注我不迷路&#x1f345;** 一 、设计说明 1.1 选题…...

金三银四面试必问:Redis真的是单线程吗?

文章目录 01 Redis中的多线程1&#xff09;redis-server&#xff1a;2&#xff09;jemalloc_bg_thd3&#xff09;bio_xxx&#xff1a; 02 I/O多线程03 Redis中的多进程04 结论▼延伸阅读 由面试题“Redis是否为单线程”引发的思考 作者&#xff1a;李乐 来源&#xff1a;IT阅读…...

notejs+nvm+angular+typescript.js环境 Hertzbeat 配置

D:\Program Files\nodejs\ D:\Users\Administrator\AppData\Roaming\nvm nvm命令提示 nvm arch&#xff1a;显示node是运行在32位还是64位。 nvm install <version> [arch] &#xff1a;安装node&#xff0c; version是特定版本也可以是最新稳定版本latest。 可选参…...

docker安装单机版canal和使用

说明&#xff1a;我安装的组件架构如下&#xff1a; 1、准备一台虚拟机&#xff0c;192.168.2.223&#xff0c;我安装的时候&#xff0c;docker只支持canal1.1.6版本&#xff0c;1.1.7无法使用docker安装.还有一点要补充&#xff0c;就是1.1.6好像不支持es8.0以上版本&#x…...

qt_xml文件

文章内容 简单介绍xml文件的增删改查写生成和读取xml文件的例子增删改查 Qt提供了QDomDocument类来操作XML文件。 增加节点: QDomElement root = doc.createElement("root"); doc.appendChild(root);QDomElement element = doc.createElement("element"…...

【DAY05 软考中级备考笔记】线性表,栈和队列,串数组矩阵和广义表

线性表&#xff0c;栈和队列&#xff0c;串数组矩阵和广义表 2月28日 – 天气&#xff1a;阴转晴 时隔好几天没有学习了&#xff0c;今天补上。明天发工资&#xff0c;开心&#x1f604; 1. 线性表 1.1 线性表的结构 首先线性表的结构分为物理结构和逻辑结构 物理结构按照实…...

AutoGen Studio助力打造私人GPTs

微软最近在开源项目里的确挺能整活儿啊! 这次我介绍的是AutoGen Studio,我认为这个项目把AutoGen可用性又拔高了一个层次的项目 项目给自己的定义是交互式的多Agent workflow 项目地址:autogen/samples/apps/autogen-studio at main microsoft/autogen (github.com) 首先我…...

SpringBoot 自定义映射规则resultMap association一对一

介绍 例&#xff1a;学生表&#xff0c;班级表&#xff0c;希望在查询学生的时候一起返回该学生的班级&#xff0c;而一个实体类封装的是一个表&#xff0c;如需要多表查询就需要自定义映射。 表结构 班级表 学生表 SQL语句 SELECT a.id,a.name,a.classes,b.id classes…...

华东地区汽车相关夹具配套企业分布图,你了解多少?

1、华东地区 上海汽车整车厂众多&#xff0c;大多以设计研发为主&#xff0c;注重技术和造型&#xff0c;这与他们的整体风格息息相关。 作为与国际接轨的特大城市&#xff0c;中国的经济、交通、科技、工业、金融、贸易、会展和航运中心&#xff0c;聚集了大量的设计和研发人…...

SpringBoot - 后端数据返回前端各个数据类型全局格式化

全局配置 import com.fasterxml.jackson.annotation.JsonInclude; import com.fasterxml.jackson.databind.ObjectMapper; import com.fasterxml.jackson.databind.SerializationFeature; import com.fasterxml.jackson.databind.module.SimpleModule; import com.fasterxml.j…...

实验室记账项目(java+Mysql+jdbc)

前言&#xff1a; 因为自己学习能力有限和特殊情况必须要找一个项目来做&#xff0c;但是上网搜的那些项目有两种&#xff08;一种是技术太多&#xff0c;自己能力不够&#xff1b;一种是技术太少&#xff0c;项目太简单&#xff09;导致都不适合本人&#xff0c;本人现有技术只…...

spring boot 整合 minio存储 【使用篇】

zi导入依赖 <!--minio--><dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.0.3</version></dependency> yml配置&#xff08;默认配置&#xff09; spring:# 配置文件上传大小限制s…...

【Redis】深入理解 Redis 常用数据类型源码及底层实现(5.详解List数据结构)

本文是深入理解 Redis 常用数据类型源码及底层实现系列的第5篇&#xff5e;前4篇可移步(&#xffe3;∇&#xffe3;)/ 【Redis】深入理解 Redis 常用数据类型源码及底层实现&#xff08;1.结构与源码概述&#xff09;-CSDN博客 【Redis】深入理解 Redis 常用数据类型源码及底…...

Vue+Flask电商后台管理系统

在这个项目中&#xff0c;我们将结合Vue.js前端框架和python后端框架Flask&#xff0c;打造一个功能强大、易于使用的电商后台管理系统 项目演示视频&#xff1a; VueFlask项目 目录 前端环境&#xff08;Vue.js&#xff09;&#xff1a; 后端环境&#xff08;python-Flask&…...

SpringBoot保姆级入门文档

目录 1、SpringBoot的优点 2、和Spring、SpringMVC的对比 3、Xml 和 JavaConfig 1、SpringBoot的优点 2、和Spring、SpringMVC的对比 3、Xml 和 JavaConfig Spring 使用 Xml 作为容器配置文件&#xff0c;在 3.0 以后加入了 JavaConfig&#xff0c;使用 java 类做配置文件使…...

Springboot同一台服务器部署多个项目,导致redis混淆,如何根据不同项目区分

在Spring Boot应用中,如果在同一台服务器上部署了多个项目,并且每个项目都使用Redis作为缓存或存储,为了避免Redis数据混淆,你需要确保各个项目在访问Redis时使用不同的数据库索引号、键前缀或者连接配置。 以下是一些区分不同项目Redis数据的方法: 使用不同数据库索引:…...

【Python】 -- 趣味代码 - 小恐龙游戏

文章目录 文章目录 00 小恐龙游戏程序设计框架代码结构和功能游戏流程总结01 小恐龙游戏程序设计02 百度网盘地址00 小恐龙游戏程序设计框架 这段代码是一个基于 Pygame 的简易跑酷游戏的完整实现,玩家控制一个角色(龙)躲避障碍物(仙人掌和乌鸦)。以下是代码的详细介绍:…...

Debian系统简介

目录 Debian系统介绍 Debian版本介绍 Debian软件源介绍 软件包管理工具dpkg dpkg核心指令详解 安装软件包 卸载软件包 查询软件包状态 验证软件包完整性 手动处理依赖关系 dpkg vs apt Debian系统介绍 Debian 和 Ubuntu 都是基于 Debian内核 的 Linux 发行版&#xff…...

【位运算】消失的两个数字(hard)

消失的两个数字&#xff08;hard&#xff09; 题⽬描述&#xff1a;解法&#xff08;位运算&#xff09;&#xff1a;Java 算法代码&#xff1a;更简便代码 题⽬链接&#xff1a;⾯试题 17.19. 消失的两个数字 题⽬描述&#xff1a; 给定⼀个数组&#xff0c;包含从 1 到 N 所有…...

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型 项目截图 项目简介 社会医疗保险是国家通过立法形式强制实施&#xff0c;由雇主和个人按一定比例缴纳保险费&#xff0c;建立社会医疗保险基金&#xff0c;支付雇员医疗费用的一种医疗保险制度&#xff0c; 它是促进社会文明和进步的…...

【决胜公务员考试】求职OMG——见面课测验1

2025最新版&#xff01;&#xff01;&#xff01;6.8截至答题&#xff0c;大家注意呀&#xff01; 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:&#xff08; B &#xff09; A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...

Reasoning over Uncertain Text by Generative Large Language Models

https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829 1. 概述 文本中的不确定性在许多语境中传达,从日常对话到特定领域的文档(例如医学文档)(Heritage 2013;Landmark、Gulbrandsen 和 Svenevei…...

作为测试我们应该关注redis哪些方面

1、功能测试 数据结构操作&#xff1a;验证字符串、列表、哈希、集合和有序的基本操作是否正确 持久化&#xff1a;测试aof和aof持久化机制&#xff0c;确保数据在开启后正确恢复。 事务&#xff1a;检查事务的原子性和回滚机制。 发布订阅&#xff1a;确保消息正确传递。 2、性…...

CVPR2025重磅突破:AnomalyAny框架实现单样本生成逼真异常数据,破解视觉检测瓶颈!

本文介绍了一种名为AnomalyAny的创新框架&#xff0c;该方法利用Stable Diffusion的强大生成能力&#xff0c;仅需单个正常样本和文本描述&#xff0c;即可生成逼真且多样化的异常样本&#xff0c;有效解决了视觉异常检测中异常样本稀缺的难题&#xff0c;为工业质检、医疗影像…...

二维FDTD算法仿真

二维FDTD算法仿真&#xff0c;并带完全匹配层&#xff0c;输入波形为高斯波、平面波 FDTD_二维/FDTD.zip , 6075 FDTD_二维/FDTD_31.m , 1029 FDTD_二维/FDTD_32.m , 2806 FDTD_二维/FDTD_33.m , 3782 FDTD_二维/FDTD_34.m , 4182 FDTD_二维/FDTD_35.m , 4793...

Tauri2学习笔记

教程地址&#xff1a;https://www.bilibili.com/video/BV1Ca411N7mF?spm_id_from333.788.player.switch&vd_source707ec8983cc32e6e065d5496a7f79ee6 官方指引&#xff1a;https://tauri.app/zh-cn/start/ 目前Tauri2的教程视频不多&#xff0c;我按照Tauri1的教程来学习&…...