chacha20 算法流程
chacha20
算法请参看 RFC
:7539
。下面是我的理解,欢迎指正。
chacha20
算法的基本思想:加密时,将明文数据与用户之间约定的某些数据进行异或操作,得到密文数据;由异或操作的特点可知,在解密时,只需要将密文数据与用户之间约定的那些数据再次进行异或操作,就得到了明文数据。
用相同值异或两次就能恢复出原来的值,所以加密和解密都严格采用同一个程序。
从原理上来说,chacha20
的加解密过程还是非常简单的。这里面的难点在于理解 chacha20
中那些用来与明文数据进行异或的数据是如何生成的,这就是 chacha20
算法的核心所在。
大体的流程是这样的:首先,用户之间会约定一些初始的元数据,简单起见,称之为 KEYS_INIT
,则 KEYS_INIT
需要经过某种运算,得到另外一个 KEYS_1
,然后用 KEYS_1
与明文数据的第 1
个分组进行异或,以得到密文数据的第 1
个分组,接下来,KEYS_INIT
再经过某种运算,得到另外一个 KEYS_2
,然后用 KEYS_2
与明文数据的第 2
个分组进行异或,以得到密文数据的第 2
个分组,以此类推,直到处理完所有的明文分组。从这里可以看到,与每个明文分组进行异或的数据(KEY_n
)是不相同的,且与分组所对应的顺序有关。
下面讲解一下如何由 KEY_INIT
得到 KEY_1
, KEY_2
, ...
, KEY_n
。
首先需要明确的是,在 chacha20
算法中,KEY_INIT
和 KEY_n
的长度是相同的,都是 64
个字节。因此,明文分组的长度也是 64
字节,即 16
个 4
字节整数。
其中,KEY_INIT
由 4
部分组成:
KEY_INIT[0]
~ KEY_INIT[15]
是 16
字节的常量(constant
);
KEY_INIT[16]
~ KEY_INIT[47]
是 32
字节的 key
;
KEY_INIT[48]
~ KEY_INIT[51]
是 4
字节的 block counter
;
KEY_INIT[52]
~ KEY_INIT[63]
是 12
字节的 nonce
。
按顺序将上述 16
个 4
字节整数排列成 4x4
的矩阵,记为矩阵 M
,它的内容示意如下:
cccccccc cccccccc cccccccc cccccccc
kkkkkkkk kkkkkkkk kkkkkkkk kkkkkkk
kkkkkkkk kkkkkkkk kkkkkkkk kkkkkkk
bbbbbbbb nnnnnnnn nnnnnnnn nnnnnnnn
其中,
c
表示 constant
的 4
个 bit
;
k
表示 key
的 4
个 bit
;
b
表示 block counter
的 4
个 bit
;
n
表示 nonce
的 4
个 bit
上面之所以把 64
字节的 KEY_INIT
排列成矩阵的形式,是因为后续的计算都是在这个矩阵上展开的,写成矩阵形式后,能很清楚看到每次参与计算的元素的相对位置。
基于上述的 4x4
矩阵,chacha20
里面的运算包含两种形式:列运算
和对角线运算
。先暂时不说列运算
和对角线运算
的具体含义,先讲讲计算中涉及的 "轮"
的概念,简单讲,"轮"
是若干个运算步骤的组合,chacha20
中的 20
就是指进行 20
轮运算。在 chacha20
中, 1
个"轮"
还可以进一步划分为 4
个 "四分之一轮"
,也就是说,chacha20
包含 80
个 四分之一轮
组成的运算。
终于讲到四分之一轮
的概念了,先给出四分之一轮
的定义,如下所示:
a += b; d ^= a; d <<<= 16;
c += d; b ^= c; b <<<= 12;
a += b; d ^= a; d <<<= 8;
c += d; b ^= c; b <<<= 7;
从上述定义可以看到,四分之一轮
的定义很简单,只有 4
个变量参与运算,共计 12
个基本操作,涉及 3
种普通运算:加法、异或、循环移位。值得注意的是,这 4
个变量都是 4
字节整数,加法运算是模 2^32
的。
现在可以猜到,在每个四分之一轮
中,a
, b
, c
, d
这 4
个 4
字节整数均来自于矩阵 M
,现在来讲讲列运算
和对角线运算
的含义。先用 4
字节整数出现的顺序来重新表示矩阵 M
,记为矩阵 T
:
0 1 2 3
4 5 6 7
8 9 10 11
12 13 14 15
有了上述索引表示,则所谓的列运算
就是:在四分之一轮
中,a
, b
, c
, d
这 4
个 4
字节整数在矩阵 M
中的索引为矩阵 T
的某个列向量
。
具体来说就是,
对于第 1
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 0
, 4
, 8
, 12
,
对于第 2
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 1
, 5
, 9
, 13
,
对于第 3
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 2
, 6
, 10
, 14
,
对于第 4
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 3
, 7
, 11
, 15
。
同理,所谓的对角线运算
就是:在四分之一轮
中,a
, b
, c
, d
这 4
个 4
字节整数在矩阵 M
中的索引为矩阵 T
的对角线元素
。
具体来说就是,
对于第 1
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 0
, 5
, 10
, 15
,
对于第 2
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 1
, 6
, 11
, 12
,
对于第 3
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 2
, 7
, 8
, 13
,
对于第 4
个四分之一轮
而言,a
, b
, c
, d
在矩阵 M
中的索引为 3
, 4
, 9
, 14
。
有了上述背景知识,现在就可以对 chacha20
中的 20
轮运算有一个整体的认识:在 chacha20
中,先执行 4
个 四分之一轮
的列运算
,再执行 4
个四分之一轮
的对角线运算
,然后将这两轮运算
重复10
遍,这样一共就是 20
轮运算,在执行完 20
轮运算后,得到一个新的矩阵,记为矩阵 S
,然后还需要将原矩阵 M
与刚刚得到的矩阵 S
对应位置元素相加,以便得到最终的矩阵,记为矩阵 W
,最后以小端序将矩阵 W
的 16
个 4
字节整数整理为一个 64
字节的数据块(也即上述中的 KEY_n
),并与 64
字节的明文分组相异或,得到对应的密文分组。
综上所述,在 chacha20
中,明文数据会被划分为若干个 64
字节的分组,然后通过 chacha20
算法计算出对应的 KEY_n
(也即是上述中的矩阵 W
),并让明文分组与 KEY_n
相异或,得到对应的密文分组。其中最重要的一点是,在每处理完一个分组后,矩阵 M
中的 block counter
部分需要自增 1
,其他三个部分( constant
, key
,nonce
)保持不变,这样就确保了对于不同的明文分组,对应的 KEY_n
是不同的。若最后一个明文分组不足 64
字节,则只异或 KEY_n
中对应的字节。因此,即使明文分组不足 64
字节,也不影响计算,但对应的 KEY_n
的所有字节(矩阵 W
的所有元素)需要被全部计算出来。
忘了说了,KEY_INIT
中的前 16
字节 constant
是个字符串,它的内容是:"expand 32-byte k"
,数一下应该是 16
字节。
下面给出 chacha20
算法的 C
语言实现,摘自 OpenSSL
项目的 crypto/chacha/chacha_enc.c
文件,可以在 github
或 gitee
上再看看这段代码:
https://github.com/openssl/openssl/blob/master/crypto/chacha/chacha_enc.c
https://gitee.com/mirrors/openssl/blob/master/crypto/chacha/chacha_enc.c
typedef unsigned int u32;
typedef unsigned char u8;
typedef union {u32 u[16];u8 c[64];
} chacha_buf;# define ROTATE(v, n) (((v) << (n)) | ((v) >> (32 - (n))))# define U32TO8_LITTLE(p, v) do { \(p)[0] = (u8)(v >> 0); \(p)[1] = (u8)(v >> 8); \(p)[2] = (u8)(v >> 16); \(p)[3] = (u8)(v >> 24); \} while(0)/* QUARTERROUND updates a, b, c, d with a ChaCha "quarter" round. */
# define QUARTERROUND(a,b,c,d) ( \x[a] += x[b], x[d] = ROTATE((x[d] ^ x[a]),16), \x[c] += x[d], x[b] = ROTATE((x[b] ^ x[c]),12), \x[a] += x[b], x[d] = ROTATE((x[d] ^ x[a]), 8), \x[c] += x[d], x[b] = ROTATE((x[b] ^ x[c]), 7) )/* chacha_core performs 20 rounds of ChaCha on the input words in* |input| and writes the 64 output bytes to |output|. */
static void chacha20_core(chacha_buf *output, const u32 input[16])
{u32 x[16];int i;DECLARE_IS_ENDIAN;memcpy(x, input, sizeof(x));for (i = 20; i > 0; i -= 2) {QUARTERROUND(0, 4, 8, 12);QUARTERROUND(1, 5, 9, 13);QUARTERROUND(2, 6, 10, 14);QUARTERROUND(3, 7, 11, 15);QUARTERROUND(0, 5, 10, 15);QUARTERROUND(1, 6, 11, 12);QUARTERROUND(2, 7, 8, 13);QUARTERROUND(3, 4, 9, 14);}if (IS_LITTLE_ENDIAN) {for (i = 0; i < 16; ++i)output->u[i] = x[i] + input[i];} else {for (i = 0; i < 16; ++i)U32TO8_LITTLE(output->c + 4 * i, (x[i] + input[i]));}
}void ChaCha20_ctr32(unsigned char *out, const unsigned char *inp,size_t len, const unsigned int key[8],const unsigned int counter[4])
{u32 input[16];chacha_buf buf;size_t todo, i;/* sigma constant "expand 32-byte k" in little-endian encoding */input[0] = ((u32)ossl_toascii('e')) | ((u32)ossl_toascii('x') << 8)| ((u32)ossl_toascii('p') << 16)| ((u32)ossl_toascii('a') << 24);input[1] = ((u32)ossl_toascii('n')) | ((u32)ossl_toascii('d') << 8)| ((u32)ossl_toascii(' ') << 16)| ((u32)ossl_toascii('3') << 24);input[2] = ((u32)ossl_toascii('2')) | ((u32)ossl_toascii('-') << 8)| ((u32)ossl_toascii('b') << 16)| ((u32)ossl_toascii('y') << 24);input[3] = ((u32)ossl_toascii('t')) | ((u32)ossl_toascii('e') << 8)| ((u32)ossl_toascii(' ') << 16)| ((u32)ossl_toascii('k') << 24);input[4] = key[0];input[5] = key[1];input[6] = key[2];input[7] = key[3];input[8] = key[4];input[9] = key[5];input[10] = key[6];input[11] = key[7];input[12] = counter[0];input[13] = counter[1];input[14] = counter[2];input[15] = counter[3];while (len > 0) {todo = sizeof(buf);if (len < todo)todo = len;chacha20_core(&buf, input);for (i = 0; i < todo; i++)out[i] = inp[i] ^ buf.c[i];out += todo;inp += todo;len -= todo;/** Advance 32-bit counter. Note that as subroutine is so to* say nonce-agnostic, this limited counter width doesn't* prevent caller from implementing wider counter. It would* simply take two calls split on counter overflow...*/input[12]++;}
}
参考资料:
chacha20
算法的RFC
: https://www.rfc-editor.org/rfc/rfc7539
相关文章:
chacha20 算法流程
chacha20算法请参看 RFC:7539。下面是我的理解,欢迎指正。 chacha20算法的基本思想:加密时,将明文数据与用户之间约定的某些数据进行异或操作,得到密文数据;由异或操作的特点可知,在解密时,只需…...

准备篇(三)Python 爬虫第三方库
第三方库无法将 "pip" 识别ModuleNotFoundError: No module named pip install 安装路径相关问题requests 库和 BeautifulSoup 库requests 库BeautifulSoup 库第三方库 Python 的 标准库 中提供了许多有用的模块和功能,如字符串处理、网络通信、多线程等,但它们并…...

从零开始的PICO开发教程(4)-- VR世界 射线传送、旋转和移动
从零开始的PICO开发教程(4)-- VR世界 射线传送、旋转和移动 文章目录 从零开始的PICO开发教程(4)-- VR世界 射线传送、旋转和移动一、前言1、大纲 二、VR射线移动功能实现与解析1、区域传送(1)新建 XR Orig…...

防止攥改之水印功能组件
防止攥改之水印功能组件 效果图逻辑代码 效果图 逻辑代码 <template><div class"containerBox" ref"parentRef" style"height: 300px;background-color: red;"><slot></slot></div> </template><script…...
iOS 17 适配 Xcode 15 问题
在适配 iOS 17 xcode 15时遇到的问题,记录一下。 1、 Could not build module ‘WebKit’ type argument nw_proxy_config_t (aka struct nw_proxy_config *) is neither an Objective-C object nor a block type解决方案: 选中不能编译的库的xcodep…...
Element Plus 快速开始
1.完整引入(全局引入) // main.ts import { createApp } from vue import ElementPlus from element-plus import element-plus/dist/index.css import App from ./App.vueconst app createApp(App)app.use(ElementPlus) app.mount(#app) npm install e…...

华为云云耀云服务器L实例评测|StackEdit中文版在线Markdown笔记工具
华为云云耀云服务器L实例评测|StackEdit中文版在线Markdown笔记工具 一、云耀云服务器L实例介绍1.1 云服务器介绍1.2 应用场景1.3 支持镜像 二、云耀云服务器L实例配置2.1 重置密码2.2 服务器连接2.3 安全组配置 三、部署 StackEdit 中文版3.1 StackEdit 介绍3.2 环…...
MyEclipse报错javax/persistence/EntityManagerFactory
MyEclipse报错: Build path is incomplete. Cannot find class file for javax/persistence/EntityManagerFactory 解决方案: 引入依赖 <dependency><groupId>javax.persistence</groupId> <artifactId>persistence-api</a…...

【MySQL进阶】SQL性能分析
一、SQL性能分析 1.SQL执行频率 MySQL 客户端连接成功后,通过 show [session|global] status 命令可以提供服务器状态信 息。通过如下指令,可以查看当前数据库的 INSERT 、 UPDATE 、 DELETE 、 SELECT 的访问频次: -- session 是查看当…...

在SpringBoot项目中整合SpringSession,基于Redis实现对Session的管理和事件监听
1、SpringSession简介 SpringSession是基于Spring框架的Session管理解决方案。它基于标准的Servlet容器API,提供了Session的分布式管理解决方案,支持把Session存储在多种场景下,比如内存、MongoDB、Redis等,并且能够快速集成到Spr…...
浅析vue中computed,method,watch,watchEffect的区别
方法methods只要调用每次都会执行watch(惰性)只有依赖项更新才会执行回调函数,且组件初次渲染不会执行watchEffect:自动追踪依赖变化,只要依赖更新即执行回调函数,且组件初次渲染即执行回调函数computed(惰性): 返回一个只读的ref,具有缓存功…...

activiti7的数据表和字段的解释
activiti7的数据表和字段的解释 activiti7版本有25张表,而activiti6有28张表,activiti5有27张表,绝大部分的表和字段的含义都是一样的,所以本次整理的activiti7数据表和字段的解释,也同样适用于activiti6和5。 1、总览…...
Java手写Trie树和Trie树应用拓展案例
Java手写Trie树和Trie树应用拓展案例 1. 算法思维导图 以下是使用mermaid代码表示的Trie树的实现原理: #mermaid-svg-5twy24X7Wqbhyulb {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-5twy24X7Wqbhyul…...

alova.js快速入门教程
官网地址:Alova.JS - Lightweight request strategy library | Alova.JS 目录 一、alova 是什么? 二、 快速入门 1、安装依赖 (1)使用npm方式安装 (2)使用yarn方式安装 2、在静态 html 中使用 一、al…...
获取IP地址-根据IP获取位置信息
获取外网IP地址,并得到该地址所在位置; 如:101.249.255.255 对应:西藏自治区-拉萨市-堆龙德庆区 string ipAddress GetIPAddress(); string location GetIPLocation(ipAddress); /// <summary>/// 获取IP地址/// </s…...

Android13适配-Google官方照片视频选择器
官方照片选择器 图 1. 照片选择器提供了一个直观的界面,便于与您的应用分享照片。 照片选择器的界面可供浏览和搜索,并按日期降序向用户显示其媒体库中的文件。如隐私保护最佳实践 Codelab 中所示,照片选择器为用户提供了一种安全的内置授权…...
云计算的发展趋势和挑战
本文将探讨云计算的发展趋势和挑战,旨在帮助读者了解云计算的最新动态和未来发展方向。 随着信息技术的发展,云计算作为一种新兴的计算模式,已经得到了广泛的应用和认可。它通过将计算资源、存储资源和应用程序等服务通过互联网提供给用户&a…...

PyG-GAT-Cora(在Cora数据集上应用GAT做节点分类)
文章目录 model.pymain.py参数设置运行图 model.py import torch.nn as nn from torch_geometric.nn import GATConv import torch.nn.functional as F class gat_cls(nn.Module):def __init__(self,in_dim,hid_dim,out_dim,dropout_size0.5):super(gat_cls,self).__init__()s…...
java专项练习(验证码)
package 专题练习;import java.util.Random;public class Developing_CAPTCHA {public static void main(String[] args) {/* 需求:定义方法生成一个5位的验证码 验证码长度为5,前四位为大或小写字母,最后一位是数字*///方法: 如果我们要在一堆没有规律的数据中随机抽取,可以先…...

MS1861 视频处理与显示控制器 HDMI转MIPI LVDS转MIPI带旋转功能 图像带缩放,旋转,锐化
1. 基本介绍 MS1861 单颗芯片集成了 HDMI 、 LVDS 和数字视频信号输入;输出端可以驱动 MIPI(DSI-2) 、 LVDS 、 Mini-LVDS 以及 TTL 类型 TFT-LCD 液晶显示。可支持对输入视频信号进行滤波,图 像增强,锐化,对比度调节&am…...
mongodb源码分析session执行handleRequest命令find过程
mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程,并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令,把数据流转换成Message,状态转变流程是:State::Created 》 St…...
代码随想录刷题day30
1、零钱兑换II 给你一个整数数组 coins 表示不同面额的硬币,另给一个整数 amount 表示总金额。 请你计算并返回可以凑成总金额的硬币组合数。如果任何硬币组合都无法凑出总金额,返回 0 。 假设每一种面额的硬币有无限个。 题目数据保证结果符合 32 位带…...

Golang——6、指针和结构体
指针和结构体 1、指针1.1、指针地址和指针类型1.2、指针取值1.3、new和make 2、结构体2.1、type关键字的使用2.2、结构体的定义和初始化2.3、结构体方法和接收者2.4、给任意类型添加方法2.5、结构体的匿名字段2.6、嵌套结构体2.7、嵌套匿名结构体2.8、结构体的继承 3、结构体与…...
Kafka主题运维全指南:从基础配置到故障处理
#作者:张桐瑞 文章目录 主题日常管理1. 修改主题分区。2. 修改主题级别参数。3. 变更副本数。4. 修改主题限速。5.主题分区迁移。6. 常见主题错误处理常见错误1:主题删除失败。常见错误2:__consumer_offsets占用太多的磁盘。 主题日常管理 …...
Java求职者面试指南:Spring、Spring Boot、Spring MVC与MyBatis技术解析
Java求职者面试指南:Spring、Spring Boot、Spring MVC与MyBatis技术解析 一、第一轮基础概念问题 1. Spring框架的核心容器是什么?它的作用是什么? Spring框架的核心容器是IoC(控制反转)容器。它的主要作用是管理对…...
上位机开发过程中的设计模式体会(1):工厂方法模式、单例模式和生成器模式
简介 在我的 QT/C 开发工作中,合理运用设计模式极大地提高了代码的可维护性和可扩展性。本文将分享我在实际项目中应用的三种创造型模式:工厂方法模式、单例模式和生成器模式。 1. 工厂模式 (Factory Pattern) 应用场景 在我的 QT 项目中曾经有一个需…...
6个月Python学习计划 Day 16 - 面向对象编程(OOP)基础
第三周 Day 3 🎯 今日目标 理解类(class)和对象(object)的关系学会定义类的属性、方法和构造函数(init)掌握对象的创建与使用初识封装、继承和多态的基本概念(预告) &a…...

【Post-process】【VBA】ETABS VBA FrameObj.GetNameList and write to EXCEL
ETABS API实战:导出框架元素数据到Excel 在结构工程师的日常工作中,经常需要从ETABS模型中提取框架元素信息进行后续分析。手动复制粘贴不仅耗时,还容易出错。今天我们来用简单的VBA代码实现自动化导出。 🎯 我们要实现什么? 一键点击,就能将ETABS中所有框架元素的基…...
面试高频问题
文章目录 🚀 消息队列核心技术揭秘:从入门到秒杀面试官1️⃣ Kafka为何能"吞云吐雾"?性能背后的秘密1.1 顺序写入与零拷贝:性能的双引擎1.2 分区并行:数据的"八车道高速公路"1.3 页缓存与批量处理…...
用递归算法解锁「子集」问题 —— LeetCode 78题解析
文章目录 一、题目介绍二、递归思路详解:从决策树开始理解三、解法一:二叉决策树 DFS四、解法二:组合式回溯写法(推荐)五、解法对比 递归算法是编程中一种非常强大且常见的思想,它能够优雅地解决很多复杂的…...