【DPDK】基于dpdk实现用户态UDP网络协议栈
文章目录
- 一.背景及导言
- 二.协议栈架构设计
- 1. 数据包接收和发送引擎
- 2. 协议解析
- 3. 数据包处理逻辑
- 三.网络函数编写
- 1.socket
- 2.bind
- 3.recvfrom
- 4.sendto
- 5.close
- 四.总结
一.背景及导言
在当今数字化的世界中,网络通信的高性能和低延迟对于许多应用至关重要。而用户态网络协议栈通过摆脱传统内核态协议栈的限制,为实现更快速、灵活的数据包处理提供了新的可能性。本文将深入探讨基于DPDK的用户态UDP网络协议栈的设计、实现。
传统的内核态协议栈在处理网络通信时通常伴随着较大的性能开销,而用户态网络协议栈的崛起为高性能应用带来了全新的解决方案。DPDK,作为一款用于高性能数据平面应用的工具包,为用户态网络协议栈的实现提供了强大的支持。通过将网络协议栈移植到用户态,我们可以更灵活地优化数据包处理、提高吞吐量,并有效降低处理延迟。
二.协议栈架构设计
网络协议栈整体大致架构如下图所示:

1. 数据包接收和发送引擎
数据包接收和发送引擎负责从网络接口接收数据包,并将数据包发送到目标地址。通过DPDK提供的高性能数据包I/O接口,实现对多队列的支持,以提高并行性和吞吐量。
从网卡接收原始数据放入in_ring:
rte_eth_rx_burst();
从out_ring中取出数据通过网卡发送:
rte_eth_tx_burst();
while(1) {// rxstruct rte_mbuf *rx[BURST_SIZE];// 内存池//接收unsigned num_recvd = rte_eth_rx_burst(gDpdkPortId, 0, rx, BURST_SIZE);if(num_recvd > BURST_SIZE) {rte_exit(EXIT_FAILURE, "Error receiving from eth\n");} else if(num_recvd > 0) {//入队列rte_ring_sp_enqueue_burst(ring->in, (void**)rx, num_recvd, NULL);}// txstruct rte_mbuf *tx[BURST_SIZE];//出队列unsigned nb_tx = rte_ring_sc_dequeue_burst(ring->out, (void**)tx, BURST_SIZE,NULL);if(nb_tx > 0) {//发送rte_eth_tx_burst(gDpdkPortId, 0, tx, nb_tx);unsigned i = 0;for(;i < nb_tx; i++) {rte_pktmbuf_free(tx[i]);}}static uint64_t prev_tsc = 0, cur_tsc;uint64_t diff_tsc;cur_tsc = rte_rdtsc();diff_tsc = cur_tsc - prev_tsc;if(diff_tsc > TIMER_RESOLUTION_CYCLES) {rte_timer_manage();prev_tsc = cur_tsc;}}
2. 协议解析
协议解析模块负责对接收到的UDP数据包进行解析,提取出源和目标端口号、校验和等关键信息。采用高效的解析算法,确保对数据包的处理不成为性能瓶颈。
从原始数据包中解析以太网头:
struct rte_ether_hdr *ehdr = rte_pktmbuf_mtod(mbufs[i],struct rte_ether_hdr*);
从原始数据包中(偏移以太网头)解析arp头:
struct rte_arp_hdr *ahdr = rte_pktmbuf_mtod_offset(mbufs[i],struct rte_arp_hdr *,sizeof(struct rte_ether_hdr));
从原始数据包中解析IP头:
struct rte_ipv4_hdr *iphdr = rte_pktmbuf_mtod_offset(mbufs[i], struct rte_ipv4_hdr *, sizeof(struct rte_ether_hdr));
通过IP头中的网络类型协议可以得知该数据包是UDP,TCP或ICMP包,通过类型强制转换可以得到相对应的数据包协议头。
通过IP头偏移1位强转可得到UDP/TCP头:
struct rte_udp_hdr *udphdr = (struct rte_udp_hdr *)(iphdr + 1);
通过IP头偏移1位强转可得到ICMP头:
struct rte_icmp_hdr *icmphdr = (struct rte_icmp_hdr *)(iphdr + 1);
不同的数据包调用不同的函数处理,通过对数据包的解析可以得到我们想要的IP地址,端口号,以太网地址,数据等。
3. 数据包处理逻辑
数据包处理逻辑包括各种应用层的逻辑,如数据包过滤、路由决策等。这一部分需要具体根据应用场景进行定制,以满足不同需求。
当用户接收并处理完数据包后得到新的用户数据需要发送,此时我们只需要逆向操作接收数据包的过程即可。
一个UDP数据帧组成结构如图所示,在用户数据上添加UDP头,在此基础上再添加IP头,最后再添加以太网头,一个UDP数据帧就组装完毕,就可直接通过网卡发送。

按UDP数据帧结构从用户数据从上往下依次组包。

!](https://img-blog.csdnimg.cn/direct/ede89757233f4dca8eff2eec63826075.png)
//1 etherstruct rte_ether_hdr *eth = (struct rte_ether_hdr*)msg;rte_memcpy(eth->s_addr.addr_bytes, src_mac, RTE_ETHER_ADDR_LEN);//源Mac地址rte_memcpy(eth->d_addr.addr_bytes, dst_mac, RTE_ETHER_ADDR_LEN);//目的Mac地址eth->ether_type = htons(RTE_ETHER_TYPE_IPV4);//类型

//2 iphdrstruct rte_ipv4_hdr *ip = (struct rte_ipv4_hdr*)(msg + sizeof(struct rte_ether_hdr));ip->version_ihl = 0x45; //4位版本,4位首部长度ip->type_of_service = 0;//服务类型ip->total_length = htons(length - sizeof(struct rte_ether_hdr));//总长度ip->packet_id = 0;//16位标识ip->fragment_offset = 0;//偏移ip->time_to_live = 64; //TTLip->next_proto_id = IPPROTO_UDP;//8位协议ip->src_addr = sip;ip->dst_addr = dip;ip->hdr_checksum = 0;ip->hdr_checksum = rte_ipv4_cksum(ip);//首部校验和

//3 udpstruct rte_udp_hdr *udp = (struct rte_udp_hdr*)(msg + sizeof(struct rte_ether_hdr) + sizeof(struct rte_ipv4_hdr));udp->src_port = sport;//源端口udp->dst_port = dport;//目的端口uint16_t udplen = length - sizeof(struct rte_ether_hdr) - sizeof(struct rte_ipv4_hdr);udp->dgram_len = htons(udplen);//长度rte_memcpy((uint8_t*)(udp + 1), data, udplen);udp->dgram_cksum = 0;udp->dgram_cksum = rte_ipv4_udptcp_cksum(ip, udp);//校验和
所有数据包都有以太网头,IP头和arp头为第二层,TCP UDP ICMP为第三次,数据组包的时候只需根据需求选择不同的协议填空即可。
三.网络函数编写
定义主机,包括:唯一标识符,IP地址,Mac地址,协议,recvbuf,senfbuf,互斥锁,条件变量,链表结构。
struct localhost {int fd;uint32_t localip;uint8_t localmac[RTE_ETHER_ADDR_LEN];uint16_t localport;uint8_t protocol;struct rte_ring *recvbuf;struct rte_ring *sendbuf;struct localhost *prev;struct localhost *next;pthread_cond_t cond;pthread_mutex_t mutex;
};static struct localhost *lhost = NULL;
使用Hook自定义网络编程函数,或自定义网络函数名。
1.socket
static int
socket(__attribute__((unused))int domain, int type, __attribute__((unused))int protocol) {int fd = get_fd_frombitmap();struct localhost *host = rte_malloc("localhost", sizeof(struct localhost), 0);if(host == NULL) {return -1;}memset(host, 0, sizeof(struct localhost));host->fd = fd;if(type == SOCK_DGRAM) {host->protocol = IPPROTO_UDP;} host->recvbuf = rte_ring_create("recv buf",RING_SIZE,rte_socket_id(),RING_F_SP_ENQ | RING_F_SC_DEQ);if(host->recvbuf == NULL) {rte_free(host);return -1;}host->sendbuf = rte_ring_create("send buf",RING_SIZE,rte_socket_id(),RING_F_SP_ENQ | RING_F_SC_DEQ);if(host->sendbuf == NULL) {rte_ring_free(host->recvbuf);rte_free(host);return -1;}pthread_cond_t blank_cond = PTHREAD_COND_INITIALIZER;rte_memcpy(&host->cond, &blank_cond, sizeof(pthread_cond_t));pthread_mutex_t blank_mutex = PTHREAD_MUTEX_INITIALIZER;rte_memcpy(&host->mutex, &blank_mutex, sizeof(pthread_mutex_t));LL_ADD(host, lhost);return fd;
}
2.bind
static int bind(int sockfd, const struct sockaddr *addr,__attribute__((unused))socklen_t addrlen) {struct localhost *host = get_hostinfo_fromfd(sockfd);if(host == NULL) {return -1;}const struct sockaddr_in *laddr = (const struct sockaddr_in*)addr;host->localport = laddr->sin_port;rte_memcpy(&host->localip, &laddr->sin_addr.s_addr, sizeof(uint32_t));rte_memcpy(host->localmac, gSrcMac, RTE_ETHER_ADDR_LEN);return 0;
}
3.recvfrom
static ssize_t recvfrom(int sockfd, void *buf, size_t len, __attribute__((unused))int flags,struct sockaddr *src_addr, __attribute__((unused))socklen_t *addrlen){struct localhost *host = get_hostinfo_fromfd(sockfd);if(host == NULL) return -1;struct sockaddr_in *saddr = (struct sockaddr_in*)src_addr;//dequeuestruct offload *ol = NULL;unsigned char *ptr = NULL;int nb = -1;//阻塞pthread_mutex_lock(&host->mutex);while((nb = rte_ring_mc_dequeue(host->recvbuf,(void**)&ol)) < 0) {pthread_cond_wait(&host->cond, &host->mutex);}pthread_mutex_unlock(&host->mutex);saddr->sin_port = ol->sport;rte_memcpy(&saddr->sin_addr.s_addr, &ol->sip, sizeof(uint32_t));struct in_addr addr;addr.s_addr = ol->dip;printf("nrecvto ---> src: %s:%d \n", inet_ntoa(addr), ntohs(ol->dport));if(len < ol->length) { //一次无法接收全部数据rte_memcpy(buf, ol->data, len);ptr = rte_malloc("unsigned char *", ol->length - len, 0);rte_memcpy(ptr, ol->data + len, ol->length - len);ol->length -= len;rte_free(ol->data);ol->data = ptr;rte_ring_mp_enqueue(host->recvbuf, ol);return len;} else {rte_memcpy(buf, ol->data, ol->length);rte_free(ol->data);rte_free(ol);return ol->length;}
}
4.sendto
static ssize_t sendto(int sockfd, const void *buf, size_t len, __attribute__((unused))int flags,const struct sockaddr *dest_addr, __attribute__((unused))socklen_t addrlen){struct localhost *host = get_hostinfo_fromfd(sockfd);if(host == NULL) return -1;const struct sockaddr_in *daddr = (const struct sockaddr_in*)dest_addr;struct offload *ol = rte_malloc("offload", sizeof(struct offload), 0);if(ol == NULL) {return -1;}ol->dip = daddr->sin_addr.s_addr;ol->dport = daddr->sin_port;ol->sip = host->localip;ol->sport = host->localport;ol->length = len;struct in_addr addr;addr.s_addr = ol->dip;printf("nsendto ---> src: %s:%d \n", inet_ntoa(addr), ntohs(ol->dport));ol->data = rte_malloc("ol data", len, 0);if(ol->data == NULL) {rte_free(ol);return -1;}rte_memcpy(ol->data, buf, len);rte_ring_mp_enqueue(host->sendbuf, ol);return len;
}
5.close
static int nclose(int fd) {struct localhost *host = get_hostinfo_fromfd(fd);if(host == NULL) {return -1;}LL_REMOVE(host, lhost);if(host->recvbuf){rte_ring_free(host->recvbuf);}if(host->sendbuf){rte_ring_free(host->sendbuf);}rte_free(host);return 0;
}
四.总结
通过本文,我们深入研究了基于DPDK的用户态UDP网络协议栈的设计、实现。在整体设计思路上,我们采用了用户态网络协议栈的理念,通过将核心功能移至用户空间,结合DPDK的强大支持,实现了一个高性能、低延迟的数据包处理方案。
关键组成部分中,我们详细介绍了数据包接收和发送引擎、协议解析、数据包处理逻辑等模块。这些组成部分共同协作,使得用户态UDP网络协议栈能够在不同应用场景下发挥其优势。
整体架构图清晰展示了各个模块之间的关系,以及数据在协议栈中的流动路径。这有助于读者更好地理解我们设计的用户态UDP网络协议栈的整体结构。
通过对用户态UDP网络协议栈的研究,我们不仅深刻理解了其设计和实现,也为构建更高性能、更灵活的网络通信系统奠定了基础。未来,我们期待在这一基础上进一步优化和扩展,以满足不断发展的网络应用需求。
链接: 基于DPDK实现的UDP用户态网络协议栈完整代码
相关文章:
【DPDK】基于dpdk实现用户态UDP网络协议栈
文章目录 一.背景及导言二.协议栈架构设计1. 数据包接收和发送引擎2. 协议解析3. 数据包处理逻辑 三.网络函数编写1.socket2.bind3.recvfrom4.sendto5.close 四.总结 一.背景及导言 在当今数字化的世界中,网络通信的高性能和低延迟对于许多应用至关重要。而用户态网…...
开源好用的所见即所得(WYSIWYG)编辑器:Editor.js
文章目录 特点基于区块干净的数据 界面与交互插件标题和文本图片列表Todo表格 使用安装创建编辑器实例配置工具本地化自定义样式 今天介绍一个开源好用的Web所见即所得(WYSIWYG)编辑器: Editor.js Editor.js 是一个基于 Web 的所见即所得富文本编辑器,它…...
sqlite 损坏 修复
步骤1 SQLite Download Page下载sqlite3 对应的系统版本 2.参考怎么恢复sqlite 数据库文件✅ - 有乐数据恢复网 sqlite3 dbname > .mode insert > .output dbdump.sql > .dump > .exit 恢复方法1 1.创建一个新的数据库 例如名字叫 test.db 2sqlite3 test.…...
初学Vue——Vue路由
0 什么是Vue路由 类似于Html中的超链接(<a>)一样,可以跳转页面的一种方式。 前端路由:URL中hash(#号之后的内容)与组件之间的对应关系,如下图: 当我们点击左侧导航栏时,浏览器的地址栏会发生变化,路…...
如何使用宝塔面板搭建Discuz并结合cpolar实现远程访问本地论坛
文章目录 前言1.安装基础环境2.一键部署Discuz3.安装cpolar工具4.配置域名访问Discuz5.固定域名公网地址6.配置Discuz论坛 前言 Crossday Discuz! Board(以下简称 Discuz!)是一套通用的社区论坛软件系统,用户可以在不需要任何编程的基础上&a…...
llc的基波分析法
对于我们之前分析的 LLC等效谐振电路的分析,其实我们发现分析的并不是完整的方波输入,而是用正弦波来分的 那么为何用基波来分析呢,因为对于方波而言,根据傅里叶级数它是可以分解成基波、 1次、3次、5次.......等各种奇次谐波的入…...
一键清除JavaScript代码中的注释:使用正则表达式实现
这个正则表达式可以有效地匹配 JavaScript 代码中的各种注释,并且跳过了以 http: 或 https: 开头的链接。 /\/\*[\s\S]*?\*\/|\/\/[^\n]*|<!--[\s\S]*?-->|(?<!http:|https:)\/\/[^\n]*/gvscode 实战,ctrlF 调出查找替换工具,点…...
第七次作业
IPSEC VPPN实验配置 目标:在FW5和FW3之间建立一条IPSEC通道,保证10.0.2.0/24网段可以正常访问到192.168.1.0/24 1.FW1和FW2进行双机热备(之前实验没保存,可看上个实验) 还有一些配置前面实验有。 2.场景选择点对点…...
在jupyternotebook中,如何解决作图时负号无法显示的问题?
输入以下代码即可。 import matplotlib as mpl mpl.rcParams[axes.unicode_minus] False 原文链接:在jupyternotebook中,如何解决作图时负号无法显示的问题?...
ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。
发生的错误信息: File "C:\Users\malongqiang\.conda\envs\ObjectDetection\lib\ssl.py", line 1309, in do_handshakeself._sslobj.do_handshake() ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。 分析原因: …...
主流开发语言与环境介绍
主流开发语言与环境介绍 1. 引言 随着计算机科学的不断发展,各种编程语言和开发环境层出不穷。选择一种适合自己的主流开发语言和环境是每个开发者都必须面临的问题。本文将为大家介绍几种目前最为流行的主流开发语言和环境,帮助读者选择合适的工具进行…...
Unity性能优化篇(九) 模型优化之LOD技术概述以及操作方法
LOD模型优化技术概述: 1.LOD技术可以根据摄像头远近来显示不同精度的模型(例如吃鸡游戏 随着跳伞高度 来显示下面树木以及建筑的模型精度) LOD模型优化技术操作方法: 可使用Unity自带的LOD Group组件,并根据项目的情况来调整该组件的属性。Untiy资源商店也有一些其…...
就业班 2401--3.11 Linux Day15--ftp数据传输测试server和client+谷歌验证码登录远程连接
文件服务器 路漫漫其修远兮,吾将上下而求索.构建NFS远程共享存储 一、NFS介绍 文件系统级别共享(是NAS存储) --------- 已经做好了格式化,可以直接用。 速度慢比如:nfs,sambaNFS NFS:Networ…...
有点NB的免费wordpress主题模板
一个不错的黄色模板,用WP免费主题模板搭建家政服务公司网站。 https://www.wpniu.com/themes/15.html...
安全防御第七次作业
拓扑图如图所示: 问题:在FW7和FW8之间建立一条IPSEC通道保证10.0.2.0/24网段 可以正常访问到192.168.1.0/24 注:基础配置我在此省略了 一、NAT配置 FW4: FW6: 二、在FW4上做服务器映射 三、配置IPSEC FW5ÿ…...
解决跨域问题的FastAPI应用及常见报错解析
介绍: 跨域问题在前后端分离的Web应用中经常会遇到。FastAPI作为一个快速、现代化的Python Web框架,在处理跨域问题上也提供了一些解决方案。本文将介绍如何使用FastAPI来解决跨域问题,并分析一些常见的报错及解决方法。 正文: …...
NXP iMX8MM Cortex-M4 核心 GPT Capture 测试
By Toradex秦海 1). 简介 NXP i.MX8 系列处理器均为异构多核架构 SoC,除了可以运行 Linux 等复杂操作系统的 Cortax-A 核心,还包含了可以运行实时操作系统比如 FreeRTOS 的 Cortex-M 核心,本文就演示通过 NXP i.MX8MM 处理器集成的 Cortex-…...
2步破解官方sublime4
sublime简要破解流程 1.下载sublime官方最新版2. 破解流程 1.下载sublime官方最新版 打开 官方网站下载 portable version 版,省的安装。。解压到任意位置,备份 sublime_text.exe 文件 2. 破解流程 打开网址把文件 sublime_text.exe 拖入网页搜索替换…...
【智能家居】东胜物联ODM定制ZigBee网关,助力能源管理解决方案商,提升市场占有率
背景 本文案例服务的客户是专业从事智能家居能源管理的解决方案商,其产品与服务旨在帮助用户监测、管理和优化能源消耗,以提高能源使用效率。 随着公司的扩张,为了增加市场占有率,他们希望找到更好的硬件服务支持,以…...
Python爬虫实战第三例【三】【上】
零.实现目标 爬取视频网站视频 视频网站你们随意,在这里我选择飞某速(狗头保命)。 例如,作者上半年看过的“铃芽之旅”,突然想看了,但是在正版网站看要VIP,在盗版网站看又太卡了,…...
【根据当天日期输出明天的日期(需对闰年做判定)。】2022-5-15
缘由根据当天日期输出明天的日期(需对闰年做判定)。日期类型结构体如下: struct data{ int year; int month; int day;};-编程语言-CSDN问答 struct mdata{ int year; int month; int day; }mdata; int 天数(int year, int month) {switch (month){case 1: case 3:…...
QMC5883L的驱动
简介 本篇文章的代码已经上传到了github上面,开源代码 作为一个电子罗盘模块,我们可以通过I2C从中获取偏航角yaw,相对于六轴陀螺仪的yaw,qmc5883l几乎不会零飘并且成本较低。 参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...
(二)TensorRT-LLM | 模型导出(v0.20.0rc3)
0. 概述 上一节 对安装和使用有个基本介绍。根据这个 issue 的描述,后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作,其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...
连锁超市冷库节能解决方案:如何实现超市降本增效
在连锁超市冷库运营中,高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术,实现年省电费15%-60%,且不改动原有装备、安装快捷、…...
Java - Mysql数据类型对应
Mysql数据类型java数据类型备注整型INT/INTEGERint / java.lang.Integer–BIGINTlong/java.lang.Long–––浮点型FLOATfloat/java.lang.FloatDOUBLEdouble/java.lang.Double–DECIMAL/NUMERICjava.math.BigDecimal字符串型CHARjava.lang.String固定长度字符串VARCHARjava.lang…...
oracle与MySQL数据库之间数据同步的技术要点
Oracle与MySQL数据库之间的数据同步是一个涉及多个技术要点的复杂任务。由于Oracle和MySQL的架构差异,它们的数据同步要求既要保持数据的准确性和一致性,又要处理好性能问题。以下是一些主要的技术要点: 数据结构差异 数据类型差异ÿ…...
使用van-uploader 的UI组件,结合vue2如何实现图片上传组件的封装
以下是基于 vant-ui(适配 Vue2 版本 )实现截图中照片上传预览、删除功能,并封装成可复用组件的完整代码,包含样式和逻辑实现,可直接在 Vue2 项目中使用: 1. 封装的图片上传组件 ImageUploader.vue <te…...
Module Federation 和 Native Federation 的比较
前言 Module Federation 是 Webpack 5 引入的微前端架构方案,允许不同独立构建的应用在运行时动态共享模块。 Native Federation 是 Angular 官方基于 Module Federation 理念实现的专为 Angular 优化的微前端方案。 概念解析 Module Federation (模块联邦) Modul…...
Spring AI与Spring Modulith核心技术解析
Spring AI核心架构解析 Spring AI(https://spring.io/projects/spring-ai)作为Spring生态中的AI集成框架,其核心设计理念是通过模块化架构降低AI应用的开发复杂度。与Python生态中的LangChain/LlamaIndex等工具类似,但特别为多语…...
LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf
FTP 客服管理系统 实现kefu123登录,不允许匿名访问,kefu只能访问/data/kefu目录,不能查看其他目录 创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...
