使用C语言将ASCII明文编码为GSM短信体格式
一、背景介绍
GSM(Global System for Mobile Communications)是全球移动通信系统的简称,而GSM 03.38是GSM系统中用于短信编码的标准。GSM 03.38字符集采用7-bit编码,与ASCII的8-bit编码有所不同。为了将ASCII编码的文本转换为GSM短信格式,我们需要进行一系列的转换操作。

** 二、GSM短信内容格式解析 **
短信内容的基本构成
GSM短信的内容主要包括以下几个部分:
-
消息头(Header):包含短信的发送方和接收方的信息,如电话号码、短信中心等。这部分信息通常由移动网络运营商自动处理,用户无需关心。
-
消息体(Body):即短信的实际内容,可以是文本、数字、符号等。GSM短信的标准长度是160个字符(7-bit编码),但也可以支持更长的消息,通过连接多条短信实现。
-
时间戳(Timestamp):记录短信的发送或接收时间。这个时间戳对于用户了解短信的时效性非常重要。
-
编码与字符集
GSM短信的字符集和编码方式对其内容格式有重要影响。以下是一些关键概念:
- GSM 03.38字符集:这是一种专为GSM短信设计的字符集,包含了大多数拉丁字母、数字、标点符号和一些特殊字符。这个字符集是7-bit编码的,因此每条短信最多可以包含160个字符。
- Unicode编码:为了支持更多语言和字符,GSM短信也可以采用Unicode编码(如UTF-8或UTF-16)。但是,Unicode编码会导致每条短信的字符数减少,因为每个字符需要更多的字节来表示。
3、长短信与连接短信
当一条短信的内容超过160个字符时,它可以被拆分成多条短信进行发送。这种拆分和重新组装的过程对于用户来说是透明的,他们只会看到一条连续的、完整的消息。这种超过160个字符的短信通常被称为“长短信”或“连接短信”。
4、特殊格式与功能
除了基本的文本消息外,GSM短信还支持一些特殊格式和功能,如:
- 闪烁文本:通过特定的编码方式,可以使短信中的某些文本在接收方的手机上闪烁显示。
- 铃声提示:发送方可以选择特定的铃声作为接收方收到短信时的提示音。
- 图形和图片:虽然传统的GSM短信主要支持文本内容,但随着技术的发展,现在也可以发送包含图形和图片的彩信(MMS)。
- 链接和嵌入数据:一些高级的短信服务还支持在短信中嵌入链接或其他数据,如位置信息、联系人卡片等。
三、转换步骤
- 字符映射:由于ASCII和GSM 03.38字符集并不完全一致,首先需要建立一个ASCII到GSM 03.38的映射表。这个映射表将ASCII字符映射到对应的GSM 03.38字符上。
- 7-bit编码:将每个GSM 03.38字符转换为7-bit格式。这意味着每8个字符可以压缩为7个字节。
- 处理非GSM字符:对于不在GSM 03.38字符集中的ASCII字符,需要进行特殊处理,如替换或转义。
四、C语言实现
下面是一个使用C语言实现ASCII到GSM 03.38编码的示例代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>// ASCII到GSM 03.38的映射表(仅示例,不完整)
unsigned char asciiToGsm[128] = {// ... 其他字符映射'A', 'B', 'C', // ASCII大写字母映射到GSM大写字母// ... 其他字符映射'a', 'b', 'c', // ASCII小写字母映射到GSM小写字母// ... 其他特殊字符和扩展字符映射
};// 将ASCII字符转换为GSM 03.38字符
unsigned char convertAsciiToGsm(unsigned char c) {if (c < 128 && asciiToGsm[c] != 0) {return asciiToGsm[c]; // 如果在映射表中,返回对应的GSM字符} else {return '?'; // 对于不在映射表中的字符,返回'?'作为替换字符}
}// 将ASCII字符串转换为GSM格式并输出
void encodeAsciiToGsm(const char* asciiStr) {unsigned char* gsmStr = (unsigned char*)malloc(strlen(asciiStr) + 1); // 为GSM字符串分配内存for (int i = 0; asciiStr[i] != '\0'; i++) {gsmStr[i] = convertAsciiToGsm((unsigned char)asciiStr[i]); // 转换每个字符}gsmStr[strlen(asciiStr)] = '\0'; // 添加字符串结束符printf("GSM编码: %s\n", gsmStr); // 输出GSM编码的字符串free(gsmStr); // 释放内存
}int main() {const char* asciiMessage = "Hello, World!"; // ASCII明文消息encodeAsciiToGsm(asciiMessage); // 将ASCII消息编码为GSM格式并输出return 0;
}
这段代码定义了一个convertAsciiToGsm函数,用于将单个ASCII字符转换为对应的GSM 03.38字符。encodeAsciiToGsm函数则用于处理整个字符串,并将结果输出。在main函数中,我们提供了一个示例ASCII消息,并调用encodeAsciiToGsm函数进行转换和输出。
为了将每个GSM 03.38字符转换为7-bit格式,并每8个字符压缩为7个字节,我们可以使用位操作来实现。下面是一个示例代码,展示了如何进行这种转换:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>// ASCII到GSM 03.38的映射表(仅示例,不完整)
unsigned char asciiToGsm[128] = {// ... 其他字符映射'A', 'B', 'C', // ASCII大写字母映射到GSM大写字母// ... 其他字符映射'a', 'b', 'c', // ASCII小写字母映射到GSM小写字母// ... 其他特殊字符和扩展字符映射
};// 将ASCII字符转换为GSM 03.38字符
unsigned char convertAsciiToGsm(unsigned char c) {if (c < 128 && asciiToGsm[c] != 0) {return asciiToGsm[c]; // 如果在映射表中,返回对应的GSM字符} else {return '?'; // 对于不在映射表中的字符,返回'?'作为替换字符}
}// 将GSM 03.38字符串转换为7-bit编码格式
void encodeGsm7Bit(const unsigned char* gsmStr, unsigned char* encodedData) {int length = strlen((const char*)gsmStr); // 获取字符串长度int septetsCount = (length * 7 + 7) / 8; // 计算需要的7-bit单元数量int byteIndex = 0; // 当前字节的索引unsigned char currentByte = 0; // 当前正在构建的字节int bitIndex = 0; // 当前字节中的位索引for (int i = 0; i < length; i++) {unsigned char gsmChar = gsmStr[i]; // 获取当前GSM字符for (int j = 0; j < 7; j++) {unsigned char bit = (gsmChar >> (6 - j)) & 0x01; // 获取当前字符的第j位currentByte |= bit << bitIndex; // 将位添加到当前字节中bitIndex++; // 增加位索引if (bitIndex == 7) { // 如果当前字节已满encodedData[byteIndex++] = currentByte; // 存储当前字节到编码数据中currentByte = 0; // 重置当前字节bitIndex = 0; // 重置位索引}}}if (bitIndex > 0) { // 处理剩余的位(如果有)encodedData[byteIndex++] = currentByte; // 存储剩余的字节到编码数据中}
}int main() {const char* asciiMessage = "Hello, World!"; // ASCII明文消息unsigned char* gsmStr = (unsigned char*)malloc(strlen(asciiMessage) + 1); // 为GSM字符串分配内存for (int i = 0; asciiMessage[i] != '\0'; i++) {gsmStr[i] = convertAsciiToGsm((unsigned char)asciiMessage[i]); // 转换每个字符}gsmStr[strlen(asciiMessage)] = '\0'; // 添加字符串结束符printf("GSM编码: %s\n", gsmStr); // 输出GSM编码的字符串int septetsCount = (strlen((const char*)gsmStr) * 7 + 7) / 8; // 计算需要的7-bit单元数量unsigned char* encodedData = (unsigned char*)malloc(septetsCount); // 为编码数据分配内存encodeGsm7Bit(gsmStr, encodedData); // 将GSM字符串转换为7-bit编码格式printf("7-bit编码: "); // 输出7-bit编码的数据for (int i = 0; i < septetsCount; i++) {printf("%02X ", encodedData[i]); // 以十六进制格式输出每个字节}printf("\n");free(gsmStr); // 释放内存free(encodedData); // 释放内存return 0;
}
在这个示例代码中,encodeGsm7Bit函数将GSM 03.38字符串转换为7-bit编码格式。它遍历每个GSM字符,并将其转换为7个位,然后将这些位添加到当前正在构建的字节中。当当前字节满时,将其存储到编码数据中,并重置当前字节和位索引。最后,处理剩余的位(如果有)并将其存储到编码数据中。在main函数中,我们首先将ASCII消息转换为GSM字符串,然后调用encodeGsm7Bit函数进行7-bit编码,并输出编码结果。
请注意,这个示例代码仅用于演示目的,实际的转换过程可能更加复杂,需要考虑更多的细节和异常情况。
相关文章:
使用C语言将ASCII明文编码为GSM短信体格式
一、背景介绍 GSM(Global System for Mobile Communications)是全球移动通信系统的简称,而GSM 03.38是GSM系统中用于短信编码的标准。GSM 03.38字符集采用7-bit编码,与ASCII的8-bit编码有所不同。为了将ASCII编码的文本转换为GSM…...
docker搭建mysql8.0.32,实现主从复制(一主两从)
安装docker的步骤、使用命令就不写了,本文章是基于会使用docker、linux基本命令的基础上来写的。 开始步骤: 1. 拉取 mysql 镜像 docker pull mysql:8.0.32 2. 启动容器并运行mysql a. 准备mysql的配置文件(该配置文件是:mysq…...
AOP springboot
1. 2. Around(“execution(* com.example.demo.controller..(…))”) 代表所有的类下面所有的方法任意参数 3....
Python Flask 基础入门第六课: Flask 全局变量 current_app, g 以及 session各自如何使用 有什么差异
全局变量 current_app, g 以及 session 全局变量差异汇总表current_app章节1 current_app - 当前应用实例current_app的基本概念current_app的作用current_app的使用 章节2:current_app的上下文什么是应用上下文?current_app与应用上下文的关系current_a…...
第33节: Vue3 方法与在线检测
UniApp 使用 Vue3 框架时,您可以使用方法和在线检测来处理应用程序中的逻辑和数据。下面是一个示例,演示了如何在 UniApp 中使用 Vue3 框架使用方法和在线检测: <template> <view> <button click"handleClick"&g…...
React学习计划-React16--React基础(二)组件与组件的3大核心属性state、props、ref和事件处理
1. 组件 函数式组件(适用于【简单组件】的定义) 示例: 执行了ReactDOM.render(<MyComponent/>, ...)之后执行了什么? React解析组件标签,找到了MyComponent组件发现组件是使用函数定义的,随后调用该…...
flink yarn-session 启动失败retrying connect to server 0.0.0.0/0.0.0.0:8032
原因分析,启动yarn-session.sh,会向resourcemanager的端口8032发起请求: 但是一直无法请求到8032端口,触发重试机制会不断尝试 备注:此问题出现时,我的环境ambari部署的HA 高可用hadoop,三个节点…...
.NET面试题(二)
1.c# 中new关键字的作用 实例化对象和调用构造函数:当使用 new 关键字创建一个类的实例时,它会为对象分配内存,并调用相应的构造函数来初始化该对象。 隐藏基类成员(方法、属性、事件等):当在派生类中…...
ffplay工具
在编译ffmpeg时,如果系统中包含了SDL库,则会默认编译生成ffplay工具,否则无法生成ffplay工具。 ffplay即可以作为播放器,也可以作为很多图像化音视频数据的分析工具,通过它可以看到视频图像的运动估计方向、音频数据的…...
第36节: Vue3 事件修饰符
在UniApp中使用Vue3框架时,你可以使用事件修饰符来更方便地处理用户交互事件。以下是一个示例,演示了如何在UniApp中使用Vue3框架使用事件修饰符: <template> <view> <button click.prevent"handleClick">Cli…...
如何在本地安装Flask并将其web界面发布到公网上远程访问协同开发
目录 前言 1. 安装部署Flask 2. 安装Cpolar内网穿透 3. 配置Flask的web界面公网访问地址 4. 公网远程访问Flask的web界面 前言 本篇文章讲解如何在本地安装Flask,以及如何将其web界面发布到公网上并进行远程访问。 Flask是目前十分流行的web框架,…...
八:爬虫-MySQL基础
一:MySQL数据库基础 1.MySQL数据库介绍 MySQL是一个[关系型数据库管理系统],由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Rela…...
Android定制ROM简介
Android定制ROM简介 这篇文章是为对自定义ROM、AOSP等词汇不太熟悉的技术爱好者和好奇的人写的。我希望通过向您介绍这个世界来开始博客写作。 在我们将注意力转向定制ROM之前,让我们先了解一些基础知识。 什么是操作系统? 维基百科对此的定义简洁而…...
百模大战中的AI行业:新趋势与未来发展
文章目录 每日一句正能量前言技术进步应用拓展行业变革人才竞争后记 每日一句正能量 人生最重要的价值是心灵的幸福,而不是任何身外之物。 前言 随着科技的迅猛发展,人工智能(AI)已经成为引领技术革命的重要驱动力之一。在当前的…...
VScode安装C/C++编译器步骤
一、安装C/C插件 二、安装 MinGW-w64 工具链 使用国内源 git clone https://gitee.com/cuihongxi/ubuntu2-mac.git 下载后进入到VScode文件夹下,点击msys2-x86_64-20231026.exe进行安装 完成后,确保选中“立即运行 MSYS2”框,然后选择“完…...
【Date对象】js中的日期类型Date对象的使用详情
😁 作者简介:一名大四的学生,致力学习前端开发技术 ⭐️个人主页:夜宵饽饽的主页 ❔ 系列专栏:JavaScript小贴士 👐学习格言:成功不是终点,失败也并非末日,最重要的是继续…...
【PyTorch】代码学习
文章目录 直接定义nn.Sequential(), 然后append(),最后直接net(),少写很多forward,适合直连式网络 直接定义nn.Sequential(), 然后append(),最后直接net(),少写很多forward,适合直连式网络 代码来源:https://github.com/zshhans/MSD-Mixer/b…...
ElasticSeach--springboot中使用
目录 一.引入依赖 二.配置链接信息 三.索引库测试 1.创建索引库 2.查询索引库 3.删除索引库 四.文档测试 1.添加文档 2.修改文档 3.删除文档 4.查询具体文档 5.批量添加文档 五.查询测试 1.查询所有 2.根据属性term匹配查询 3.分页查询 4.排序 5.过滤属性 6.boo…...
(1)(1.9) MSP (version 4.2)
文章目录 前言 1 协议概述 2 配置 3 参数说明 前言 ArduPilot 支持 MSP 协议,可通过任何串行端口进行遥测、OSD 和传感器。这样,ArduPilot 就能将遥测数据发送到 MSP 兼容设备(如大疆护目镜),用于屏幕显示&#x…...
mysql 表锁 行锁
目录 表锁(Table Lock) 行锁(Row Lock) 进一步通过举例解释 update操作走的是什么锁 表锁示例: 行锁示例: MySQL 中常见的锁类型包括: 表锁(Table Lock) 是针对整个…...
Python 爬虫进阶技巧:定时爬虫任务实现无人值守采集
前言 常规爬虫多依赖手动触发脚本运行,单次采集完成后需人工二次启动,无法满足日常周期性数据监控、行情抓取、资讯同步、业务台账定时归档等常态化采集需求。搭建可自主调度、自动启停、周期循环的定时爬虫任务,脱离人工干预实现无人值守全自动采集,是爬虫从临时脚本走向…...
构建具备上下文感知的智能对话机器人:从记忆管理到主动服务
1. 项目概述:一个能“悬浮”的智能对话机器人最近在GitHub上看到一个挺有意思的项目,叫goncharenko/hoverbot-chatbot。光看名字,hoverbot就挺抓人眼球的,直译过来是“悬浮机器人”,这不禁让人好奇,一个聊天…...
weave-compose实战:用Docker Compose语法轻松构建多主机容器集群
1. 项目概述与核心价值最近在折腾容器编排,特别是想找一个比Kubernetes更轻量、更贴近Docker原生体验的方案。在GitHub上闲逛时,发现了Adityaraj0421/weave-compose这个项目。乍一看名字,以为是Docker Compose的某个魔改版,但深入…...
TVA 与传统工业视觉:技术内核与应用分野(5)
重磅预告:本专栏将独家连载新书《AI视觉技术:从入门到进阶》精华内容。本书是《AI视觉技术:从进阶到专家》的权威前导篇,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“AI教…...
智能工厂能源监测管理平台解决方案
在某大型制造企业的生产园区,管理人员长期面临着一系列能源管理困境:由于厂区各个电表仍依赖人工抄录,数据滞后且易出错,导致管理层无法实时掌握每条生产线甚至每台关键设备的真实耗电情况;同时,由于电表分…...
README工匠技能:从自动化工具到工程化实践,打造项目黄金门面
1. 项目概述:一个为README注入灵魂的“工匠”技能 在开源社区和项目协作中,README文件就是项目的“门面”和“说明书”。一个优秀的README,能瞬间抓住潜在用户或贡献者的眼球,清晰地传达项目价值、快速引导上手,甚至能…...
电子束光刻掩模误差建模与校正技术解析
1. 电子束光刻中的掩模误差来源解析在半导体制造领域,电子束光刻技术因其高分辨率特性而被广泛应用于掩模制作。然而,这一工艺过程中产生的掩模误差会直接影响最终芯片的图形精度和良率。理解这些误差的物理成因是进行有效校正的前提。1.1 电子散射效应的…...
从德雷科风暴看关键通信网络备用电源失效与韧性加固策略
1. 从一场风暴看关键通信网络的脆弱性2012年6月底,一场被称为“德雷科”的强对流风暴席卷了美国中西部,其影响一直延伸到东海岸。这场风暴带来的不仅仅是狂风和暴雨,更是一次对现代基础设施,特别是关键通信网络的极端压力测试。风…...
半导体制造中的光学邻近校正(OPC)优化技术与实践
1. 光学邻近校正(OPC)在半导体制造中的关键作用在32nm以下节点的半导体制造中,光学邻近效应已成为制约光刻精度的首要瓶颈。当特征尺寸远小于曝光波长时(例如193nm光刻下的22nm节点),光线衍射会导致图案边缘…...
1.8.2 掌握Scala类与对象 - 单例对象与伴生对象
本次实战通过三个案例深入解析了 Scala 中 object 的核心机制,展示了其如何替代 Java 的 static 关键字。首先,通过 MathUtils 定义了存放常量与工具方法的独立单例对象;其次,利用 Person 类与其同名对象演示了“伴生对象”特性&a…...
