当前位置: 首页 > article >正文

C# System.Text.Encoding 使用详解

总目录


前言

在C#编程中,处理字符串和字节数组之间的转换是一个常见的任务。System.Text.Encoding类及其派生类提供了丰富的功能,帮助开发者实现不同字符编码之间的转换。本文将详细讲解System.Text.Encoding类的使用方法,包括常用编码的介绍、编码和解码的基本操作、以及一些高级用法。


一、基础概念

1. 什么是字符编码?

字符编码是将字符(如字母、数字、符号等)转换为字节序列的规则。不同的字符编码标准(如ASCII、UTF-8、UTF-16等)定义了不同的映射规则。在计算机中,字符编码用于存储、传输和显示文本数据。

2. 常见的字符编码

常见的字符编码包括:

  • ASCII:美国信息交换标准代码,使用 7 位二进制数表示 128 个字符。
    • 特点:固定 1 字节,仅支持 0x00-0x7F(英文字符)。
    • 适用场景:纯英文文本。
    • 注意:若包含非 ASCII 字符(如中文),会替换为 ? 或抛出异常
  • UTF-8:一种变长的字符编码,可以表示 Unicode 中的所有字符,兼容 ASCII。
    • 特点:可变长度编码,1-4 字节表示一个字符,兼容 ASCII。
    • 适用场景:国际化文本、网页、网络传输(HTTP/JSON)。
  • Unicode:一种定长的字符编码,使用 2 个字节表示一个字符。
    • 特点:固定 2 字节(小端序或大端序),支持基本 Unicode 字符。
    • 适用场景:内存中存储(如 .NET 的 string 类型)。
  • GB2312/GBK/GB18030:中文编码(需通过 Encoding.GetEncoding 获取)。

3. 编码与解码

  • 编码(Encoding):将 Unicode 字符转换为字节序列的过程。
  • 解码(Decoding):将字节序列转换回 Unicode 字符的过程。
  • 由于计算机只认识0或1的二进制数据,而这些数据让人类阅读很有难度的。此时人 和 计算机沟通就需要一个翻译。
  • 可以 将ASCII UTF-8等编码规则 视作 一本人类 与 计算机 之间 沟通的翻译字典,Encoding类充当 翻译 的角色。
    • 编码:就是将 人类的语言 通过翻译字典 翻译成计算机能看懂的指令
    • 解码:就是将计算机的信息 通过翻译字典 翻译成人类可以看懂的语言

4. System.Text.Encoding 类概述

System.Text.Encoding类是.NET框架中用于处理字符编码的基类(核心类)。它提供了将字符串转换为字节数组(编码)和将字节数组转换为字符串(解码)的方法。Encoding类本身是抽象的,不能直接实例化,但提供了多个派生类,每个派生类对应一种特定的字符编码。

5. Encoding 类核心功能

  • 支持多种编码格式(如 UTF-8、ASCII、Unicode 等)。
  • 实现字符串与字节数组的双向转换。
  • 兼容跨平台和多语言场景。

3. 常用方法与属性

1)核心方法

方法名作用
GetBytes(string)将字符串转换为字节数组(编码过程)。
GetString(byte[])将字节数组转换为字符串(解码过程)。
Convert(Encoding, Encoding, byte[])将字节数组从一种编码转换为另一种编码
(如 UTF-8 转 UTF-16)。

2)静态属性

属性名对应编码类型及代码页适用场景
Encoding.ASCIIASCII 编码(代码页 20127)仅支持英文字符(0x00-0x7F)。
Encoding.UTF8UTF-8 编码(代码页 65001)国际化文本(支持所有 Unicode 字符)。
Encoding.UnicodeUTF-16 小端序(代码页 1200)内部存储(如 .NET 的 char 类型)。
Encoding.UTF32UTF-32 小端序(代码页 12000)高精度编码(占用更多内存)。
Encoding.Default当前系统默认 ANSI 编码(如 GBK、CP1252)兼容性场景(可能因系统而异)。

3)常用字符编码类

以下是一些常用的字符编码类及其对应的编码标准:

字符编码类对应的编码标准
ASCIIEncoding对应ASCII编码,支持7位字符。
UTF7Encoding对应UTF-7编码,一种基于7位的Unicode编码。
UTF8Encoding对应UTF-8编码,广泛用于互联网的多字节Unicode编码。
UnicodeEncoding对应UTF-16编码,使用两个字节表示大多数字符。
ASCIIEncoding对应ASCII编码,支持7位字符。

二、使用

1. 获取编码实例

using System.Text;// 获取 UTF-8 编码实例
Encoding utf8Encoding = Encoding.UTF8;// 获取 ASCII 编码实例
Encoding asciiEncoding = Encoding.ASCII;// 获取 Unicode 编码实例
Encoding unicodeEncoding = Encoding.Unicode;// 通过GetEncoding 获取 GB2312 编码实例
Encoding gb2312 = Encoding.GetEncoding("GB2312");// 获取 GBK 编码(代码页 936)
Encoding gbk = Encoding.GetEncoding(936);// 列出所有支持的编码
foreach (EncodingInfo ei in Encoding.GetEncodings())
{Console.WriteLine($"名称: {ei.Name}, 描述: {ei.DisplayName}");
}

2. 获取编码信息

static void Main(string[] args)
{// 获取 UTF-8 编码实例Encoding utf8Encoding = Encoding.UTF8;          Console.WriteLine(utf8Encoding.HeaderName);     //输出:utf-8Console.WriteLine(utf8Encoding.EncodingName);   //输出:Unicode (UTF-8)Console.WriteLine(utf8Encoding.BodyName);       //输出:utf-8Console.WriteLine(utf8Encoding.WebName);        //输出:utf-8// 获取编码的代码页标识符Console.WriteLine(utf8Encoding.CodePage);       //输出:65001
}

3. 编码和解码操作

注意:若使用 Encoding.Default(系统默认编码,如中文环境下的 GB2312),可能导致跨平台乱码,推荐显式指定编码。

1)编码:将字符串转换为字节数组

internal class Program
{static void Main(string[] args){string text = "Hello, World!";// 使用UTF-8编码byte[] utf8Bytes = Encoding.UTF8.GetBytes(text);// 使用UTF-16编码byte[] utf16Bytes = Encoding.Unicode.GetBytes(text);// 使用ASCII编码byte[] asciiBytes = Encoding.ASCII.GetBytes(text);Console.WriteLine("UTF-8 Encoded Bytes: " + BitConverter.ToString(utf8Bytes));Console.WriteLine("UTF-16 Encoded Bytes: " + BitConverter.ToString(utf16Bytes));Console.WriteLine("ASCII Encoded Bytes: " + BitConverter.ToString(asciiBytes));}
}

输出:

UTF-8 Encoded Bytes: 48-65-6C-6C-6F-2C-20-57-6F-72-6C-64-21
UTF-16 Encoded Bytes: 48-00-65-00-6C-00-6C-00-6F-00-2C-00-20-00-57-00-6F-00-72-00-6C-00-64-00-21-00
ASCII Encoded Bytes: 48-65-6C-6C-6F-2C-20-57-6F-72-6C-64-21

2)解码:将字节数组转换为字符串

// 使用 UTF-8 解码
string decodedTextUTF8 = utf8Encoding.GetString(utf8Bytes);	//输出:Hello, World!// 使用 ASCII 解码
string decodedTextASCII = asciiEncoding.GetString(asciiBytes);//输出:Hello, World!// 使用 Unicode 解码
string decodedTextUnicode = unicodeEncoding.GetString(unicodeBytes);//输出:Hello, World!

4. 编码转换操作

有时候,我们需要将一个编码的字节数组转换为另一个编码的字节数组。这可以通过Encoding.Convert(源编码,目标编码,源字节数组)方法实现:

using System;
using System.Text;
class Program
{static void Main(){string originalText = "Hello, World!";// 将字符串编码为UTF-8Encoding utf8 = Encoding.UTF8;byte[] utf8Bytes = utf8.GetBytes(originalText);Encoding utf16 = Encoding.Unicode;// 将UTF-8编码的字节数组转换为UTF-16byte[] utf16Bytes = Encoding.Convert(utf8, utf16, utf8Bytes);// 解码UTF-16字节数组string convertedText = utf16.GetString(utf16Bytes);Console.WriteLine("Converted Text: " + convertedText);}
}

8. 实际应用示例

1)示例1:编码和解码

以下是一个完整的示例,展示如何在 C# 中使用 System.Text.Encoding 类进行文本编码和解码操作。

using System;
using System.Text;namespace EncodingExample
{class Program{static void Main(string[] args){string text = "Hello, World! 你好,世界!";// 获取不同的编码实例Encoding utf8Encoding = Encoding.UTF8;Encoding asciiEncoding = Encoding.ASCII;Encoding unicodeEncoding = Encoding.Unicode;// 将字符串编码为字节数组byte[] utf8Bytes = utf8Encoding.GetBytes(text);byte[] asciiBytes = asciiEncoding.GetBytes(text);byte[] unicodeBytes = unicodeEncoding.GetBytes(text);// 输出字节数组Console.WriteLine("UTF-8 编码字节数组:");foreach (byte b in utf8Bytes){Console.Write(b + " ");}Console.WriteLine();Console.WriteLine("ASCII 编码字节数组:");foreach (byte b in asciiBytes){Console.Write(b + " ");}Console.WriteLine();Console.WriteLine("Unicode 编码字节数组:");foreach (byte b in unicodeBytes){Console.Write(b + " ");}Console.WriteLine();// 将字节数组解码为字符串string decodedTextUTF8 = utf8Encoding.GetString(utf8Bytes);string decodedTextASCII = asciiEncoding.GetString(asciiBytes);string decodedTextUnicode = unicodeEncoding.GetString(unicodeBytes);// 输出解码后的字符串Console.WriteLine("UTF-8 解码字符串: " + decodedTextUTF8);Console.WriteLine("ASCII 解码字符串: " + decodedTextASCII);Console.WriteLine("Unicode 解码字符串: " + decodedTextUnicode);}}
}

2)示例2:编码转换

using System;
using System.Text;public class EncodingDemo 
{public static void Main() {// 示例:UTF-8 转 GBKstring text = "编码转换测试";Encoding utf8 = Encoding.UTF8;Encoding gbk = Encoding.GetEncoding("GBK");byte[] utfBytes = utf8.GetBytes(text);byte[] gbkBytes = Encoding.Convert(utf8, gbk, utfBytes);string decodedText = gbk.GetString(gbkBytes);Console.WriteLine($"解码结果:{decodedText}");}
}

三、高级用法

1. 实现自定义编码

虽然.NET提供了多种内置编码,但有时我们可能需要自定义编码。这可以通过继承Encoding类并重写其方法来实现。

2. 文件编码处理

读取文件时自动检测编码(需结合 BOM 判断):

public static Encoding DetectFileEncoding(string path) 
{byte[] bom = new byte[4];using (var file = new FileStream(path, FileMode.Open)) {file.Read(bom, 0, 4);}if (bom[0] == 0xEF && bom[1] == 0xBB && bom[2] == 0xBF) return Encoding.UTF8;if (bom[0] == 0xFF && bom[1] == 0xFE) return Encoding.Unicode;return Encoding.Default; // 无 BOM 时回退到默认编码
}

3. 网络通信编码

发送数据前统一编码格式(推荐 UTF-8):

// 发送端
string message = "传输数据";
byte[] buffer = Encoding.UTF8.GetBytes(message);
socket.Send(buffer);// 接收端
byte[] buffer = new byte[1024];
int bytesRead = socket.Receive(buffer);
string received = Encoding.UTF8.GetString(buffer, 0, bytesRead);

四、注意事项

1. 编码选择

在实际应用中,应根据具体需求选择合适的编码方式。例如,处理中文文本时,UTF-8 是一个不错的选择。

2. 编码兼容性

读写文本时使用相同的编码(如 UTF-8)。

在进行编码和解码操作时,必须确保使用相同的编码方式,否则可能会导致数据丢失或乱码。

internal class Program
{static void Main(string[] args){string text = "Hello, 张三! ";// 使用UTF-8编码byte[] utf8Bytes = Encoding.UTF8.GetBytes(text);// 但是使用 ASCII 解码,会导致乱码string decodedTextUTF8 = Encoding.ASCII.GetString(utf8Bytes);Console.WriteLine($"{decodedTextUTF8}");    //输出:Hello, ??????!}
}

3. 性能考虑

不同的编码方式在性能上可能会有所不同,应根据实际情况进行优化。

4. 跨平台开发

  • Encoding.Default 依赖系统区域设置(如 Windows 中的 GBK 或 CP1252),可能导致跨平台问题。避免使用 Encoding.Default,推荐统一使用 UTF-8 (国际化、兼容性最佳)。
  • 在 Linux/macOS 中,路径分隔符和编码默认值可能与 Windows 不同。

5. 处理旧系统的代码页编码

  • 使用 CodePagesEncodingProvider(需引用 System.Text.Encoding.CodePages 包):
    EncodingProvider provider = CodePagesEncodingProvider.Instance;
    Encoding.RegisterProvider(provider);
    Encoding gbk = Encoding.GetEncoding("GBK"); // 现在可访问 GBK
    

结语

回到目录页:C#/.NET 知识汇总、C# 上位机知识汇总
希望以上内容可以帮助到大家,如文中有不对之处,还请批评指正。


参考资料:

  • 微软官方文档:Encoding 类

相关文章:

C# System.Text.Encoding 使用详解

总目录 前言 在C#编程中,处理字符串和字节数组之间的转换是一个常见的任务。System.Text.Encoding类及其派生类提供了丰富的功能,帮助开发者实现不同字符编码之间的转换。本文将详细讲解System.Text.Encoding类的使用方法,包括常用编码的介绍…...

力扣刷题-热题100题-第23题(c++、python)

206. 反转链表 - 力扣(LeetCode)https://leetcode.cn/problems/reverse-linked-list/solutions/551596/fan-zhuan-lian-biao-by-leetcode-solution-d1k2/?envTypestudy-plan-v2&envIdtop-100-liked 常规法 记录前一个指针,当前指针&am…...

机器学习-基于KNN算法手动实现kd树

目录 一、概括 二、KD树的构建流程 1.循环选轴 2.选择分裂点 三、kd树的查询 1.输入我们要搜索的点 2.递归向下遍历: 3.记录最近点 4.回溯父节点: 四、KD树的优化与变种: 五、KD树代码: 上一章我们将了机器学习-手搓KN…...

Unity Shader 的编程流程和结构

Unity Shader 的编程流程和结构 Unity Shader 的编程主要由以下三个核心部分组成:Properties(属性)、SubShader(子着色器) 和 Fallback(回退)。下面是它们的具体作用和结构: 1. Pr…...

vue3 项目的最新eslint9 + prettier 配置

注意:eslint目前升级到9版本了 在 ESLint v9 中,配置文件已经从 .eslintrc 迁移到了 eslint.config.js 配置的方式和之前的方式不太一样了!!!! 详见自己的语雀文档:5、新版eslint9prettier 配…...

SAP GUI Script for C# SAP脚本开发快速指南与默认主题问题

SAP GUI Script for C# 快速指南 SAP 脚本的快速使用与设置. 解决使用SAP脚本执行后,默认打开的SAP是经典主题的问题 1. 解决默认主题问题 如果您使用的是SAP GUI 740,并遇到无法打开对话框的问题,请先将主题设置为经典主题(Classic Theme…...

JAVA泛型的作用

‌1. 类型安全(Type Safety)‌ 在泛型出现之前,集合类(如 ArrayList、HashMap)只能存储 Object 类型元素,导致以下问题: ‌问题‌:从集合中取出元素时,需手动强制类型转…...

Git Flow 分支管理策略

优势 清晰的分支结构:每个分支都有明确的用途,便于团队协作。 稳定的 master 分支:生产环境代码始终稳定。 灵活的发布管理:通过发布分支和热修复分支,可以灵活管理版本发布和紧急修复。 主要分支 master 分支 代表…...

FFmpeg + ‌Qt‌ 简单视频播放器代码

一个基于 ‌FFmpeg 4.x‌ 和 ‌Qt‌ 的简单视频播放器代码示例,实现视频解码和渲染到 Qt 窗口的功能。 1)ffmpeg库界面,视频解码支持软解和硬解方式。 2)QImage/QPixmap显示视频图片。 ‌1. Qt 项目配置(.pro 文件&…...

Unity跨平台构建快速回顾

知识点来源:人间自有韬哥在,豆包 目录 一、发布应用程序1. 修改发布必备设置1.1 打开设置面板1.2 修改公司名、游戏项目名、版本号和默认图标1.3 修改 Package Name 和 Minimum API Level 2. 发布应用程序2.1 配置 Build Settings2.2 选择发布选项2.3 构…...

【嵌入式学习2】内存管理

## C语言编译过程 预处理:宏定义展开、头文件展开、条件编译,这里并不会检查语法,将#include #define这些头文件内容插入到源码中 gcc -E main.c -o main.i 编译:检查语法,将预处理后文件编译生成汇编文件&#xff…...

密码学(Public-Key Cryptography and Discrete Logarithms)

Public-Key Cryptography and Discrete Logarithms Discrete Logarithm 核心概念:离散对数是密码学中一个重要的数学问题,特别是在有限域和循环群中。它基于指数运算在某些群中是单向函数这一特性。也就是说,给定一个群 G G G和一个生成元 …...

TDengine又新增一可视化工具 Perspective

概述 Perspective 是一款开源且强大的数据可视化库,由 Prospective.co 开发,运用 WebAssembly 和 Web Workers 技术,在 Web 应用中实现交互式实时数据分析,能在浏览器端提供高性能可视化能力。借助它,开发者可构建实时…...

【Linux文件IO】Linux中标准IO的API的描述和基本用法

Linux中标准IO的API的描述和基本用法 一、标准IO相关API1、文件的打开和关闭示例代码: 2、文件的读写示例代码:用标准IO(fread、fwrite)实现文件拷贝(任何文件均可拷贝) 3、文件偏移设置示例代码: 4、fgets fputs fget…...

深度学习篇---PaddleDetectionPaddleOCR

文章目录 前言1.代码2.代码介绍2.1 **导入模块**2.2 **配置区域**2.3 ExpressInfoProcessor类2.4 **主程序**: 3.使用说明3.1环境准备3.2模型准备3.3数据库初始化3.4串口配置3.5信息提取优化3.6注意事项 前言 本文简单介绍了PaddleDetection和PaddleOCR相结合的示例…...

Ant Design Vue Select 选择器 全选 功能

Vue.js的组件库Ant Design Vue Select 选择器没有全选功能&#xff0c;如下图所示&#xff1a; 在项目中&#xff0c;我们自己实现了全选和清空功能&#xff0c;如下所示&#xff1a; 代码如下所示&#xff1a; <!--* 参数配置 - 风力发电 - 曲线图 * 猴王软件学院 - 大强 …...

系统与网络安全------网络应用基础(1)

资料整理于网络资料、书本资料、AI&#xff0c;仅供个人学习参考。 TCP/IP协议及配置 概述 TCP/IP协议族 计算机之间进行通信时必须共同遵循的一种通信规定 最广泛使用的通信协议的集合 包括大量Internet应用中的标准协议 支持跨网络架构、跨操作系统平台的数据通信 主机…...

ZIP_STORED和ZIP_LZMA没有compresslevel参数!

在使用py的zipfile库进行压缩的时候&#xff0c;有这么一个函数&#xff1a; def write(self, filename, arcnameNone,compress_typeNone, compresslevelNone): 一般我们在压缩文件进去的时候都是用这个函数的&#xff1b; 对于compresslevel这个函数&#xff0c;它是用来指…...

坦克大战(c++)

今天我给大家分享一个c游戏。 废话不多说&#xff0c;作品展示&#xff1a; #include <stdio.h> #include <windows.h> #include <time.h> //里规格&#xff1a;长39*278 &#xff08;真坐标&#xff09;(假坐标宽为39) 高39 //外规格&#xff1a;长…...

论文阅读:2023 EMNLP SeqXGPT: Sentence-level AI-generated text detection

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 SeqXGPT: Sentence-level AI-generated text detection https://aclanthology.org/2023.emnlp-main.73/ https://github.com/Jihuai-wpy/SeqXGPT https://www.doubao.com/chat/21003…...

JDK 24 发布,新特性解读!

一、版本演进与技术格局新动向 北京时间3月20日&#xff0c;Oracle正式发布Java SE 24。作为继Java 21之后的第三个非LTS版本&#xff0c;其技术革新力度远超预期——共集成24项JEP提案&#xff0c;相当于Java 22&#xff08;12项&#xff09;与Java 23&#xff08;12项&#…...

k8s中service概述(二)NodePort

NodePort 是 Kubernetes 中一种用于对外暴露服务的 Service 类型。它通过在集群的每个节点上开放一个静态端口&#xff08;NodePort&#xff09;&#xff0c;使得外部用户可以通过节点的 IP 地址和该端口访问集群内部的服务。以下是关于 NodePort Service 的详细说明&#xff1…...

Oracle归档配置及检查

配置归档位置到 USE_DB_RECOVERY_FILE_DEST&#xff0c;并设置存储大小 startup mount; !mkdir /db/archivelog ALTER SYSTEM SET db_recovery_file_dest_size100G SCOPEBOTH; ALTER SYSTEM SET db_recovery_file_dest/db/archivelog SCOPEBOTH; ALTER SYSTEM SET log_archive…...

计算机二级:函数基础题

函数基础题 第一题 rinput("请输入半径&#xff1a;") c3.1415926*r*2 print("{:.0f}".format(c))输出&#xff1a; Type Error第二题 a7 b2 print(a%2)输出 1第三题 ab4 def my_ab(ab,xy):abpow(ab,xy)print(ab,end"\n") my_ab(ab,2)prin…...

Python爬虫-爬取AliExpress商品搜索词排名数据

前言 本文是该专栏的第49篇,后面会持续分享python爬虫干货知识,记得关注。 本文,笔者以AliExpress平台为例。基于Python爬虫,通过某个指定的“搜索关键词”,批量获取该“搜索关键词”的商品排名数据。 具体实现思路和详细逻辑,笔者将在正文结合完整代码进行详细介绍。废…...

AI 时代,我们需要什么样的数据库?

AI 时代&#xff0c;我们需要什么样的数据库&#xff1f; 人工智能正在悄然改变软件开发的方式。过去一年间&#xff0c;诸如 GitHub Spark、Replit 和 Bolt 等新兴 AI 工具层出不穷&#xff0c;能够快速生成简单的前端应用&#xff0c;甚至无需传统意义上的后端服务就能部署上…...

刷机维修进阶教程-----adb禁用错了系统app导致无法开机 如何保数据无损恢复机型

在刷机维修过程中 。我们会遇到一些由于客户使用adb指令来禁用手机app而导致手机无法开机进入系统的故障机型。通常此类问题机型有好几种解决方法。但如果客户需要保数据来恢复机型。其实操作也是很简单的.还有类似误删除应用导致不开机等等如何保数据。 通过博文了解💝💝�…...

Vue3 实战:基于 mxGraph 与 WebSocket 的动态流程图构建

本文将详细介绍如何在 Vue3 项目中集成 mxGraph 可视化库&#xff0c;并通过 WebSocket 实现画布元素的实时更新。适合有 Vue 基础的前端开发者学习参考。 一、技术栈准备 Vue3&#xff1a;采用 Composition API 开发mxGraph&#xff1a;JavaScript 流程图库&#xff08;版本 …...

Ubuntu AX200 iwlwifi-cc-46.3cfab8da.0.tgz无法下载的解决办法

文章目录 前言一、检查网卡是否被识别二、确认内核模块是否可用1.AX200 wifi 要求内核5.12.检查 iwlwifi.ko 是否存在&#xff1a;3.如果未找到&#xff0c;可能是内核模块未正确生成。尝试安装 linux-modules-extra&#xff1a;4.再次检查 iwlwifi.ko 是否存在&#xff1a;5.确…...

蓝桥杯,利用 Vue.js 构建简易任务管理器

在日常开发中&#xff0c;我们经常需要处理各种任务和计划。一个简单且高效的任务管理器可以帮助我们更好地组织和安排时间。今天&#xff0c;我将向大家展示如何使用 Vue.js 构建一个简易的任务管理器。这个项目不仅能够帮助我们更好地理解 Vue.js 的基本语法和功能&#xff0…...