CSV文件中的中文乱码--UTF-8 with BOM
文章目录
- 1. 现象
- 2. 原因
- 3. BOM
- 3.1 什么是BOM?
- 3.2 BOM的作用
- 3.3 特殊性
- 4. 如何解决乱码?
- 4.1 手动设置格式
- 4.2 自动设置格式
- 4.2.1 Python如何设置:
- 4.2.2 java如何设置
1. 现象
在使用了UTF-8格式编码之后,CSV文件在Excel中打开还是乱码。
2. 原因
win系统在打开CSV文件时,会判断并选择CSV文件的编码格式。
win默认是需要使用带BOM的UTF-8编码,才能打开不乱码。读不到BOM的格式码,会认为是ANSI格式,进而造成csv中的中文乱码。
3. BOM
3.1 什么是BOM?
BOM(Byte Order Mark,字节顺序标记) 是位于文件开头的特殊标记,用于标识文本文件的编码方式和字节顺序(仅对多字节编码如UTF-16/UTF-32有意义)。
3.2 BOM的作用
- 标识编码格式:帮助程序快速识别文件是UTF-8、UTF-16还是UTF-32编码。
- 解决乱码问题:避免程序误判编码(如将UTF-8误认为ANSI/GBK)。
- 字节顺序标记:仅对UTF-16/UTF-32有效(大端序或小端序),UTF-8的字节顺序固定,无需标记顺序
3.3 特殊性
- 非必需但广泛兼容:
UTF-8本身不需要BOM(因字节顺序固定),但Windows系统(如记事本)依赖BOM识别UTF-8文件,无BOM可能被误判为ANSI。 - 现代趋势:
Web开发、代码文件(如JSON、Python)通常禁用BOM,因部分解析器会报错。
4. 如何解决乱码?
4.1 手动设置格式
win系统下将csv文件选择记事本打开,然后另存为,选择格式为“带BOM的UTF-8”,保存完再打开,中文就可以正常显示了。
4.2 自动设置格式
4.2.1 Python如何设置:
写文件
content = "你好"
with open("file.txt", "w", encoding="utf-8-sig") as f: # 'sig'表示BOMf.write(content)
读文件:
with open("file.txt", "r", encoding="utf-8-sig") as f: # 自动跳过BOMcontent = f.read()
4.2.2 java如何设置
import org.apache.commons.csv.CSVFormat;
import org.apache.commons.csv.CSVPrinter;
import java.io.*;public class CsvWithBomCommons {public static void main(String[] args) throws IOException {File file = new File("output_with_bom.csv");// 1. 创建文件输出流并写入BOMtry (OutputStream os = new FileOutputStream(file);OutputStreamWriter writer = new OutputStreamWriter(os, "UTF-8")) {// 2. 写入BOM头os.write(0xEF);os.write(0xBB);os.write(0xBF);// 3. 使用CSVPrinter写入数据 CSVPrinter printer = new CSVPrinter(writer, CSVFormat.DEFAULT);printer.printRecord("姓名", "年龄");printer.printRecord("张三", 25);printer.printRecord("李四", 30);}}
}
相关文章:
CSV文件中的中文乱码--UTF-8 with BOM
文章目录 1. 现象2. 原因3. BOM3.1 什么是BOM?3.2 BOM的作用3.3 特殊性 4. 如何解决乱码?4.1 手动设置格式4.2 自动设置格式4.2.1 Python如何设置:4.2.2 java如何设置 1. 现象 在使用了UTF-8格式编码之后,CSV文件在Excel中打开还…...
榕壹云酒水定制系统:基于THinKPHP+MySQL+UniApp打造数字化时代的个性化购酒新体验
数字化浪潮下的酒水定制新机遇 在消费升级与个性化需求崛起的背景下,传统酒水行业正面临数字化转型的迫切需求。为此,我们团队基于ThinkPHP+MySQL+UniApp技术栈,开发了一套榕壹云酒水定制系统,旨在通过数字化手段解决消费者个性化购酒痛点,为酒类品牌提供全链路数字化解决…...
Leetcode——137 260找出只出现一次的数
文章目录 找出只出现一次的数引入Leetcode 260Leetcode 137 找出只出现一次的数 对于数组中有一类题,即某些数据在数组中只出现一遍,需要我们找出,今天我们来看看这个类型的题。 引入 想必大家应该见过这么一道题: 现给定一个数…...
算法:定义一个数组的的陡峭值为:相邻两个元素之差的绝对值之和。
定义一个数组的的陡峭值为:相邻两个元素之差的绝对值之和。现在小红拿到了一个数组,她有多次询问,每次查询一段连续子数组的陡峭值。你能帮帮她吗? 连续子数组为从原数组中,连续的选择一段元素(可以全选、可以不选)得到的新数组。 输入描述 …...
uniapp自定义tabbar,根据角色动态显示不同tabbar,无闪动问题
🤵 作者:coderYYY 🧑 个人简介:前端程序媛,目前主攻web前端,后端辅助,其他技术知识也会偶尔分享🍀欢迎和我一起交流!🚀(评论和私信一般会回!!) 👉 个人专栏推荐:《前端项目教程以及代码》 ✨一、前言 这个需求在开发中还是很常见的,搜索了网络其他教程,…...
OpenTiny使用指南
最近项目里用到了一个新的组件库——OpenTiny,但是官方文档的使用指南的描述很复杂,花了一些时间尝试才正常使用。下面是一个使用步骤的描述,可放心食用: 一、安装 TinyVue 组件库同时支持 Vue 2.0 和 Vue 3.0 框架,…...
《一文讲透》第7期:KWDB 巧用标签与索引优化查询性能
引言 在工业物联网快速发展的今天,各类智能传感器设备已广泛应用于智能制造、能源电力、智慧城市等关键领域。这些设备以极高的采样频率持续产生监测数据,使得单条产线每秒产生数十万条传感器数据已成为行业常态,这对数据存储系统的写入吞吐…...
KingbaseES之KDts迁移SQLServer
项目适配迁移SQLServer至金仓,今天写写KDts-WEB版迁移工具迁移SQLServer至KingbaseES的步骤,以及迁移注意事项. SQLServer版本:SQLServer2012 KingbaseES版本:V009R004C011(SQLServer兼容版) --1.进入数据库客户端工具KDTS工具目录,启动KDts服务: [king…...
13-scala模式匹配
模式匹配是检查某个值(value)是否匹配某一个模式的机制,一个成功的匹配同时会将匹配值解构为其组成部分。它是Java中的switch语句的升级版,同样可以用于替代一系列的 if/else 语句。 语法 一个模式匹配语句包括一个待匹配的值&a…...
代码随想录动态规划part02
动态规划part02 62.不同路径 代码随想录 视频讲解:动态规划中如何初始化很重要!| LeetCode:62.不同路径_哔哩哔哩_bilibili 递归法 动态规划,当前状态是由上一个状态转化来的 这里初始化错误了,想法是对的右一和…...
数据结构-限定性线性表 - 栈与队列
栈和队列是数据结构中非常重要的两种限定性线性表,它们在实际应用中有着广泛的用途。这篇文章将深入讲解栈和队列的概念、抽象数据类型、实现方式、应用场景以及性能分析,并通过代码示例帮助大家更好地理解和实践。 一、栈的概念与抽象数据类型 1.1 栈…...
详解如何复现DeepSeek R1:从零开始利用Python构建
DeepSeek R1 的整个训练过程,说白了就是在其基础模型(也就是 deepseek V3)之上,用各种不同的强化学习方法来“雕琢”它。 咱们从一个小小的本地运行的基础模型开始,一边跟着 DeepSeek R1 技术报告 的步骤,…...
Java集合框架 源码分析 迭代器 并发修改异常底层原理
迭代器 Java中的Iterator(迭代器)是集合框架中用于遍历容器元素的统一接口,提供了一种标准化的元素访问方式,无需依赖具体集合类型的实现细节。以下是其核心要点: 一、核心方法与使用步骤 获取迭代器 通过集合的 it…...
CentOS7更换国内YUM源和Docker简单应用
配置国内阿里云镜像源 ## 更新镜像源 # 1.备份 cp /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak# 2.替换镜像源文件 curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo# 3.生成缓存 yum clean all yum m…...
Cannot find module ‘vue‘ or its corresponding type declarations
在使用vue3vite创建新的工程时,在新增.vue文件时会出现Cannot find module vue这个错误。 只需要我们在项目中的.d.ts文件中添加以下代码即可 declare module *.vue {import { defineComponent } from vue;const component: ReturnType<typeof defineComponent&…...
【Python爬虫】详细工作流程以及组成部分
目录 一、Python爬虫的详细工作流程 确定起始网页 发送 HTTP 请求 解析 HTML 处理数据 跟踪链接 递归抓取 存储数据 二、Python爬虫的组成部分 请求模块 解析模块 数据处理模块 存储模块 调度模块 反爬虫处理模块 一、Python爬虫的详细工作流程 在进行网络爬虫工…...
欧拉服务器操作系统部署deekseep(Ollama+DeekSeep+open WebUI)
一、解压并安装 Ollama # 1. 解压文件(默认会得到一个二进制文件) tar -xzvf ollama-linux-amd64.tgz# 2. 将二进制文件安装到系统路径 sudo mv ollama /usr/local/bin/ sudo chmod x /usr/local/bin/ollama# 3. 验证安装 ollama --version链接…...
报错:Nlopt
报错:Nlopt CMake Error at TGH-Planner/fast_planner/bspline_opt/CMakeLists.txt:20 (find_package):By not providing "FindNLopt.cmake" in CMAKE_MODULE_PATH this project hasasked CMake to find a package configuration file provided by "…...
#4 我们为什么使用物联网? 以及 物联网的整体结构
设备不物联是否可以? 答案 是可以的,从项目实战的角度,还是有很多包括分拣,控制,检测等应用是分立的,这个和成本,场景,客户接受度等因素有关。 局部看,一些系统的确很简…...
centOS 安装和配置docker
以下是在 CentOS 系统上安装和配置 Docker 的详细步骤: 一、安装 Docker 1. 卸载旧版本(如有) sudo yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate …...
3D版的VLA——从3D VLA、SpatialVLA到PointVLA(不动VLM,仅动作专家中加入3D数据)
前言 之前写这篇文章的时候,就想解读下3D VLA来着,但一直因为和团队并行开发具身项目,很多解读被各种延后 更是各种出差,比如从25年3月下旬至今,连续出差三轮,绕中国半圈,具身占八成 第一轮 …...
linux Shell编程之循环语句(三)
目录 一. for 循环语句 1. for语句的结构 2. for 语句应用示例 (1) 根据姓名列表批量添加用户 (2) 根据 IP 地址列表检查主机状态 二. 使用 while 循环语句 1. while 语句的结构 2. while 语句应用示例 (1) 批量添加规律编号的用户 (2) 猜价格游戏 三. until 循环语…...
C#容器源码分析 --- Queue<T>
Queue<T> 是 System.Collections.Generic 命名空间下的先进先出(FIFO)动态集合,其核心实现基于循环数组,通过维护头尾指针实现高效入队和出队操作。 .Net4.8 Queue<T>源码地址:queue.cs (microso…...
ViT 模型讲解
文章目录 一、模型的诞生背景1.1 背景1.2 ViT 的提出(2020年) 二、模型架构2.1 patch2.2 模型结构2.2.1 数据 shape 变化2.2.2 代码示例2.2.3 模型结构图 2.3 关于空间信息 三、实验3.1 主要实验3.2 消融实验 四、先验问题4.1 归纳偏置4.2 先验or大数据&…...
IntelliJ IDEA 中安装和使用通义灵码 AI 编程助手教程
随着人工智能技术的发展,AI 编程助手逐渐成为提升开发效率的强大工具。通义灵码是阿里云推出的一款 AI 编程助手,它能够帮助开发者实现智能代码补全、代码解释、生成单元测试等功能,极大地提升了编程效率和代码质量。 IntelliJ IDEA 是一款广…...
面向HPC平台应用的HBM电源完整性/信号完整性分析与设计方法
近年来,人工智能技术的爆发式增长推动大数据处理领域发生根本性变革,促使工业界转向基于大数据的工作模型。为应对海量数据处理的复杂问题,基于多边交互服务的数据中心不断涌现。此类应用被称为高性能计算(HPC)&#x…...
FreeRTOS入门与工程实践-基于STM32F103(一)(单片机程序设计模式,FreeRTOS源码概述,内存管理,任务管理,同步互斥与通信,队列,信号量)
裸机程序设计模式 裸机程序的设计模式可以分为:轮询、前后台、定时器驱动、基于状态机。前面三种方法都无法解决一个问题:假设有A、B两个都很耗时的函数,无法降低它们相互之间的影响。第4种方法可以解决这个问题,但是实践起来有难…...
can‘t set boot order in virtualbox
Boot order setting is ignored if UEFI is enabled https://forums.virtualbox.org/viewtopic.php?t99121 如果勾选EFI boot order就是灰色的 传统BIOS就是可选的 然后选中任意介质,通过右边的上下箭头调节顺序,最上面的应该是优先级最高的 然后就…...
2025年第十六届蓝桥杯省赛C++ A组真题
2025年第十六届蓝桥杯省赛C A组真题 1.说明2.题目A:寻找质数(5分)3.题目B:黑白棋(5分)4. 题目C:抽奖(10分)5. 题目D:红黑树(10分)6. 题…...
asp.net Kestrel 和iis区别
Kestrel 和 IIS 都是用于托管 Web 应用程序的服务器,不过它们在多个方面存在显著差异,下面为你详细分析: 1. 所属平台与跨平台能力 Kestrel:是.NET Core 及后续版本的一部分,具备跨平台特性,可在 Windows…...
