当前位置：首页 > news >正文

将独热码应用到神经网络中

news 2026/5/22 3:43:03

引言

接上回，本文继续说如何用TensorFlow将独热编码应用到一个简单的神经网络中，以实现从一段随机文本到另一段随机文本的转换。

步骤一：导入库

import tensorflow as tf
import numpy as np
import random
import string

步骤二：生成随机文本数据

用一个函数来生成随机文本数据。

def generate_random_text(length):letters = string.ascii_lowercase + ' 'return ''.join(random.choice(letters) for i in range(length))random_text = generate_random_text(100)
print("Random Text:", random_text)

步骤三：独热编码

接下来，我们将对生成的随机文本进行独热编码。为此，我们需要创建一个字符到整数的映射，并使用这个映射来构建独热编码。

注：上一张我们说的是几个分类（数字代表类别）转为独热码，那么如何将一串文本转为独热码呢？在这里我们的方法是将一串文本的每个字符都对应到一个数字（这个过程就我们叫做映射到数字，这个对应关系的表就成为词汇表），之后从数字生成独热码。把所有数字的独热码放一起，就是这段文本的独热码了。

chars = string.ascii_lowercase + ' '
char_to_int = {c: i for i, c in enumerate(chars)}
int_to_char = {i: c for c, i in char_to_int.items()}def one_hot_encode(text):encoded = [char_to_int[char] for char in text]return tf.one_hot(encoded, depth=len(chars))encoded_text = one_hot_encode(random_text)

步骤四：构建神经网络模型

现在，让我们定义一个简单的密集神经网络模型（后期讲），它将接受独热编码的文本并尝试预测下一个字符的独热编码。

model = tf.keras.Sequential([tf.keras.layers.Flatten(input_shape=(None, len(chars))),tf.keras.layers.Dense(128, activation='relu'),tf.keras.layers.Dense(len(chars), activation='softmax')
])

步骤五：训练模型

因为作者个人感觉用随机数据训练没什么意义，也拟合不出什么，所以省略了…

步骤六：模型预测与解码

我们直接用没训练过的模型来预测输入文本的输出，并将其从独热编码转换回字符。

def decode_one_hot(output):return ''.join(int_to_char[np.argmax(out)] for out in output)# 假设我们已经训练了模型
# predictions = model.predict(encoded_text)
# decoded_text = decode_one_hot(predictions)
# print("Decoded Text:", decoded_text)

一些话

虽然我们学了很多关于独热码的知识，但是…对于我们的语言模型没有什么卵用…我们用的是字符索引加嵌入层方法（后面细讲）而不是独热码，具体原因：

独热码（One-Hot Encoding）

优势:

简单直观：每个字符都由一个独立的二进制位表示，这使得编码非常明确和直接。
易于理解：模型的输入维度与词汇表大小直接相关，容易理解和解释。
无参数共享：每个字符的表示独立，不会受到其他字符的影响，这在某些情况下可能是有益的。

缺点:

维度灾难：如果词汇表很大，独热编码会导致极其高维的特征空间，这会增加计算复杂性和存储需求。
缺乏语义信息：独热编码不包含任何关于字符之间关系的语义信息，即字符之间的相似性或关联性完全被忽略。
不变性：对于字符的微小变化（如大小写、拼写错误等），独热编码无法提供鲁棒性。

字符索引 + 嵌入层（Character Index + Embedding Layer）

优势:

维度降低：通过使用较低维度的密集向量来表示字符，嵌入层可以有效减少模型的输入维度。
捕获语义信息：嵌入层可以学习字符之间的语义关系，使得相似的字符在嵌入空间中拥有相似的表示。
参数共享：嵌入层中的参数是在所有字符之间共享的，这可以减少模型的总参数数量，提高泛化能力。
鲁棒性：嵌入层可以对字符的小变化具有一定的鲁棒性，例如拼写错误或大小写变化。

缺点:

需要大量数据：为了有效地学习嵌入，通常需要大量的训练数据。
调参复杂：嵌入层的维度和其他超参数需要仔细调整，以找到最佳配置。
黑盒性质：嵌入层学到的表示可能不如独热编码那样直观易懂。

有问题可以私信，看到会回复。

将独热码应用到神经网络中

引言接上回，本文继续说如何用TensorFlow将独热编码应用到一个简单的神经网络中，以实现从一段随机文本到另一段随机文本的转换。步骤一：导入库 import tensorflow as tf import numpy as np import random import string步骤二&#xff1…...

编程日记 2024/7/17 5:26:39

在CSS中，使用Flexbox布局时，可以通过几个属性来控制容器内的项目之间的间距

display弹性布局，flex:1是占据剩下的空间关于displa:flex /* 水平和垂直居中，水平和垂直方向上的间距均匀分布 / .container { display: flex; justify-content: space-between; / 左右对齐 / align-items: center; / 上下间距 */ flex-direction: ro…...

编程日记 2024/7/17 5:25:36

关于HDFS 和HBase

Apache HBase 被设计为在 Hadoop 分布式文件系统 (HDFS) 上运行的一个特殊类型的数据库。大白话： 想象一下，你有一个巨大的图书馆，这个图书馆就像 HDFS，它的架子上堆满了各种各样的书籍，每本书都非常厚，而…...

编程日记 2024/7/17 5:23:33

【HarmonyOS】HarmonyOS NEXT学习日记：二、ArkTs语法

【HarmonyOS】HarmonyOS NEXT学习日记：二、ArkTs语法众所周知TS是JS的超集,而ArkTs则可以理解为是Ts的超集。他们的基础都基于JS，所以学习之前最好就JS基础。我的学习重点也是放在ArkTs和JS的不同点上。文章主要跟着官方文档学习，跳过了一…...

编程日记 2024/7/17 5:22:32

Web前端-Web开发CSS基础2-选择器

一. 基础 1. 选中所有的<p>标签； 2. 选中所有的<ol>标签； 3. 选中所有的<ul>标签； 4. 选中所有id为happy的标签； 5. 选中所有id为sad的标签； 6. 选中所有id为angry的标签； 7. 选中所有类…...

编程日记 2024/7/17 5:20:29

Mongodb数组字段索引之多键索引

学习mongodb，体会mongodb的每一个使用细节，欢迎阅读威赞的文章。这是威赞发布的第92篇mongodb技术文章，欢迎浏览本专栏威赞发布的其他文章。如果您认为我的文章对您有帮助或者解决您的问题，欢迎在文章下面点个赞，或者关…...

编程日记 2024/7/17 5:19:28

[Spring] Spring Web MVC案例实战

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏: 🧊 Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 🍕 Collection与…...

编程日记 2024/7/17 5:18:27

大模型“重构”教育：解构学习奥秘，推动教育普惠

大模型“重构”千行百业系列选题生成式人工智能的热潮，为AI领域的发展注入新的活力，而“赋能千行百业”已经成为人们普遍对于人工智能和大模型的全新理解。人工智能和大模型技术的迅猛发展正在以前所未有的速度深刻改变着各个行业。正如专家所预测&a…...

编程日记 2024/7/17 5:17:26

HCNA VRP基础

交换机可以隔离冲突域，路由器可以隔离广播域，这两种设备在企业网络中应用越来越广泛。随着越来越多的终端接入到网络中，网络设备的负担也越来越重，这时网络设备可以通过专有的VRP系统来提升运行效率。通过路由平台VRP是华为公司数…...

编程日记 2024/7/17 5:16:25

单片机外围设备-EEPROM

eeprom用iic通信。eeprom有几个特点需要关注： 1、可以单字节读写 2、eeprom按页划分存储，不同型号的eeprom的页大小不一致，往eeprom写数据时，如果写到了该页的末尾，会自动从该页的开头继续写，把之前的数据…...

编程日记 2024/7/17 5:13:22

YOLO--置信度（超详细解读）

YOLO（You Only Look Once）算法中的置信度（Confidence）是一个关键概念，用于评估模型对预测框内存在目标对象的信心程度以及预测框对目标对象位置的准确性。一、置信度的定义数值范围：置信度是一个介于0和…...

编程日记 2024/7/17 5:12:21

“解锁物流新纪元：深入探索‘沂路畅通‘分布式协作平台“

"解锁物流新纪元：深入探索沂路畅通分布式协作平台" 在21世纪的数字浪潮中，物流行业作为连接生产与消费的关键纽带，其重要性不言而喻。然而，随着市场规模的持续扩大和消费者需求的日益多样化，传统物流模式已…...

编程日记 2024/7/17 5:11:20

昇思25天学习打卡营第六天|应用实践/计算机视觉/Vision Transformer图像分类

心得运行模型似乎有点靠天意？每次跑模型之前先来个焚香沐浴？总之今天是机器视觉的最后一课了，尽管课程里强调模型跑得慢，可是我的这次运行，居然很快的就看到结果了。如果一直看我这个系列文章的小伙伴，…...

编程日记 2024/7/17 5:10:19

vxe-table合并行数据

场景： 混批名称相同合并混批名称，在混批名称相同条件下合并相同的混批类型；在混混批类型相同条件下合并相同的混批值；在混批值相同条件下合并相同的单位实现根据四个不同的key值，当四个key值对应相等时，合…...

编程日记 2024/7/17 5:08:17

LabVIEW异步和同步通信详细分析及比较

1. 基本原理异步通信： 原理：异步通信（Asynchronous Communication）是一种数据传输方式，其中数据发送和接收操作在独立的时间进行，不需要在特定时刻对齐。发送方在任何时刻可以发送数据，而接收…...

编程日记 2024/7/17 5:07:16

【多模态学习笔记二】MINIGPT-4论文阅读

MINIGPT-4:ENHANCING VISION-LANGUAGE UNDERSTANDING WITH ADVANCED LARGE LANGUAGE MODELS 提出的MiniGPT-4使用一个投影层，将冻结的视觉编码器与冻结的先进的LLM Vicuna对齐。我们的工作首次揭示，将视觉特征与先进的大型语言模型正确对齐可以具有GPT-4所展示的许多先进的多…...

编程日记 2024/7/17 5:06:16

Docker基本讲解及演示

Docker安装教程 Docker安装教程 1、Docker介绍 Docker是一个开源的应用容器引擎，允许开发者将应用程序及其依赖项打包成一个轻量级、可移植的容器，然后发布到任何支持 Docker 的环境中运行，无论是开发机、测试机还是生产环境。 Docker基于…...

编程日记 2024/7/17 5:05:15

各类专业技术的pdf电子书

从业多年，收集了海量的pdf电子书籍，感兴趣的私聊。...

编程日记 2024/7/17 5:04:13

【Linux】多线程_9

文章目录九、多线程10. 线程池未完待续九、多线程 10. 线程池这里我没实现一些懒汉单例模式的线程池，并且包含日志打印的线程池： Makefile： threadpool:Main.ccg -o $ $^ -stdc11 -lpthread .PHONY:clean clean:rm -f threadpoolT…...

编程日记 2024/7/17 5:02:12

LabVIEW设备检修信息管理系统

开发了基于LabVIEW设计平台开发的设备检修信息管理系统。该系统应用于各种设备的检修基地，通过与基地管理信息系统的连接和数据交换，实现了本地检修工位数据的远程自动化管理，提高了设备的检修效率和安全性。项目背景现代设备运维过程中信…...

编程日记 2024/7/17 5:01:11

Quark：极致微型Linux卡片电脑的硬件设计、系统开发与应用实战

1. 项目概述：当“小”成为核心竞争力在嵌入式开发和创客圈子里，我们总在寻找那个“刚刚好”的硬件平台。它要足够小巧，能塞进任何灵光一现的创意里；它要足够完整，能运行一个正经的操作系统来处理复杂逻辑；它…...

编程新知 2026/5/22 2:13:00

陆渔科技投入三千万学费：用AI擦去水产养殖不确定性，带来养殖确定性

创业故事：从偶然入局到屡败屡战陆渔科技深耕农业AI，两次失败、投入三千万学费，才拿到这张真实的“入场券”。鲁敏等四人原本与农业毫无关联，一次偶然饭局结识养鱼伙伴，了解到鲈鱼苗孵化项目。当时互联网、房地产市场饱…...

编程新知 2026/5/22 1:26:03

免费开源AMD Ryzen调试工具SMUDebugTool：释放处理器性能的终极指南

免费开源AMD Ryzen调试工具SMUDebugTool：释放处理器性能的终极指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…...

编程新知 2026/5/21 23:24:41