当前位置：首页 > news >正文

RNN：文本生成

news 2026/2/9 13:27:15

文章目录

- 一、完整代码
- 二、过程实现
- - 2.1 导包
  - 2.2 数据准备
  - 2.3 字符分词
  - 2.4 构建数据集
  - 2.5 定义模型
  - 2.6 模型训练
  - 2.7 模型推理
- 三、整体总结

采用RNN和unicode分词进行文本生成

一、完整代码

这里我们使用tensorflow实现，代码如下：

# 完整代码在这里
import tensorflow as tf
import keras_nlp
import numpy as nptokenizer = keras_nlp.tokenizers.UnicodeCodepointTokenizer(vocabulary_size=400)# tokens - ids
ids = tokenizer(['Why are you so funny?', 'how can i get you'])# ids - tokens
tokenizer.detokenize(ids)def split_input_target(sequence):input_text = sequence[:-1]target_text = sequence[1:]return input_text, target_text# 准备数据
text = open('./shakespeare.txt', 'rb').read().decode(encoding='utf-8')
dataset = tf.data.Dataset.from_tensor_slices(tokenizer(text))
dataset = dataset.batch(64, drop_remainder=True)
dataset = dataset.map(split_input_target).batch(64)input, ouput = dataset.take(1).get_single_element()# 定义模型d_model = 512
rnn_units = 1025class CustomModel(tf.keras.Model):def __init__(self, vocabulary_size, d_model, rnn_units):super().__init__(self)self.embedding = tf.keras.layers.Embedding(vocabulary_size, d_model)self.gru = tf.keras.layers.GRU(rnn_units, return_sequences=True, return_state=True)self.dense = tf.keras.layers.Dense(vocabulary_size, activation='softmax')def call(self, inputs, states=None, return_state=False, training=False):x = inputsx = self.embedding(x)if states is None:states = self.gru.get_initial_state(x)x, states = self.gru(x, initial_state=states, training=training)x = self.dense(x, training=training)if return_state:return x, stateselse:return xmodel = CustomModel(tokenizer.vocabulary_size(), d_model, rnn_units)# 查看模型结构
model(input)
model.summary()# 模型配置
model.compile(loss = tf.losses.SparseCategoricalCrossentropy(),optimizer='adam',metrics=['accuracy']
)# 模型训练
model.fit(dataset, epochs=3)# 模型推理
class InferenceModel(tf.keras.Model):def __init__(self, model, tokenizer):super().__init__(self)self.model = modelself.tokenizer = tokenizerdef generate(self, inputs, length, return_states=False):inputs = inputs = tf.constant(inputs)[tf.newaxis]states = Noneinput_ids = self.tokenizer(inputs).to_tensor()outputs = []for i in range(length):predicted_logits, states = model(inputs=input_ids, states=states, return_state=True)input_ids = tf.argmax(predicted_logits, axis=-1)outputs.append(input_ids[0][-1].numpy())outputs = self.tokenizer.detokenize(lst).numpy().decode('utf-8')if return_states:return outputs, stateselse:return outputsinfere = InferenceModel(model, tokenizer)# 开始推理
start_chars = 'hello'
outputs = infere.generate(start_chars, 1000)
print(start_chars + outputs)

二、过程实现

2.1 导包

先导包tensorflow, keras_nlp, numpy

import tensorflow as tf
import keras_nlp
import numpy as np

2.2 数据准备

数据来自莎士比亚的作品 storage.googleapis.com/download.tensorflow.org/data/shakespeare.txt；我们将其下载下来存储为shakespeare.txt

2.3 字符分词

这里我们使用unicode分词：将所有字符都作为一个词来进行分词

tokenizer = keras_nlp.tokenizers.UnicodeCodepointTokenizer(vocabulary_size=400)# tokens - ids
ids = tokenizer(['Why are you so funny?', 'how can i get you'])# ids - tokens
tokenizer.detokenize(ids)

2.4 构建数据集

利用tokenizer和text数据构建数据集

def split_input_target(sequence):input_text = sequence[:-1]target_text = sequence[1:]return input_text, target_texttext = open('./shakespeare.txt', 'rb').read().decode(encoding='utf-8')
dataset = tf.data.Dataset.from_tensor_slices(tokenizer(text))
dataset = dataset.batch(64, drop_remainder=True)
dataset = dataset.map(split_input_target).batch(64)input, ouput = dataset.take(1).get_single_element()

2.5 定义模型

d_model = 512
rnn_units = 1025class CustomModel(tf.keras.Model):def __init__(self, vocabulary_size, d_model, rnn_units):super().__init__(self)self.embedding = tf.keras.layers.Embedding(vocabulary_size, d_model)self.gru = tf.keras.layers.GRU(rnn_units, return_sequences=True, return_state=True)self.dense = tf.keras.layers.Dense(vocabulary_size, activation='softmax')def call(self, inputs, states=None, return_state=False, training=False):x = inputsx = self.embedding(x)if states is None:states = self.gru.get_initial_state(x)x, states = self.gru(x, initial_state=states, training=training)x = self.dense(x, training=training)if return_state:return x, stateselse:return xmodel = CustomModel(tokenizer.vocabulary_size(), d_model, rnn_units)# 查看模型结构
model(input)
model.summary()

2.6 模型训练

model.compile(loss = tf.losses.SparseCategoricalCrossentropy(),optimizer='adam',metrics=['accuracy']
)model.fit(dataset, epochs=3)

2.7 模型推理

定义一个InferenceModel进行模型推理配置；

class InferenceModel(tf.keras.Model):def __init__(self, model, tokenizer):super().__init__(self)self.model = modelself.tokenizer = tokenizerdef generate(self, inputs, length, return_states=False):inputs = inputs = tf.constant(inputs)[tf.newaxis]states = Noneinput_ids = self.tokenizer(inputs).to_tensor()outputs = []for i in range(length):predicted_logits, states = model(inputs=input_ids, states=states, return_state=True)input_ids = tf.argmax(predicted_logits, axis=-1)outputs.append(input_ids[0][-1].numpy())outputs = self.tokenizer.detokenize(lst).numpy().decode('utf-8')if return_states:return outputs, stateselse:return outputsinfere = InferenceModel(model, tokenizer)start_chars = 'hello'
outputs = infere.generate(start_chars, 1000)
print(start_chars + outputs)

生成结果如下所示，感觉很差：

hellonofur us:
medous, teserwomador.
walled o y.
as
t aderemowate tinievearetyedust. manonels,
w?
workeneastily.
watrenerdores aner'shra
palathermalod, te a y, s adousced an
ptit: mamerethus:
bas as t: uaruriryedinesm's lesoureris lares palit al ancoup, maly thitts?
b veatrt
watyeleditenchitr sts, on fotearen, medan ur
tiblainou-lele priniseryo, ofonet manad plenerulyo
thilyr't th
palezedorine.
ti dous slas, sed, ang atad t,
wanti shew.
e
upede wadraredorenksenche:
wedemen stamesly ateara tiafin t t pes:
t: tus mo at
io my.
ane hbrelely berenerusedus' m tr;
p outellilid ng
ait tevadwantstry.
arafincara, es fody
'es pra aluserelyonine
pales corseryea aburures
angab:
sunelyothe: s al, chtaburoly o oonis s tioute tt,
pro.
tedeslenali: s 't ing h
sh, age de, anet: hathes: s es'tht,
as:
wedly at s serinechamai:
mored t.
t monatht t athoumonches le.
chededondirineared
ter
p y
letinalys
ani
aconen,
t rs:
t;et, tes-
luste aly,
thonort aly one telus, s mpsantenam ranthinarrame! a
pul; bon
s fofuly

三、整体总结

RNN结合unicode分词能进行文本生成但是效果一言难尽！

RNN：文本生成

文章目录一、完整代码二、过程实现2.1 导包2.2 数据准备2.3 字符分词2.4 构建数据集2.5 定义模型2.6 模型训练2.7 模型推理三、整体总结采用RNN和unicode分词进行文本生成一、完整代码这里我们使用tensorflow实现，代码如下： # 完整代码在这里 imp…...

编程日记 2023/12/7 18:21:57

Rust UI开发（五）：iced中如何进行页面布局（pick_list的使用）？（串口调试助手）

注：此文适合于对rust有一些了解的朋友 iced是一个跨平台的GUI库，用于为rust语言程序构建UI界面。这是一个系列博文，本文是第五篇，前四篇链接： 1、Rust UI开发（一）：使用iced构建UI时…...

编程日记 2023/12/7 18:18:53

Linux学习笔记2

web服务器部署： 1.装包： [rootlocalhost ~]# yum -y install httpd 2.配置一个首页： [rootlocalhost ~]# echo i love yy > /var/www/html/index.html 启动服务：[rootlocalhost ~]# systemctl start httpd Ctrl W以空格为界…...

编程日记 2023/12/7 18:17:52

数据结构算法-插入排序算法

引言玩纸牌的时候。往往需要将牌从乱序排列变成有序排列这就是插入排序插入排序算法思想先看图首先第一个元素我默认已有序那我们从第二个元素开始，依次插入到前面已有序的部分中。具体来说，我们将第二个元素与第一个元素比较，…...

编程日记 2023/12/7 18:16:51

安装Kuboard管理K8S集群

目录第一章.安装Kuboard管理K8S集群 1.安装kuboard 2.绑定K8S集群，完成信息设定 3.内网安装第二章.kuboard-spray安装K8S 2.1.先拉镜像下来 2.2.之后打开后，先熟悉功能，注意版本 2.3.打开资源包管理，选择符合自己服务器…...

编程日记 2023/12/7 18:15:50

网络安全行业大模型调研总结

随着人工智能技术的发展，安全行业大模型SecLLM（security Large Language Model）应运而生，可应用于代码漏洞挖掘、安全智能问答、多源情报整合、勒索情报挖掘、安全评估、安全事件研判等场景。参考： 1、安全行业大模…...

编程日记 2023/12/7 18:14:49

Linux AMH服务器管理面板本地安装与远程访问

最近，我发现了一个超级强大的人工智能学习网站。它以通俗易懂的方式呈现复杂的概念，而且内容风趣幽默。我觉得它对大家可能会有所帮助，所以我在此分享。点击这里跳转到网站。文章目录 1. Linux 安装AMH 面板2. 本地访问AMH 面板3. Linux安装…...

编程日记 2023/12/7 18:13:48

Sharding-Jdbc（3）：Sharding-Jdbc分表

1 分表分库 LogicTable 数据分片的逻辑表，对于水平拆分的数据库(表)，同一类表的总称。订单信息表拆分为2张表,分别是t_order_0、t_order_1，他们的逻辑表名为t_order。 ActualTable 在分片的数据库中真实存在的物理表。即上个示例中的t_…...

编程日记 2023/12/7 18:11:46

zookeeper集群 +kafka集群

1.zookeeper kafka3.0之前依赖于zookeeper zookeeper是一个开源，分布式的架构，提供协调服务（Apache项目） 基于观察者模式涉及的分布式服务管理架构存储和管理数据，分布式节点上的服务接受观察者的注册&#xff0c…...

编程日记 2023/12/7 18:10:45

2022年全国大学生数据分析大赛医药电商销售数据分析求解全过程论文及程序

2022年全国大学生数据分析大赛医药电商销售数据分析原题再现： 问题背景 20 世纪 90 年代是电子数据交换时代，中国电子商务开始起步并初见雏形，随后 Web 技术爆炸式成长使电子商务处于蓬勃发展阶段，目前互联网信息碎片化以…...

编程日记 2023/12/7 18:08:43

Python版本与opencv版本的对应关系

python版本要和opencv版本相对应，否则安装的时候会报错。可以到Links for opencv-python上面查看python版本和opencv版本的对应关系，如图，红框内是python版本，绿框内是opencv版本。查看自己的python版本后，使用下面…...

编程日记 2023/12/7 18:06:41

【开源视频联动物联网平台】LiteFlow

LiteFlow是一个轻量且强大的国产规则引擎框架，可用于复杂的组件化业务的编排领域。它基于规则文件来编排流程，支持xml、json、yml三种规则文件写法方式，再复杂的逻辑过程都能轻易实现。LiteFlow于2020年正式开源，2021年获得开源中…...

编程日记 2023/12/7 18:05:39

家用智能门锁——智能指纹锁方案

智能指纹锁产品功能： 1：指纹识别技术：光学传感器、半导体传感器或超声波传感器等。 2：指纹容量：智能指纹锁可以存储的指纹数量，通常在几十到几百个指纹之间。 3：解锁时间：指纹识别和…...

编程日记 2023/12/7 18:02:37

Qt6 QRibbon 一键美化Qt界面

强烈推荐一个 github 项目： https://github.com/gnibuoz/QRibbon 作用： 在几乎不修改任何你自己代码的情况下，一键美化你的 UI 界面。代码环境：使用 VS2019 编译 Qt6 GUI 程序，继承 QMainWindow 窗口类一、使用方法 …...

编程日记 2023/12/7 18:01:36

JAVA IO:NIO

1.阻塞 IO 模型最传统的一种 IO 模型，即在读写数据过程中会发生阻塞现象。当用户线程发出 IO 请求之后，内核会去查看数据是否就绪，如果没有就绪就会等待数据就绪，而用户线程就会处于阻塞状态，用户线程交出 CPU。当…...

编程日记 2023/12/7 17:59:34

Python 在控制台打印带颜色的信息

#格式：　　设置颜色开始 ：\033[显示方式;前景色;背景色m #说明： 前景色背景色颜色 --------------------------------------- 30 40 黑色 31 41 红色 32 …...

编程日记 2023/12/7 17:55:31

SQL Server 数据库，创建触发器避免数据被更改

5.4触发器触发器是一种特殊类型的存储过程，当表中的数据发生更新时将自动调用，以响应INSERT、 UPDATE 或DELETE 语句。 5.4.1什么是触发器 1.触发器的概念触发器是在对表进行插入、更新或删除操作时自动执行的存储过程，触发器通常用于强…...

编程日记 2023/12/7 17:54:30

C语言实现植物大战僵尸(完整版）

实现这个游戏需要Easy_X 这个在我前面一篇C之番外篇爱心代码有程序教你怎么下载，大家可自行查看然后就是需要植物大战僵尸的素材和音乐，需要的可以在评论区首先是main.cpp //开发日志 //1导入素材 //2实现最开始的游戏场景 //3实现游戏顶部的工具栏…...

编程日记 2023/12/7 17:52:28

基于YOLOv8深度学习的火焰烟雾检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ 👍感谢小伙伴们点赞、关注！ 《------往期经典推…...

编程日记 2023/12/7 17:51:27

【C++】手撕string思路梳理

目录基本思路代码实现 1.构建框架： 2.构建函数重载 3.迭代器： 4.遍历string 5.resetve 开空间，insert任意位置插入push_back,append,(按顺序依次实现) 6.erase删除，clear清除，resize缩容 7.流插入&#xff0…...

编程日记 2023/12/7 17:49:26

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计：let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性，这种设计体现了语言的核心哲学。以下是深度解析： 1.1 设计理念剖析安全优先原则：默认不可变强制开发者明确声明意图 let x 5; …...

编程新知 2025/9/28 20:12:12

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2026/2/5 4:33:58

高等数学（下）题型笔记（八）空间解析几何与向量代数

目录 0 前言 1 向量的点乘 1.1 基本公式 1.2 例题 2 向量的叉乘 2.1 基础知识 2.2 例题 3 空间平面方程 3.1 基础知识 3.2 例题 4 空间直线方程 4.1 基础知识 4.2 例题 5 旋转曲面及其方程 5.1 基础知识 5.2 例题 6 空间曲面的法线与切平面 6.1 基础知识 6.2…...

编程新知 2026/1/28 9:04:29

视频字幕质量评估的大规模细粒度基准

大家读完觉得有帮助记得关注和点赞！！！ 摘要视频字幕在文本到视频生成任务中起着至关重要的作用，因为它们的质量直接影响所生成视频的语义连贯性和视觉保真度。尽管大型视觉-语言模型（VLMs）在字幕生成方面…...

编程新知 2026/2/6 9:24:15

HTML前端开发：JavaScript 常用事件详解

作为前端开发的核心，JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例： 1. onclick - 点击事件当元素被单击时触发（左键点击） button.onclick function() {alert("按钮被点击了！&…...

编程新知 2025/11/10 10:45:11

【python异步多线程】异步多线程爬虫代码示例

claude生成的python多线程、异步代码示例，模拟20个网页的爬取，每个网页假设要0.5-2秒完成。代码 Python多线程爬虫教程核心概念多线程：允许程序同时执行多个任务，提高IO密集型任务（如网络请求）的效率…...

编程新知 2025/12/16 18:04:55

Java毕业设计：WML信息查询与后端信息发布系统开发

JAVAWML信息查询与后端信息发布系统实现一、系统概述本系统基于Java和WML(无线标记语言)技术开发，实现了移动设备上的信息查询与后端信息发布功能。系统采用B/S架构，服务器端使用Java Servlet处理请求，数据库采用MySQL存储信息&#xff0…...

编程新知 2025/10/27 13:29:11

现有的 Redis 分布式锁库（如 Redisson）提供了哪些便利？

现有的 Redis 分布式锁库（如 Redisson）相比于开发者自己基于 Redis 命令（如 SETNX, EXPIRE, DEL）手动实现分布式锁，提供了巨大的便利性和健壮性。主要体现在以下几个方面： 原子性保证 (Atomicity)&#xff…...

编程新知 2025/9/23 11:26:04

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在 C/C 编程的编译和链接过程中，附加包含目录、附加库目录和附加依赖项是三个至关重要的设置，它们相互配合，确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中，这些概念容易让人混淆，但深入理解它们的作用和联…...

编程新知 2026/1/26 2:22:24

Proxmox Mail Gateway安装指南：从零开始配置高效邮件过滤系统

💝💝💝欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：「storms…...

编程新知 2026/1/17 14:57:41