当前位置：首页 > news >正文

基于bert的自动对对联系统

news 2026/2/10 7:37:59

概述

演示效果

核心逻辑

使用方式

1.裁剪数据集

根据自己的需要选择

2.用couplet数据集训练模型

模型存储在model文件夹中

3.将模型转换为ONNX格式

4.打开index.html就可以在前端使用此自动对对联系统了。

本文所涉及所有资源均在传知代码平台可获取。

概述

这个生成器利用预训练的BERT模型，通过微调来生成中国对联。对联是一种中文传统文化形式，通常由上下联组成，具有一定的韵律和意境。

演示效果

在这里可以插入动图展示您的程序运行效果

核心逻辑

在这里可以粘贴您的核心代码逻辑：

# start
class CoupletDataset(Dataset):
    def __init__(self, data_path, tokenizer):
        self.data_path = data_path
        self.tokenizer = tokenizer
        self.inputs, self.labels = self.load_dataset()    def load_dataset(self):
        with open(self.data_path + '/in_cut.txt', 'r', encoding='utf-8') as fin, \
             open(self.data_path + '/out_cut.txt', 'r', encoding='utf-8') as fout:
            inputs = [line.strip() for line in fin.readlines()]
            labels = [line.strip() for line in fout.readlines()]
        return inputs, labels    def __len__(self):
        return len(self.inputs)    def __getitem__(self, index):
        input_text = self.inputs[index]
        label_text = self.labels[index]        input_tokens = tokenizer.tokenize(input_text)
        label_tokens = tokenizer.tokenize(label_text)        # 拼接成BERT模型需要的输入格式
        input_tokens = ['[CLS]'] + input_tokens + ['[SEP]']
        label_tokens = label_tokens + ['[SEP]']        # 将token转换为对应的id
        input_ids = tokenizer.convert_tokens_to_ids(input_tokens)
        label_ids = tokenizer.convert_tokens_to_ids(label_tokens)        # 确保input_ids和label_ids的长度一致
        max_length = max(len(input_ids), len(label_ids))
        input_ids.extend([0] * (max_length - len(input_ids)))
        label_ids.extend([0] * (max_length - len(label_ids)))        # 将input_ids和label_ids转换为tensor
        input_ids = torch.tensor(input_ids).unsqueeze(0).to(device)  # 增加batch维度
        label_ids = torch.tensor(label_ids).unsqueeze(0).to(device)  # 增加batch维度        return input_ids, label_ids

使用方式

1.裁剪数据集

修改lines_to_read = 1000

选择你想要的数据集大小，这里采用了1000条对联

原始数据集有70万条对联，根据需求还有电脑性能选择

根据自己的需要选择

2.用couplet数据集训练模型

在终端中输入命令 python bert.py，训练模型并监控损失变化。训练完成后会生成损失图像，并将模型保存在 model 文件夹中。

最终出来loss损失图像

模型存储在model文件夹中

3.将模型转换为ONNX格式

使用命令 python app.py 将存储的模型转换为ONNX格式，以便在前端调用。

4.打开index.html就可以在前端使用此自动对对联系统了。

在输入框中输入上联。

感觉不错，点击我，立即使用

基于bert的自动对对联系统

目录概述演示效果核心逻辑使用方式 1.裁剪数据集根据自己的需要选择 2.用couplet数据集训练模型模型存储在model文件夹中 3.将模型转换为ONNX格式 4.打开index.html就可以在前端使用此自动对对联系统了。本文所涉及所有资源均在传知代码平台可获取。概述这个生成器利用…...

编程日记 2024/7/29 3:37:11

js-vue中多个按钮状态选中类似于复选框与单选框实现

1.vue中多个按钮状态选中类似于复选框在Vue中处理多个按钮的选中状态切换，通常我们会利用Vue的响应式数据系统来追踪每个按钮的选中状态。 html <div id"app"> <button v-for"button in buttons" :key"button.id" :c…...

编程日记 2024/7/29 3:34:07

ObservableCollection新增数据前判断数据是否存在

public class MyDataModel {public int Id { get; set; }public string Name { get; set; }}public static void Main(){// 创建 ObservableCollectionObservableCollection<MyDataModel> myDataCollection new ObservableCollection<MyDataModel>{new MyDataMode…...

编程日记 2024/7/29 3:31:03

DBus快速入门

DBus快速入门参考链接： 中文博客： https://www.e-learn.cn/topic/1808992 https://blog.csdn.net/u011942101/article/details/123383195 https://blog.csdn.net/weixin_44498318/article/details/115803936 https://www.e-learn.cn/topic/1808992 htt…...

编程日记 2024/7/29 3:30:02

SQL Server 设置端口号：详细步骤与注意事项

目录一、了解SQL Server端口号的基础知识 1.1 默认端口号 1.2 静态端口与动态端口二、使用SQL Server配置管理器设置端口号 2.1 打开SQL Server配置管理器 2.2 定位到SQL Server网络配置 2.3 修改TCP/IP属性 2.4 重启SQL Server服务三、注意事项 3.1 防火墙设置 3…...

编程日记 2024/7/29 3:24:57

Python面试题：结合Python技术，如何使用NetworkX进行复杂网络分析

NetworkX 是一个强大的 Python 库，用于创建、操作和研究复杂网络的结构、动力学和功能。它提供了丰富的功能来处理图和网络数据，适合用于复杂网络分析。以下是使用 NetworkX 进行复杂网络分析的基本步骤： 安装 NetworkX： pip inst…...

编程日记 2024/7/29 3:20:53

【C#/C++】C#调C++的接口，给C++传结构体数组

C#调C的接口，给C传结构体数组 1、背景2、实现 1、背景 C#软件创建了一个结构体数组用来存储图像的区域信息，分别是矩形框的左上像素的xy坐标和矩形框右下像素的xy坐标。需要传入给调用的C函数的参数列表中，我们选择使用C#传入一个结构体数组…...

编程日记 2024/7/29 3:19:52

ctfshow SSTI注入 web369--web372

web369 这把request过滤了，只能自己拼字符了 ""[[__clas,s__]|join] 或者 ""[(__clas,s__)|join] 相当于 ""["__class__"]举个例子，chr(97) 返回的是字符 a，因为 97 是小写字母 a 的 Unicode 编码…...

编程日记 2024/7/29 3:18:51

Llama + Dify，在你的电脑搭建一套AI工作流

theme: smartblue 点赞关注收藏学会了本文简介最近字节在推Coze，你可以在这个平台制作知识库、制作工作流，生成一个具有特定领域知识的智能体。那么，有没有可能在本地也部署一套这个东西呢？这样敏感数据就不会泄露了&…...

编程日记 2024/7/29 3:15:48

洛谷 P9854 [CCC 2008 J1] Body Mass Index

这题让我们计算出 BMI 值，随后判断属于哪个等级。 BMI 值计算公式： 。 BMI 范围对应信息 …...

编程日记 2024/7/29 3:14:46

Redis面试三道题目

针对Redis的面试题，我将从简单到困难给出三道题目，并附上参考答案的概要。 1. 简单题：请简述Redis是什么，以及它的主要优点。参考答案： Redis简介：Redis是一个开源的、使用ANSI C语言编写、支持网络、可…...

编程日记 2024/7/29 3:11:44

redis的使用场景-分布式锁

使用redis的setnx命令放入数据并用此数据当锁完成业务（但是如果用户操作途中出现异常导致超出指定时间会出现问题） Service public class StockService {Autowiredprivate StockDao stockDao; //mapper注入Autowiredprivate StringRedisTemplate redisT…...

编程日记 2024/7/29 3:10:43

知识库系统全解析：2024年最佳9款

本文将分享9款优质团队知识库管理工具：PingCode、Worktile、石墨文档、语雀、Wolai 我来、有道云笔记、飞书文档、Confluence、Notion。在追求高效团队运作的今天，掌握和整合知识成为了企业不可或缺的需求。但面对市场上琳琅满目的知识库管理工具&#…...

编程日记 2024/7/29 3:09:41

猫头虎分享：Numpy知识点一文带你详细学习np.random.randn()

🐯 猫头虎分享：Numpy知识点一文带你详细学习np.random.randn() 摘要 Numpy 是数据科学和机器学习领域中不可或缺的工具。在本篇文章中，我们将深入探讨 np.random.randn()，一个用于生成标准正态分布的强大函数。通过详细的代码示…...

编程日记 2024/7/29 3:04:38

QT 关于QTableWidget的常规使用

目录一、初始化二、封装功能用法三、结语一、初始化 1、设置表头直接在ui设计界面修改或者使用QT封装的函数修改，代码如下： QStringList recList {"第一列", "第二列", "第三列"}; ui->tableWidget->setH…...

编程日记 2024/7/29 3:02:36

PyCharm 常用的插件

Material Theme UI Lite：‌提供多种不同的页面风格，‌为PyCharm界面增添个性化元素。‌Chinese (Simplified) Language Pack：‌为中文用户提供简体中文的界面、‌菜单、‌提示信息，‌提升使用体验。‌Tabnine：‌基于人…...

编程日记 2024/7/29 2:58:30

理解 HTTP 请求中 Query 和 Body 的异同

本文将深入探讨HTTP请求中的两个关键要素：查询参数（Query）和请求体（Body）。我们将阐明它们之间的差异，并讨论在何种情况下使用每一种。 HTTP 请求概述 HTTP 请求是客户端（如浏览器&#xff09…...

编程日记 2024/7/29 2:57:29

【AI大模型】企业级向量数据库的选择与实战

前言 ChatGPT4相比于ChatGPT3.5,有着诸多不可比拟的优势，比如图片生成、图片内容解析、GPTS开发、更智能的语言理解能力等，但是在国内使用GPT4存在网络及充值障碍等问题，如果您对ChatGPT4.0感兴趣，可以私信博主为您解决账号和环境…...

编程日记 2024/7/29 2:55:26

LangChain开发框架并学会对大型预训练模型进行微调（fine-tuning）

要掌握LangChain开发框架并学会对大型预训练模型进行微调（fine-tuning），你需要理解整个过程从数据准备到最终部署的各个环节。下面是这一流程的一个概览，并提供了一些关键步骤和技术点： 1. LangChain开发框架简介 La…...

编程日记 2024/7/29 2:47:18

VMware安装（有的时候启动就蓝屏建议换VM版本）

当你开始使用虚拟化技术来管理和运行多个操作系统时，VMware 是一个强大且广泛使用的选择。本篇博客将指导你如何安装 VMware Workstation Pro，这是一个功能强大的虚拟机软件，适用于个人和专业用户。一、下载 VMware Workstation Pro 访问官网…...

编程日记 2024/7/29 2:43:14

【OSG学习笔记】Day 18: 碰撞检测与物理交互

物理引擎（Physics Engine） 物理引擎是一种通过计算机模拟物理规律（如力学、碰撞、重力、流体动力学等）的软件工具或库。它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互，广泛应用于游戏开发、动画制作、虚…...

编程新知 2026/2/4 2:08:30

Python：操作 Excel 折叠

💖亲爱的技术爱好者们，热烈欢迎来到 Kant2048 的博客！我是 Thomas Kant，很开心能在CSDN上与你们相遇～💖 本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】 Python 操作 Excel 系列读取单元格数据按行写入设置行高和列宽自动调整行高和列宽水平…...

编程新知 2026/1/30 20:05:06

FFmpeg 低延迟同屏方案

引言在实时互动需求激增的当下，无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作，还是游戏直播的画面实时传输，低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架，凭借其灵活的编解码、数据…...

编程新知 2025/11/4 6:26:59

使用分级同态加密防御梯度泄漏

抽象联邦学习 （FL） 支持跨分布式客户端进行协作模型训练，而无需共享原始数据，这使其成为在互联和自动驾驶汽车 （CAV） 等领域保护隐私的机器学习的一种很有前途的方法。然而，最近的研究表明&…...

编程新知 2026/1/24 6:22:43

《用户共鸣指数（E）驱动品牌大模型种草：如何抢占大模型搜索结果情感高地》

在注意力分散、内容高度同质化的时代，情感连接已成为品牌破圈的关键通道。我们在服务大量品牌客户的过程中发现，消费者对内容的“有感”程度，正日益成为影响品牌传播效率与转化率的核心变量。在生成式AI驱动的内容生成与推荐环境中&#xff0…...

编程新知 2026/2/2 1:48:09

苍穹外卖--缓存菜品

1.问题说明用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大 2.实现思路通过Redis来缓存菜品数据，减少数据库查询操作。缓存逻辑分析： ①每个分类下的菜品保持一份缓存数据…...

编程新知 2026/2/7 15:39:49

如何理解 IP 数据报中的 TTL？

目录前言理解前言面试灵魂一问：说说对 IP 数据报中 TTL 的理解？我们都知道，IP 数据报由首部和数据两部分组成，首部又分为两部分：固定部分和可变部分，共占 20 字节，而即将讨论的 TTL 就位于首…...

编程新知 2026/2/4 18:09:49

laravel8+vue3.0+element-plus搭建方法

创建 laravel8 项目 composer create-project --prefer-dist laravel/laravel laravel8 8.* 安装 laravel/ui composer require laravel/ui 修改 package.json 文件 "devDependencies": {"vue/compiler-sfc": "^3.0.7","axios": …...

编程新知 2025/10/15 0:25:46