当前位置：首页 > news >正文

利用svm进行模型训练

news 2026/2/10 20:07:06

一、步骤

1、将文本数据转换为特征向量： tf-idf

2、使用这些特征向量训练SVM模型

二、代码

from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, classification_reportdef preprocess_data(data):texts, labels = zip(*data)vectorizer = TfidfVectorizer()X = vectorizer.fit_transform(texts).todense()return X, labels, vectorizerdef print_sorted_feature_weights(X, vectorizer):feature_name = vectorizer.get_feature_names_out()for i, doc in enumerate(X):nonzero_idx = doc.nonzero()[1]dic = {idx: doc[0, idx] for idx in nonzero_idx}sorted_dic = dict(sorted(dic.items(), key=lambda x: x[1], reverse=True))data_ = {feature_name[k]: v for k, v in sorted_dic.items()}print(data_)def train_and_evaluate_model(X_train, X_test, y_train, y_test):svm_classifier = SVC(kernel='linear', random_state=42)svm_classifier.fit(X_train, y_train)y_pred = svm_classifier.predict(X_test)return y_test, y_preddef main():# 示例数据集data = [("I love this product!", 1),("This is terrible.", 0),("The movie was fantastic.", 1),("I dislike this feature.", 0),("Amazing experience!", 1),("Not recommended.", 0)]# 数据预处理X, labels, vectorizer = preprocess_data(data)# 打印排序后的特征权重print_sorted_feature_weights(X, vectorizer)# 将数据集拆分为训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, labels, test_size=0.2, random_state=42)# 训练和评估模型y_true, y_pred = train_and_evaluate_model(X_train, X_test, y_train, y_test)# 测试集是哪些print_sorted_feature_weights(X_test,vectorizer)# 评估模型性能accuracy = accuracy_score(y_true, y_pred)report = classification_report(y_true, y_pred)# 打印模型性能指标print(f"Accuracy: {accuracy}")print("Classification Report:\n", report)if __name__ == "__main__":main()

三、结果

对应着：test_texts= [("I love this product!", 1),("This is terrible.", 0)] — 对应着：test_data= [("I love this product!", 1),("This is terrible.", 0)]

利用svm进行模型训练

一、步骤 1、将文本数据转换为特征向量 ： tf-idf 2、使用这些特征向量训练SVM模型二、代码 from sklearn.model_selection import train_test_split from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.svm import SVC from sklearn.m…...

编程日记 2023/12/15 10:46:33

【Docker】WSL 2 上的 Docker 搭建和入门

▒ 目录 ▒ 🛫 导读开发环境 1️⃣ 安装安装Docker Desktop for Windows 2️⃣ 环境配置3️⃣ hello world第一次运行再次运行分析总结 📖 参考资料 🛫 导读开发环境版本号描述文章日期2023-12-14操作系统Win11 - 22H222621.2715WSL2 C:…...

编程日记 2023/12/15 10:45:33

pytorch环境配置

1.创建环境 conda create --name pytorch python3.11.5 2.激活环境 source activate pytorch 3.添加国内镜像源： conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsin…...

编程日记 2023/12/15 10:40:29

电子眼+无人机构建平安城市视频防控监控方案

电子眼（也称为监控摄像机）可以通过安装在城市的不同角落，实时监控城市的各个地方。它们可以用于监测交通违法行为、监控公共场所的安全以及实时监测特定区域的活动情况。通过电子眼的应用，可以帮助警方及时发现并响应各类安全事件…...

编程日记 2023/12/15 10:37:25

mysql binlog_ignore_db参数的效果详解

我们知道 binlog 会记录数据库所有执行的 DDL 和 DML 语句（除了数据查询语句select、show等）。我们可以在mysql配置文件中关闭binlog [mysqld] skip-log-bin注意默认情况下会记录所有库的操作，那么如果我们有另类需求，比如说只让某个库记录 binglog 或排除某个库记录…...

编程日记 2023/12/15 10:35:24

HI3559AV100和FPGA 7K690T的PCIE接口调试记录-续

上文https://blog.csdn.net/fzktongyong/article/details/134963814?spm1001.2014.3001.5501 上一篇文中PCIE实测速度和理论计算有较大偏差，经过尝试后有所提升。 1、提升效果 1）、RC写操作，实测速度817MB/s（410407&…...

编程日记 2023/12/15 10:33:21

vivado约束方法4

时序约束向导定时约束向导确定合成或上缺少的定时约束实现的设计。它分析了网表、时钟网络连接和现有的定时限制，以便根据《超快设计方法指南》提供建议用于FPGA和SoC（UG949）。以下11涵盖了三类约束页面，然后是摘要。包括以下步…...

编程日记 2023/12/15 10:31:20

LeetBook学习-C语言-数组

1.数组的操作 1.1 读取元素知道内存地址可以快速访问，时间复杂度为O(1) 1.2 查找元素从首地址开始，逐个查找，最坏时间复杂度为O(N) 1.3 插入元素插入元素，首先位置要腾空，而后执行插入操作。 1.4 删除元素删除掉某…...

编程日记 2023/12/15 10:29:18

23种策略模式之策略模式

23种策略模式之策略模式文章目录 23种策略模式之策略模式前言优缺点使用场景角色定义UML模拟示例小结前言在软件开发中，设计模式是为了解决常见问题而提供的一套可重用的解决方案。策略模式（Strategy Pattern）是其中一种常见的设计模式&a…...

编程日记 2023/12/15 10:27:16

【笔试强化】Day 2

文章目录一、选择1.2.（写错）3.4.5.6.（不会）7.（不清晰）8. （不会）9.10.（写错） 二、编程1. 排序子序列解法：代码： 2. 倒置字符串解法&am…...

编程日记 2023/12/15 10:26:15

windows禁用系统更新

1.在winr运行框中输入services.msc，打开windows服务窗口。 services.msc 2.在服务窗口中，我们找到Windows update选项，如下图所示： 3.双击windows update服务，我们把启动类型改为禁用，如下图所示&#xff…...

编程日记 2023/12/15 10:22:12

ES6原生音乐播放器（有接口）

视频展示 ES6音乐播放器项目介绍 GutHub地址：GitHub - baozixiangqianchong/ES6_MusicPlayer: 音乐播放器 ES6_MusicPlayer 是基于JavaScriptES6Ajax等通过原生构建的项目。能够充分锻炼JS能力。本项目有主页、详情页、歌单页面三部分组成 ├── assets&…...

编程日记 2023/12/15 10:21:11

Django和ECharts异步请求示例

前提条件创建django项目，安装配置过程这里就不讲述了。后端url http://127.0.0.1:8000/echarts/demo/ view视图函数 from django.http import HttpResponse import jsondef EchartsDemo(request):data {}categories ["衬衫","羊毛衫",&…...

编程日记 2023/12/15 10:19:09

Java序列化、反序列化-为什么要使用序列化？Serializable接口的作用？

什么是序列化和反序列化？ 把对象转换成字节序列把字节序列恢复成对象结合OSI七层协议模型，序列化和反序列化是在那一层做的？ 在OSI七层模型中，序列化工作的层级是表示层。这一层的主要功能包括把应用层的对象转换成一段连续的二进…...

编程日记 2023/12/15 10:18:08

连锁零售企业如何优化网络性能？

在传统的WAN网络中，分支机构通常通过专线或者MPLS连接到总部或数据中心，但这种连接受制于地理位置。而SD-WAN（Software-Defined Wide Area Network）这种创新的网络架构，它通过软件定义和虚拟化技术，将分支机…...

编程日记 2023/12/15 10:16:06

[已解决]HttpMessageNotReadableException: JSON parse error: Unexpected character:解析JSON时出现异常的问题分析与解决方案

🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~&#x1f33…...

编程日记 2023/12/15 10:12:03

华为OD机试 - 找数字（Java JS Python C）

题目描述小扇和小船今天又玩起来了数字游戏，小船给小扇一个正整数 n（1 ≤ n ≤ 1e9），小扇需要找到一个比 n 大的数字 m，使得 m 和 n 对应的二进制中 1 的个数要相同，如： 4对应二进制100 8对应二进制1000 其中1的个数都为1个现在求 m 的最小值。输入描述输入一个…...

编程日记 2023/12/15 10:11:02

ElasticSearch - networking配置global

版本8.11 单机部署了一个节点在elasticsearch.yml中配置了network.host: 8.8.8.8(之前为127.0.0.1) 但启动服务失败报错信息为: BindTransportException: Failed to bind to 8.8.8.8:[9300-9399] 为啥要配置8.8.8.8 是因为参考的官方说明 Networking | Elasticsearch Gu…...

编程日记 2023/12/15 10:10:01

GPT4停止订阅付费了怎么办? 怎么升级ChatGPT plus?提供解决方案

11月中旬日OpenAI 暂时关闭所有的升级入口之后，很多小伙伴就真的在排队等待哦。其实有方法可以绕开排队，直接付费订阅升级GPT的。赶紧用起来立马“插队”成功！亲测~~~ 一、登录ChatGPT账号 1、没有账号可以直接注册一个，流程超级…...

编程日记 2023/12/15 10:05:57

MySQL数据库，视图、存储过程与存储函数

数据库对象： 常见的数据库对象： 视图： 视图是一种虚拟表，本身是不具有数据的占用很少的内存空间。视图建立在已有表的基础上，视图赖以建立的这些表称为基表。视图的创建和删除只影响视图本身，不影响对…...

编程日记 2023/12/15 10:04:56

【SpringBoot】100、SpringBoot中使用自定义注解+AOP实现参数自动解密

在实际项目中，用户注册、登录、修改密码等操作，都涉及到参数传输安全问题。所以我们需要在前端对账户、密码等敏感信息加密传输，在后端接收到数据后能自动解密。 1、引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId...

编程新知 2025/11/28 6:00:25

TRS收益互换：跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 （一）概念解析 TRS（Total Return Swap）收益互换是一种金融衍生工具，指交易双方约定在未来一定期限内，基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

编程新知 2025/11/2 0:31:23

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题安装 flash-attn 会一直卡在 build 那一步或者运行报错解决办法是因为你安装的 flash-attn 版本没有对应上，所以报错，到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本，cu、torch、cp 的版本一定要对…...

编程新知 2025/11/3 2:11:24

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接：3403. 从盒子中找出字典序最大的字符串 I 代码如下： class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

编程新知 2025/10/31 5:18:02

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中，部分节点存储的数据量或访问量远高于其他节点，导致这些节点负载过高，影响整体性能。数据倾斜的主要表现部分节点内存使用率远高于其他节…...

编程新知 2026/1/27 19:28:11

均衡后的SNRSINR

本文主要摘自参考文献中的前两篇，相关文献中经常会出现MIMO检测后的SINR不过一直没有找到相关数学推到过程，其中文献[1]中给出了相关原理在此仅做记录。 1. 系统模型复信道模型 n t n_t nt 根发送天线， n r n_r nr 根接收天线的 MIMO 系…...

编程新知 2026/1/30 4:47:24

在web-view 加载的本地及远程HTML中调用uniapp的API及网页和vue页面是如何通讯的？

uni-app 中 Web-view 与 Vue 页面的通讯机制详解一、Web-view 简介 Web-view 是 uni-app 提供的一个重要组件，用于在原生应用中加载 HTML 页面： 支持加载本地 HTML 文件支持加载远程 HTML 页面实现 Web 与原生的双向通讯可用于嵌入第三方网页或 H5 应…...

编程新知 2025/8/6 2:19:46