【Python】20大报告生成词云
这个我其实写过一篇类似的博客,但是那个的文件对象是.csv,对应到.docx文件的话,就不太适用了。如下:
Python生成词云-CSDN博客
代码:
import jieba
import os
import wordcloud
import numpy as np
from PIL import Image
from docx import Document# 从Word文档中提取文本
doc_path ="E:\\code\\二十大报告实录.docx"
doc = Document(doc_path)
txt = ""
for one_pare in doc.paragraphs:txt = txt + one_pare.text# 读取形状图片
img_path =r"wujiaoxing.png"
img = Image.open(img_path)
mk = np.array(img)# 配置词云对象参数
w = wordcloud.WordCloud(font_path="msyh.ttc", mask=mk, background_color="white")# 使用jieba进行分词
words = jieba.lcut(txt)
abc = " ".join(jieba.lcut(txt))# 生成词云
w.generate(abc)# 保存词云图像文件
output_path = os.getcwd() + r"cloud0.jpg"
w.to_file(output_path)# 显示词云图像
img = Image.open(output_path)
img.show()
这个容易出错的点就在于img_path。
生成结果:

相关文章:
【Python】20大报告生成词云
这个我其实写过一篇类似的博客,但是那个的文件对象是.csv,对应到.docx文件的话,就不太适用了。如下: Python生成词云-CSDN博客 代码: import jieba import os import wordcloud import numpy as np from PIL import…...
目标检测YOLO实战应用案例100讲-基于无人机的轻量化目标检测系统设计
目录 前言 国内外研究现状 国外研究现状 国内研究现状...
ansible-第二天
ansible 第二天 以上学习了ping、command、shell、script模块,但一般不建议使用以上三个,因为这三个模块没有幂等性。举例如下: [rootcontrol ansible]# ansible test -a "mkdir /tmp/1234"[WARNING]: Consider using the file …...
【测试工具】UnixBench 测试
一、UnixBench 简介 UnixBench 原本叫做 BYTE UNIX benchmark suite。软件为 Unix 类的系统提供了一些基本的性能指标。通过不同的测试来测试系统不同方面的性能(2D,3D,CPU,内存等等)。这些测试的结果将和一些标准的系…...
软件测试金融项目,在测试的时候一定要避开的一些雷区
软件测试金融项目需要格外谨慎和专注,因为这些项目通常涉及大量的交易、用户隐私和其他敏感信息。以下是一些软件测试金融项目时需要关注的方面: 1. 数据保护 在测试金融项目时,必须确保用户数据和投资信息得到保护。测试人员必须确保测试环…...
顺序图——画法详解
百度百科的定义: 顺序图是将交互关系表示为一个二维图。纵向是时间轴,时间沿竖线向下延伸。横向轴代表了在协作中各独立对象的类元角色。类元角色用生命线表示。当对象存在时,角色用一条虚线表示,当对象的过程处于激活状态时&…...
easyexcel==省市区三级联动
省市区三级联动,不选前面的就没法选后面的 package com.example.demoeasyexcel.jilian2; import com.alibaba.excel.write.metadata.holder.WriteSheetHolder; import com.alibaba.excel.write.metadata.holder.WriteWorkbookHolder; import org.apache.poi.ss.use…...
Linux进程控制(二)--进程等待(一)
前言:之前我们讲过,子进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏。 另外,进程一旦变成僵尸状态,那就刀枪不入,就连 kill -9 也无能为力࿰…...
【C++】C++11常用特性梳理
C11特性梳理 1. 列表初始化2. auto & decltype3. 右值引用3.1. 左右值引用比较3.2. 右值引用的意义3.3. 万能引用与完美转发3.4. 移动构造与移动赋值 4. default & delete5. 可变参数模板6. push_back 与 emplace_back7. lambda表达式7.1. 捕捉列表 8. function包装器8…...
修改iframe生成的pdf的比例
如图想要设置这里的默认比例 在iframe连接后面加上#zoom50即可,50是可以随便设置的,设置多少就是多少比例 <iframe src"name.pdf#zoom50" height"100%" width"100%"></iframe>...
C++之list的用法介绍
C之list的用法介绍 1)定义和初始化: #include <list> std::list<int> my_list; // 定义一个整数类型的list std::list<std::string> my_other_list {"apple", "banana", "cherry"}; // 初始化一个…...
Mybatis-plus 内部提供的 ServiceImpl<M extends BaseMapper<T>, T> 学习总结
作用 当集成Mybatis-Plus 后,我们的大部分数据库操作都可以通过 XxxxxMapper ,同时 Mybatis-plus 在Mapper 提供基本操作方法的同时,也提供类基础的 serviceImpl 来帮助我们完成一些常见的基本操作。 使用 一般情况下,我们首先…...
yolov5 利用Labelimg对图片进行标注
首先打开yolov5-master,在data文件中新建一个文件夹来存放你需要跑的数据,例如我这次跑的是羽毛球,文件把文件取名为badminton。使用其他文件夹例如images也可以,就是跑多了以后不好整理,然后点击 选中刚刚你存放数据的…...
完整版付费进群带定位源码
看到别人发那些不是挂羊头卖狗肉,要么就是发的缺少文件引流的。恶心的一P 这源码是我付费花钱买的分享给大家,功能完整。 搭建教程 nginx1.2 php5.6--7.2均可 最好是7.2 第一步上传文件程序到网站根目录解压 第二步导入数据库(shujuk…...
华为L410上制作内网镜像模板01
原文链接:华为L410上制作离线安装软件模板01 hello,大家好啊,今天给大家带来一篇在内网搭建Apache服务器,用于安装完内网操作系统后,在第一次开机时候,为系统安装软件,今天给大家用WeChat举例&a…...
linuxC语言缓冲区及小程序的实现
文章目录 1.文件缓冲区1.1介绍1.2缓冲文件系统1.3冲刷函数fflush1.4认识linux下的缓冲区 2.linux小程序的实现2.1 回车\r和换行\n2.2倒计时程序2.3进度条小程序sleep/usleep代码运行结果 1.文件缓冲区 1.1介绍 为缓和 CPU 与 I/O 设备之间速度不匹配,文件缓冲区用以…...
MySQL数据库基本操作-DDL 数据库基础知识
目录标题 1、数据库操作1-1 查询所有数据库1-2 创建数据库1-3 选择使用那个数据库1-4 删除数据库 2、数据库表操作2-1 创建数据库表2-2 查看当前数据库所有表名称2-3 查看指定某个表的创建语句2-4 查看表结构2-5 删除表 3、修改表结构格式3-1 修改表添加列3-2 修改列名和类名3-…...
基于JavaWeb+SpringBoot+Vue摩托车商城微信小程序系统的设计和实现
基于JavaWebSpringBootVue摩托车商城微信小程序系统的设计和实现 源码传送入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码传送入口 前言 近年来,随着移动互联网的快速发展,电子商务越来越受到…...
idea代码快捷键Mac版
1、查询任何东西 双击 Shift2、文件内查找 Command F 3、文件内替换 Command R4、全局查找(根据路径) Command Shift F5、在当前文件跳转到某一行的指定处 Command L6、退回 / 前进到上一个操作的地方 Command Option 方向键左Command Opt…...
分享76个Python管理系统源代码总有一个是你想要的
分享76个Python管理系统源代码总有一个是你想要的 学习知识费力气,收集整理更不易。 知识付费甚欢喜,为咱码农谋福利。 下载链接:https://pan.baidu.com/s/1JtcEHG9m8ro4-dc29kVyDg?pwd8888 提取码:8888 项目名称 A simpl…...
ESP32 BLE蓝牙AT指令实战:跨厂商模块透传配置与避坑指南
1. ESP32 BLE蓝牙透传入门指南 第一次接触ESP32 BLE蓝牙透传的朋友可能会觉得有点懵,其实说白了就是让两个蓝牙设备像对讲机一样自由收发数据。我最近刚用ESP32和亿佰特E104-BT5011A模块完成了这个项目,过程中踩了不少坑,今天就把完整流程和避…...
Tangram-Android性能优化终极指南:构建流畅滚动体验的10个技巧
Tangram-Android性能优化终极指南:构建流畅滚动体验的10个技巧 【免费下载链接】Tangram-Android Tangram is a modular UI solution for building native page dynamically including Tangram for Android, Tangram for iOS and even backend CMS. This project pr…...
为端到端API添加Naive RAG 流程
在前文中,我们结合langchain和fastapi搭建了一个端到端的问答API,这个agent可以调用已经封装好的工具函数,可以获取本地数据库,有记忆功能;但是这样的模型训练好了过后只是就固定了,如果没有获取或更新相应…...
Win10 + Bindiff 6.0 + IDA 7.5 环境配置与实战对比指南
1. 环境准备:Win10下的基础配置 在开始二进制分析之前,我们需要先搭建好基础环境。我推荐使用Win10 64位系统作为工作平台,因为它在兼容性和稳定性方面表现都很不错。记得关闭杀毒软件的实时防护功能,避免误报导致安装失败。我自己…...
什么是蜘蛛池?一个让SEOer又爱又恨的工具
先直接说结论:蜘蛛池是一组被专门搭建起来用于吸引搜索引擎蜘蛛(爬虫)的网站集群。通俗理解你可以把蜘蛛池想象成一个“蜘蛛招待所”。普通网站就像街边的店铺,等着搜索引擎蜘蛛偶然路过进来看看。而蜘蛛池是一个专门建出来的小区…...
从 0 到 1 用 Python 写一个最小可用 LangGraph 系统
从 0 到 1 用 Python 写一个最小可用 LangGraph 系统 关键词 LangGraph, LangChain, 状态机, 多Agent系统, 图结构, LLM应用, Python实现 摘要 在这篇技术博客中,我们将深入探讨LangGraph的核心概念,并从零开始构建一个最小可用的LangGraph系统。LangGraph是LangChain生态…...
Unity游戏窗口自定义:实现标题栏与边框的动态控制
1. 为什么需要自定义Unity游戏窗口样式 当你用Unity开发游戏或者工具软件时,默认的窗口样式可能会显得很"游戏引擎"。标准的标题栏、边框和系统按钮(最小化/最大化/关闭)虽然实用,但有时候我们需要更专业的界面外观。比…...
负采样:从Softmax瓶颈到高效词嵌入的工程实践
1. 负采样技术的前世今生 我第一次接触负采样是在2016年构建电商搜索系统时。当时我们的商品标题词表规模达到百万级,传统的Softmax计算让GPU显存直接爆满,训练一个epoch需要整整三天。直到团队里的算法专家扔给我那篇著名的Mikolov论文,问题…...
从写代码到问问题:2026年,AI如何重构数据科学工作流(七)
2026年初,腾讯云智能体平台在公积金业务里跑通了一个“边聊边办”的场景。用户随便丢一句“我去年缴存了多少?”,系统三分钟就能甩出一份结构化报告。换成以前,光是拉数据、写清洗逻辑、调格式,至少得耗上十五分钟。这…...
Dev-C++ 6.3与5.11版本对比:如何根据你的Windows系统选择最佳IDE版本
Dev-C 6.3与5.11版本深度对比:如何为你的Windows系统选择最佳开发环境 当你在Windows系统上寻找一款轻量级C/C集成开发环境时,Dev-C总是会出现在推荐列表中。但面对Embarcadero Dev-C 6.3和经典的Dev-Cpp 5.11两个主要版本,很多开发者都会陷入…...
