自然语言处理 中文停用词词典
我整合了4个常用的中文停用词词典(https://gitcode.net/mirrors/goto456/stopwords/-/tree/master),剔除了其中的非中文词汇,得到停用词词典如下,可直接取用。
看见
并不是
有著
岂非
毫无保留地
这样
么
哎呀
互相
通过
偶尔
难怪
猛然间
以至于
各地
敢情
会
较为
共总
转变
相对
万一
比起
继续
再说
除了
余外
尽管
亲自
绝对
几度
呕
加上
谁知
各级
沿着
老是
那儿
由此可见
如
恰好
别说
范围
可好
当庭
格外
同一
实际
连同
为
弹指之间
上下
从优
一方面
差一点
今天
伙同
另行
大概
怎么办
照着
那里
其实
自后
中间
大张旗鼓
平素
不要
长话短说
俺们
怎奈
所有
你们
从事
碰巧
类如
转动
瑟瑟
至今
前进
只是
譬喻
纯粹
叫做
了
乌乎
经
因
日复一日
具有
他的
当口儿
拿
到了儿
最
构成
论
这
里面
这次
就是说
具体来说
如果
乃至于
逐步
般的
坚决
乘势
总的来看
从古至今
这么样
日益
较比
某个
可以
因着
以后
替代
偶而
嘿
同时
光是
介于
之后
呃
朝
非独
诚然
打开天窗说亮话
这个
其二
来
另方面
倘
相反
具体说来
近年来
略为
并排
接连不断
遵照
之所以
高低
尽可能
庶几
不光
达旦
顷刻间
公然
顷刻
良好
大量
难说
出去
内
咋
假若
虽说
维持
不同
沿
吗
大略
依
进步
不怎么
多次
必要
别是
对于
从未
只
加强
这麽
嘎嘎
莫不
从无到有
兼之
正常
千万千万
不可开交
屡次
最后
起来
多数
为止
此间
来着
云尔
并肩
帮助
从早到晚
都
以为
反应
那
最高
不必
倒是
何尝
有力
作为
已经
大多数
我的
望
纵
呢
抑或
为着
却不
就地
不久
不再
大举
何必
咧
矣
显著
敞开儿
有点
至若
注意
仍旧
反手
嘎登
巴巴
请勿
不胜
分别
咱
亦
方能
容易
这般
适应
将近
下面
恰似
我们
再有
看出
趁热
整个
看看
上来
就是了
几经
跟
多年来
是不是
傥然
倘然
果真
它的
当然
取道
往
取得
有的是
从不
即使
对方
向使
传闻
应该
偏偏
以前
从中
这时
些
来看
什麽
有着
如此等等
常常
前面
加以
其
清楚
怎麽
代替
忽然
不怕
起首
下来
以致
默然
牢牢
很少
进去
当着
长期以来
啊呀
一天
啦
她是
据实
然而
召开
充分
纵使
方面
率然
之类
全身心
十分
较
既是
趁
但凡
凝神
果然
又及
原来
此外
先不先
恰巧
这儿
具体
以来
重大
别管
特殊
特点
乃至
你
莫如
那个
不可抗拒
设若
哪个
近几年来
如下
嗡嗡
某些
起先
这就是说
反过来说
过
一则通过
您们
全力
隔日
充其极
左右
论说
继而
连连
满足
就要
没有
在于
过去
何以
挨个
明确
矣乎
后
不日
实现
待到
人
缕缕
任何
最好
况且
除此之外
诸如
上述
要求
立马
表示
甚而
但是
加之
中小
年复一年
有效
再则
认真
不单
尔等
反倒
全都
不是
他是
趁便
背靠背
嘎
毋宁
而是
由于
必然
轰然
暗自
不由得
两者
规定
那边
趁着
如何
倒不如说
从
是否
暗地里
抽冷子
冒
省得
变成
喽
为什么
呀
也
姑且
随着
它
虽然
真正
或
设或
去
人人
更为
立刻
假使
与否
管
以下
上面
交口
比及
自打
不对
上去
隔夜
与
重新
集中
充其量
赖以
之前
且不说
主要
另一个
决定
宣布
据我所知
相对而言
现在
附近
穷年累月
不得了
边
啪达
某
要是
共同
哎
要么
何乐而不为
诸位
有所
极为
能否
看
凑巧
那麽
明显
看来
加入
如若
严重
随
不迭
三番五次
不惟
等等
绝不
甚至
之後
甭
不尽
很多
专门
采取
进来
是的
日渐
者
无论
挨着
你是
则甚
等到
一个
种
为何
亲眼
认识
咚
总之
意思
起头
而后
儿
一次
不
可
一起
较之
不止一次
切不可
针对
正如
惟其
常言说
越是
暗中
也是
反之则
不成
吱
哪年
啐
嘘
不能不
然后
长此下去
自身
不但
相当
除却
坚持
有的
正巧
方便
因为
我
亲口
这么
直接
每
反而
也就是说
不拘
有时
假如
尽量
一下
认为
如上
总是
兮
毫无
切勿
何处
正是
按理
开展
能
强调
犹且
得出
哪天
显然
他
首先
反之
打
以
那时
是
使
逐渐
从小
对应
甚么
如其
那样
孰料
或者
与其
归
它是
竟而
各个
贼死
然後
不外乎
沙沙
简直
考虑
次第
倍加
他们
大凡
那么些
几番
于是乎
今後
最後
当地
砰
难道说
更进一步
传说
临
单纯
怎么样
曾经
其它
当场
每天
从严
不消
那末
仍然
咦
看上去
不时
行动
属于
致
决不
据悉
一片
着
照
例如
从宽
尽然
转贴
全面
策略地
一旦
吓
起
这么些
何时
以故
另外
其一
应当
乘隙
莫若
倍感
究竟
後来
必定
如期
乘机
全然
从古到今
比方
此地
这点
可能
扑通
伟大
到目前为止
联袂
有
简而言之
而
已矣
亲手
乃
适当
归齐
立地
看样子
存在
成为
连日
岂止
进入
三番两次
几时
该当
那会儿
将才
哈
自从
给
略微
譬如
不一
皆可
连声
吧哒
可见
刚才
彻底
即刻
反过来
以外
则
它们的
尤其
庶乎
何止
非特
促进
从此
依靠
高兴
只要
引起
各人
以後
后来
在下
常言说得好
即
仍
来自
关于
不亦乐乎
挨门挨户
哪儿
准备
但愿
再次
莫不然
凭借
好的
替
二话没说
切莫
多么
奋勇
亲身
纵然
本身
喂
再者说
何苦
即便
一些
哎哟
这边
莫非
恰如
今
曾
要
川流不息
至
马上
大致
不妨
更加
哩
多少
不料
不特
一边
企图
除去
当儿
且说
方才
连日来
不足
依照
必将
由
刚巧
谁人
非徒
说明
彼
不下
漫说
心里
遵循
匆匆
得天独厚
遇到
另
不至于
结合
别的
恰恰相反
正在
什么
多多
着呢
怪不得
啊哟
那些
并非
尽心尽力
除此
迟早
云云
借以
由此
举凡
怎
当前
不仅仅
且
啊
允许
使用
自各儿
不曾
不如
旁人
把
成年累月
设使
何须
连
你的
随后
哪
以及
就此
于是
不大
本地
嗡
哪怕
陡然
分期分批
基本
从重
一时
彻夜
并无
不经意
另一方面
接着
基于
任凭
若夫
尽心竭力
不够
从来
倒不如
无
不得
按时
组成
到头来
特别是
双方
极大
尔尔
反倒是
纵令
说说
全部
时候
与其说
猛然
这一来
精光
不止
一直
不外
此
起初
虽则
的话
呗
到处
好在
全年
再其次
在
始而
怎样
呵呵
小
不得不
而且
当真
下
也好
极度
哗
因此
先生
这么点儿
却
愤然
和
各自
得
最大
我是
得到
举行
好
届时
即令
像
动辄
形成
主张
少数
哇
常言道
恍然
居然
分头
处处
要不然
任
本人
离
以期
倘或
率尔
急匆匆
恰恰
不少
哉
自己
等
只消
为此
总而言之
日臻
他人
一样
故此
行为
既往
如前所述
巨大
哟
鄙人
何况
到头
继后
不限
表明
路经
一一
结果
将
叫
除非
岂但
当
不常
使得
掌握
如常
别处
难道
有利
不知不觉
话说
据称
而况
凡
得了
决非
焉
全体
一来
反映
并
广大
然则
权时
也罢
再
本
根本
赶
所幸
乎
多年前
咱们
一定
啷当
既
甚至于
趁机
当中
防止
拦腰
唯有
任务
前者
此时
一切
已
此中
固然
不了
此次
而外
数/
及时
凡是
出于
彼时
矣哉
不仅
截然
其余
一则
接著
出现
相似
屡屡
限制
真是
突然
够瞧的
己
来讲
极其
大力
归根到底
呵
向
某某
哪里
借
来说
不敢
比照
近来
总的说来
难得
每逢
了解
部分
正值
还要
故
一致
能够
顷刻之间
从速
比如说
为什麽
尚且
豁然
八成
一.
运用
不起
往往
除此以外
后面
欢迎
迅速
勃然
尔
大抵
这些
不巧
严格
刚好
这种
本着
竟然
从而
其次
多多益善
以免
其他
从头
唉
倘使
不得已
罢了
而又
还有
为主
临到
她的
过来
这里
及
尽如人意
就
出来
即将
让
似乎
赶早不赶晚
不免
第二
顿时
直到
相等
当下
应用
如次
诚如
俺
忽地
她们
一般
多多少少
三天两头
起见
各种
只限
根据
这会儿
甚且
积极
不然的话
距
如今
个
好象
成心
合理
之
完全
嘛
之一
哼
练习
简言之
多
按期
还是
哗啦
恐怕
及至
大
啥
并不
独自
各
所以
用来
不力
可是
同
造成
宁肯
有关
与此同时
老老实实
谁料
按
极端
末##末
谁
凭
扩大
经过
叮咚
对比
觉得
欤
对待
每个
于
开外
慢说
倘若
或曰
嘿嘿
深入
遭到
对
孰知
啊哈
个别
据此
呼啦
顺
另悉
毕竟
敢于
移动
总结
多亏
将要
此处
如此
诸
嘻
似的
累次
趁势
哪样
先后
看到
一
各位
一何
其后
尽
比较
周围
若果
处理
尽快
大面儿上
再者
即若
局外
它们
联系
的确
或许
宁愿
朝着
所
呜
因而
比
通常
必须
愿意
那么
被
反之亦然
靠
眨眼
日见
借此
现代
当即
或则
先後
不过
来不及
默默地
间或
为了
产生
用
具体地说
从今以后
哪边
紧接着
毫无例外
复杂
经常
存心
哈哈
据说
从轻
若
便于
非但
非常
不若
背地里
而已
而论
才
嗳
即如
没奈何
按说
每每
立即
从新
地
普遍
丰富
处在
不定
知道
不尽然
是以
今年
您是
随时
如是
除
自个儿
怎么
毫不
那么样
需要
虽
及其
不管怎样
来得及
嗬
很
顶多
快要
极力
大大
不断
就是
挨门逐户
密切
绝顶
不会
巩固
屡次三番
不变
二来
乘
广泛
动不动
不已
自家
相应
就算
该
以便
不只
连袂
不满
一面
归根结底
相信
过于
的
咳
前后
二话不说
并没有
如上所述
说来
几乎
嗯
许多
获得
别人
每当
故而
无法
不问
理当
冲
普通
完成
还
不仅仅是
哦
否则
上升
们
後面
元/吨
喏
大批
但
总的来说
恰逢
随著
藉以
累年
即或
不然
不可
除开
开始
除此而外
迫于
尽早
何妨
每时每刻
综上所述
目前
昂然
相同
个人
同样
顺着
向着
今后
呆呆地
如同
下去
所在
依据
何
下列
前此
要不是
并且
或是
做到
立时
宁可
待
各式
基本上
或多或少
大不了
问题
宁
吧
绝非
换言之
按照
挨次
当时
极了
由是
适用
据
大体上
以上
继之
强烈
最近
争取
确定
进而
以至
尔后
比如
您
大约
每年
进行
她
断然
有些
只当
哪些
失去
而言
挨家挨户
几
风雨无阻
趁早
非得
保持
呸
犹自
当头
不比
彼此
若是
不独
腾
一转眼
并没
只怕
乘虚
尽管如此
一番
故意
赶快
后者
至于
切切
鉴于
什么样
重要
大家
人们
从此以后
其中
呼哧
喔唷
惯常
大多
既然
上
人家
阿
此后
所谓
单单
要不
哼唷
打从
若非
接下来
即是说
差不多
自
只有
到底
截至
第
巴
因了
到
除外
达到
换句话说
不能
理应
别
受到
避免
又
战斗
突出
略加
不论
安全
有及
甚或
无宁
看起来
那般
不择手段
才能
不管
理该
大都
呜呼
得起
相关文章:
自然语言处理 中文停用词词典
我整合了4个常用的中文停用词词典(https://gitcode.net/mirrors/goto456/stopwords/-/tree/master),剔除了其中的非中文词汇,得到停用词词典如下,可直接取用。 看见 并不是 有著 岂非 毫无保留地 这样 么 哎呀 互相 通…...
CocosCreator3.8研究笔记(十)CocosCreator 图像资源的理解
一、图像资源导入 Cocos Creator 可使用图像文件格式,支持 JPG、PNG、BMP、TGA、HDR、WEBBP、PSD、TIFF 等。 将图像资源直接拖拽到 资源管理器 即可将其导入 二、图像资源的类型 在 属性检查器 面板中便可根据需要设置图像资源的使用类型:raw 、 textu…...
计算机使用中常用截图与标注方法
一、截图常用方法 1.windows自带快捷键 Print Screen SysPq 截取全屏,可以粘到word文档中,可以粘贴到"画图"程序中,命名一个文件名,另存为图片,或.jpg后缀,或.png后缀 alt Print S…...
Elasticsearch,Logstash和Kibana安装部署(ELK Stack)
前言 当今数字化时代,信息的快速增长使得各类组织和企业面临着海量数据的处理和分析挑战。在这样的背景下,ELK Stack(Elasticsearch、Logstash 和 Kibana)作为一套强大的开源工具组合,成为了解决数据管理、搜索和可视…...
MATLAB中movmean函数用法
目录 语法 说明 示例 向量的中心移动平均值 向量的尾部移动平均值 矩阵的移动平均值 包含缺失值的向量的移动平均值 基于样本点计算移动平均值 仅返回满窗口平均值 movmean函数的功能是对数据进行移动求平均值。 语法 M movmean(A,k) M movmean(A,[kb kf]) M mov…...
IIS短文件名泄露漏洞复现
IIS短文件名泄露漏洞复现 前言一、漏洞描述二、漏洞原理1.什么是短文件2.短文件特征 三、漏洞验证三、漏洞防御总结 前言 IIS短文件名泄露漏洞比较老了,而且只适合于windowsiisasp的网络结构,所有如下的复现步骤看下就行了,关键是要弄懂原理…...
万字解读 Android 车机核心 :CarService 的构成和链路~
前言 关于 Android 车机,之前分析过方控上自定义按键的输入机制和中控上旋钮输入的原理,但都局限于 Car Service 内 Input 相关模块。 一文了解 Android 车机如何处理中控的旋钮输入从实体按键看 Android 车载的自定义事件机制 本文将结合 Android 系…...
C#使用Panel
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System...
Jabbi的Rust学习日记(一)
Rust环境安装 Windows:Install Rust - Rust Programming Language (rust-lang.org) 访问网页,下载64bit | 32bit 版本 下载完成后打开,直接enter即可 Linux:输入指令 curl https://sh.rustup.rs-sSf | sh 我会报错,好像是链接不到这个网址&a…...
电脑磁盘分区形式是什么?如何更改?
磁盘分区形式介绍 在了解为什么以及如何更改分区形式之前,让我们对磁盘分区形式有一个基本的了解。一般来说,分区形式是指主引导记录(MBR)和 GUID 分区表(GPT)。 MBR和GPT是Windows系统中常用…...
Outlook无需API开发连接钉钉群机器人,实现新增会议日程自动发送群消息通知
Outlook用户使用场景: 在企业中,会议和活动的顺利举行对于业务运转和团队协作至关重要。然而,计划的变动总是无法避免,这可能会导致其他人的计划受到影响,打乱原有的安排。为了解决这个问题,许多企业开始使…...
elasticsearch分析插件 安装analysis-ik
首先下载安装es 和 插件 ,注意 两者的版本要保持一致,如果要用到kibana 则三者保持一致 ik:https://github.com/medcl/elasticsearch-analysis-ik/releases es/kibana:https://www.elastic.co/cn/downloads/past-releases/ 然后在 es— elast…...
2023年股票大宗减持研究报告
第一章 股票大宗减持概述 1.1 概念 大宗减持是指通过大宗交易的方式进行减持,即达到规定的最低限额的证券单笔买卖申报,买卖双方经过协议达成一致并经交易所确定成交的证券交易,其中A股单笔交易数量在30万股(含)以上…...
VS编译.cu文件源文件无法打开matrix.h和mex.h问题
配置好cu和VS相关库文件后CUDA程序仍然报错:无法打开matrix.h和mex.h,解决办法: (1)这两个头文件是matlab中的,可能无法直接在VS中调用,可以通过添加外部依赖项的方法将matlab中的头文件的文件路…...
小bugs搜集和解决方法,亲测有效(2022-2023)
有些小bugs几行指令就能解决,写太多不好,这里就进行一个2022-2023这段时间的bugs collection和solution。 Deep Learning How to make really empty tensor? a nn.Torch([]) b torch.empty(2,3) for i in rang(3):a torch.cat(a, b, dim0)Mismatc…...
归并排序和快速排序的两种实现
在此之前我们已经介绍过归并排序和快速排序:浅谈归并排序与快速排序,但其中的实现都是基于递归的。本文将重新温故这两种算法并给出基于迭代的实现。 目录 1. 归并排序1.1 基于递归1.2 基于迭代 2. 快速排序2.1 基于递归2.2 基于迭代 1. 归并排序 1.1 基…...
C#,《小白学程序》第十四课:随机数(Random)第一,几种随机数的计算方法与代码
1 文本格式 /// <summary> /// 《小白学程序》第十四课:随机数(Random)第一,几种随机数的计算方法与代码 /// 本课初步接触一下随机数。 /// </summary> /// <param name"sender"></param> ///…...
[杂谈]-快速了解Modbus协议
快速了解Modbus协议 文章目录 快速了解Modbus协议1、为何 Modbus 如此受欢迎2、范围和数据速率3、逻辑电平4、层数5、网络与通讯6、数据帧格式7、数据类型8、服务器如何存储数据9、总结 Modbus 是一种流行的低速串行通信协议,广泛应用于自动化行业。 该协议由 Mo…...
WhatsApp的两个商业模式该如何选择
WhatsApp Business 是什么 目前 WhatsApp 提供两种商业模式,企业应根据自身需求选择相应版本。 第一个版本是 WhatsApp Business:初创企业只需一个手机应用程序,便可以个体单位与客户轻松互动; 另一个版本是 WhatsApp Business APIÿ…...
动态表单设计
动态表单设计 背景方案讨论基于上面分析,对比调研,自定义动态表单数据模型表单详解(一) 表单模板:jim_dynamic_form(二)表单数据类型:jim_form_data_type(三)…...
UE5 学习系列(二)用户操作界面及介绍
这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…...
C++初阶-list的底层
目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...
Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动
一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...
微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】
微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来,Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。 同样的技术也是 Power BI 数据…...
QMC5883L的驱动
简介 本篇文章的代码已经上传到了github上面,开源代码 作为一个电子罗盘模块,我们可以通过I2C从中获取偏航角yaw,相对于六轴陀螺仪的yaw,qmc5883l几乎不会零飘并且成本较低。 参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...
将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?
Otsu 是一种自动阈值化方法,用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理,能够自动确定一个阈值,将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...
JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作
一、上下文切换 即使单核CPU也可以进行多线程执行代码,CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短,所以CPU会不断地切换线程执行,从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...
OPenCV CUDA模块图像处理-----对图像执行 均值漂移滤波(Mean Shift Filtering)函数meanShiftFiltering()
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 在 GPU 上对图像执行 均值漂移滤波(Mean Shift Filtering),用于图像分割或平滑处理。 该函数将输入图像中的…...
IP如何挑?2025年海外专线IP如何购买?
你花了时间和预算买了IP,结果IP质量不佳,项目效率低下不说,还可能带来莫名的网络问题,是不是太闹心了?尤其是在面对海外专线IP时,到底怎么才能买到适合自己的呢?所以,挑IP绝对是个技…...
腾讯云V3签名
想要接入腾讯云的Api,必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口,但总是卡在签名这一步,最后放弃选择SDK,这次终于自己代码实现。 可能腾讯云翻新了接口文档,现在阅读起来,清晰了很多&…...
