自然语言处理 中文停用词词典
我整合了4个常用的中文停用词词典(https://gitcode.net/mirrors/goto456/stopwords/-/tree/master),剔除了其中的非中文词汇,得到停用词词典如下,可直接取用。
看见
并不是
有著
岂非
毫无保留地
这样
么
哎呀
互相
通过
偶尔
难怪
猛然间
以至于
各地
敢情
会
较为
共总
转变
相对
万一
比起
继续
再说
除了
余外
尽管
亲自
绝对
几度
呕
加上
谁知
各级
沿着
老是
那儿
由此可见
如
恰好
别说
范围
可好
当庭
格外
同一
实际
连同
为
弹指之间
上下
从优
一方面
差一点
今天
伙同
另行
大概
怎么办
照着
那里
其实
自后
中间
大张旗鼓
平素
不要
长话短说
俺们
怎奈
所有
你们
从事
碰巧
类如
转动
瑟瑟
至今
前进
只是
譬喻
纯粹
叫做
了
乌乎
经
因
日复一日
具有
他的
当口儿
拿
到了儿
最
构成
论
这
里面
这次
就是说
具体来说
如果
乃至于
逐步
般的
坚决
乘势
总的来看
从古至今
这么样
日益
较比
某个
可以
因着
以后
替代
偶而
嘿
同时
光是
介于
之后
呃
朝
非独
诚然
打开天窗说亮话
这个
其二
来
另方面
倘
相反
具体说来
近年来
略为
并排
接连不断
遵照
之所以
高低
尽可能
庶几
不光
达旦
顷刻间
公然
顷刻
良好
大量
难说
出去
内
咋
假若
虽说
维持
不同
沿
吗
大略
依
进步
不怎么
多次
必要
别是
对于
从未
只
加强
这麽
嘎嘎
莫不
从无到有
兼之
正常
千万千万
不可开交
屡次
最后
起来
多数
为止
此间
来着
云尔
并肩
帮助
从早到晚
都
以为
反应
那
最高
不必
倒是
何尝
有力
作为
已经
大多数
我的
望
纵
呢
抑或
为着
却不
就地
不久
不再
大举
何必
咧
矣
显著
敞开儿
有点
至若
注意
仍旧
反手
嘎登
巴巴
请勿
不胜
分别
咱
亦
方能
容易
这般
适应
将近
下面
恰似
我们
再有
看出
趁热
整个
看看
上来
就是了
几经
跟
多年来
是不是
傥然
倘然
果真
它的
当然
取道
往
取得
有的是
从不
即使
对方
向使
传闻
应该
偏偏
以前
从中
这时
些
来看
什麽
有着
如此等等
常常
前面
加以
其
清楚
怎麽
代替
忽然
不怕
起首
下来
以致
默然
牢牢
很少
进去
当着
长期以来
啊呀
一天
啦
她是
据实
然而
召开
充分
纵使
方面
率然
之类
全身心
十分
较
既是
趁
但凡
凝神
果然
又及
原来
此外
先不先
恰巧
这儿
具体
以来
重大
别管
特殊
特点
乃至
你
莫如
那个
不可抗拒
设若
哪个
近几年来
如下
嗡嗡
某些
起先
这就是说
反过来说
过
一则通过
您们
全力
隔日
充其极
左右
论说
继而
连连
满足
就要
没有
在于
过去
何以
挨个
明确
矣乎
后
不日
实现
待到
人
缕缕
任何
最好
况且
除此之外
诸如
上述
要求
立马
表示
甚而
但是
加之
中小
年复一年
有效
再则
认真
不单
尔等
反倒
全都
不是
他是
趁便
背靠背
嘎
毋宁
而是
由于
必然
轰然
暗自
不由得
两者
规定
那边
趁着
如何
倒不如说
从
是否
暗地里
抽冷子
冒
省得
变成
喽
为什么
呀
也
姑且
随着
它
虽然
真正
或
设或
去
人人
更为
立刻
假使
与否
管
以下
上面
交口
比及
自打
不对
上去
隔夜
与
重新
集中
充其量
赖以
之前
且不说
主要
另一个
决定
宣布
据我所知
相对而言
现在
附近
穷年累月
不得了
边
啪达
某
要是
共同
哎
要么
何乐而不为
诸位
有所
极为
能否
看
凑巧
那麽
明显
看来
加入
如若
严重
随
不迭
三番五次
不惟
等等
绝不
甚至
之後
甭
不尽
很多
专门
采取
进来
是的
日渐
者
无论
挨着
你是
则甚
等到
一个
种
为何
亲眼
认识
咚
总之
意思
起头
而后
儿
一次
不
可
一起
较之
不止一次
切不可
针对
正如
惟其
常言说
越是
暗中
也是
反之则
不成
吱
哪年
啐
嘘
不能不
然后
长此下去
自身
不但
相当
除却
坚持
有的
正巧
方便
因为
我
亲口
这么
直接
每
反而
也就是说
不拘
有时
假如
尽量
一下
认为
如上
总是
兮
毫无
切勿
何处
正是
按理
开展
能
强调
犹且
得出
哪天
显然
他
首先
反之
打
以
那时
是
使
逐渐
从小
对应
甚么
如其
那样
孰料
或者
与其
归
它是
竟而
各个
贼死
然後
不外乎
沙沙
简直
考虑
次第
倍加
他们
大凡
那么些
几番
于是乎
今後
最後
当地
砰
难道说
更进一步
传说
临
单纯
怎么样
曾经
其它
当场
每天
从严
不消
那末
仍然
咦
看上去
不时
行动
属于
致
决不
据悉
一片
着
照
例如
从宽
尽然
转贴
全面
策略地
一旦
吓
起
这么些
何时
以故
另外
其一
应当
乘隙
莫若
倍感
究竟
後来
必定
如期
乘机
全然
从古到今
比方
此地
这点
可能
扑通
伟大
到目前为止
联袂
有
简而言之
而
已矣
亲手
乃
适当
归齐
立地
看样子
存在
成为
连日
岂止
进入
三番两次
几时
该当
那会儿
将才
哈
自从
给
略微
譬如
不一
皆可
连声
吧哒
可见
刚才
彻底
即刻
反过来
以外
则
它们的
尤其
庶乎
何止
非特
促进
从此
依靠
高兴
只要
引起
各人
以後
后来
在下
常言说得好
即
仍
来自
关于
不亦乐乎
挨门挨户
哪儿
准备
但愿
再次
莫不然
凭借
好的
替
二话没说
切莫
多么
奋勇
亲身
纵然
本身
喂
再者说
何苦
即便
一些
哎哟
这边
莫非
恰如
今
曾
要
川流不息
至
马上
大致
不妨
更加
哩
多少
不料
不特
一边
企图
除去
当儿
且说
方才
连日来
不足
依照
必将
由
刚巧
谁人
非徒
说明
彼
不下
漫说
心里
遵循
匆匆
得天独厚
遇到
另
不至于
结合
别的
恰恰相反
正在
什么
多多
着呢
怪不得
啊哟
那些
并非
尽心尽力
除此
迟早
云云
借以
由此
举凡
怎
当前
不仅仅
且
啊
允许
使用
自各儿
不曾
不如
旁人
把
成年累月
设使
何须
连
你的
随后
哪
以及
就此
于是
不大
本地
嗡
哪怕
陡然
分期分批
基本
从重
一时
彻夜
并无
不经意
另一方面
接着
基于
任凭
若夫
尽心竭力
不够
从来
倒不如
无
不得
按时
组成
到头来
特别是
双方
极大
尔尔
反倒是
纵令
说说
全部
时候
与其说
猛然
这一来
精光
不止
一直
不外
此
起初
虽则
的话
呗
到处
好在
全年
再其次
在
始而
怎样
呵呵
小
不得不
而且
当真
下
也好
极度
哗
因此
先生
这么点儿
却
愤然
和
各自
得
最大
我是
得到
举行
好
届时
即令
像
动辄
形成
主张
少数
哇
常言道
恍然
居然
分头
处处
要不然
任
本人
离
以期
倘或
率尔
急匆匆
恰恰
不少
哉
自己
等
只消
为此
总而言之
日臻
他人
一样
故此
行为
既往
如前所述
巨大
哟
鄙人
何况
到头
继后
不限
表明
路经
一一
结果
将
叫
除非
岂但
当
不常
使得
掌握
如常
别处
难道
有利
不知不觉
话说
据称
而况
凡
得了
决非
焉
全体
一来
反映
并
广大
然则
权时
也罢
再
本
根本
赶
所幸
乎
多年前
咱们
一定
啷当
既
甚至于
趁机
当中
防止
拦腰
唯有
任务
前者
此时
一切
已
此中
固然
不了
此次
而外
数/
及时
凡是
出于
彼时
矣哉
不仅
截然
其余
一则
接著
出现
相似
屡屡
限制
真是
突然
够瞧的
己
来讲
极其
大力
归根到底
呵
向
某某
哪里
借
来说
不敢
比照
近来
总的说来
难得
每逢
了解
部分
正值
还要
故
一致
能够
顷刻之间
从速
比如说
为什麽
尚且
豁然
八成
一.
运用
不起
往往
除此以外
后面
欢迎
迅速
勃然
尔
大抵
这些
不巧
严格
刚好
这种
本着
竟然
从而
其次
多多益善
以免
其他
从头
唉
倘使
不得已
罢了
而又
还有
为主
临到
她的
过来
这里
及
尽如人意
就
出来
即将
让
似乎
赶早不赶晚
不免
第二
顿时
直到
相等
当下
应用
如次
诚如
俺
忽地
她们
一般
多多少少
三天两头
起见
各种
只限
根据
这会儿
甚且
积极
不然的话
距
如今
个
好象
成心
合理
之
完全
嘛
之一
哼
练习
简言之
多
按期
还是
哗啦
恐怕
及至
大
啥
并不
独自
各
所以
用来
不力
可是
同
造成
宁肯
有关
与此同时
老老实实
谁料
按
极端
末##末
谁
凭
扩大
经过
叮咚
对比
觉得
欤
对待
每个
于
开外
慢说
倘若
或曰
嘿嘿
深入
遭到
对
孰知
啊哈
个别
据此
呼啦
顺
另悉
毕竟
敢于
移动
总结
多亏
将要
此处
如此
诸
嘻
似的
累次
趁势
哪样
先后
看到
一
各位
一何
其后
尽
比较
周围
若果
处理
尽快
大面儿上
再者
即若
局外
它们
联系
的确
或许
宁愿
朝着
所
呜
因而
比
通常
必须
愿意
那么
被
反之亦然
靠
眨眼
日见
借此
现代
当即
或则
先後
不过
来不及
默默地
间或
为了
产生
用
具体地说
从今以后
哪边
紧接着
毫无例外
复杂
经常
存心
哈哈
据说
从轻
若
便于
非但
非常
不若
背地里
而已
而论
才
嗳
即如
没奈何
按说
每每
立即
从新
地
普遍
丰富
处在
不定
知道
不尽然
是以
今年
您是
随时
如是
除
自个儿
怎么
毫不
那么样
需要
虽
及其
不管怎样
来得及
嗬
很
顶多
快要
极力
大大
不断
就是
挨门逐户
密切
绝顶
不会
巩固
屡次三番
不变
二来
乘
广泛
动不动
不已
自家
相应
就算
该
以便
不只
连袂
不满
一面
归根结底
相信
过于
的
咳
前后
二话不说
并没有
如上所述
说来
几乎
嗯
许多
获得
别人
每当
故而
无法
不问
理当
冲
普通
完成
还
不仅仅是
哦
否则
上升
们
後面
元/吨
喏
大批
但
总的来说
恰逢
随著
藉以
累年
即或
不然
不可
除开
开始
除此而外
迫于
尽早
何妨
每时每刻
综上所述
目前
昂然
相同
个人
同样
顺着
向着
今后
呆呆地
如同
下去
所在
依据
何
下列
前此
要不是
并且
或是
做到
立时
宁可
待
各式
基本上
或多或少
大不了
问题
宁
吧
绝非
换言之
按照
挨次
当时
极了
由是
适用
据
大体上
以上
继之
强烈
最近
争取
确定
进而
以至
尔后
比如
您
大约
每年
进行
她
断然
有些
只当
哪些
失去
而言
挨家挨户
几
风雨无阻
趁早
非得
保持
呸
犹自
当头
不比
彼此
若是
不独
腾
一转眼
并没
只怕
乘虚
尽管如此
一番
故意
赶快
后者
至于
切切
鉴于
什么样
重要
大家
人们
从此以后
其中
呼哧
喔唷
惯常
大多
既然
上
人家
阿
此后
所谓
单单
要不
哼唷
打从
若非
接下来
即是说
差不多
自
只有
到底
截至
第
巴
因了
到
除外
达到
换句话说
不能
理应
别
受到
避免
又
战斗
突出
略加
不论
安全
有及
甚或
无宁
看起来
那般
不择手段
才能
不管
理该
大都
呜呼
得起
相关文章:
自然语言处理 中文停用词词典
我整合了4个常用的中文停用词词典(https://gitcode.net/mirrors/goto456/stopwords/-/tree/master),剔除了其中的非中文词汇,得到停用词词典如下,可直接取用。 看见 并不是 有著 岂非 毫无保留地 这样 么 哎呀 互相 通…...
CocosCreator3.8研究笔记(十)CocosCreator 图像资源的理解
一、图像资源导入 Cocos Creator 可使用图像文件格式,支持 JPG、PNG、BMP、TGA、HDR、WEBBP、PSD、TIFF 等。 将图像资源直接拖拽到 资源管理器 即可将其导入 二、图像资源的类型 在 属性检查器 面板中便可根据需要设置图像资源的使用类型:raw 、 textu…...
计算机使用中常用截图与标注方法
一、截图常用方法 1.windows自带快捷键 Print Screen SysPq 截取全屏,可以粘到word文档中,可以粘贴到"画图"程序中,命名一个文件名,另存为图片,或.jpg后缀,或.png后缀 alt Print S…...
Elasticsearch,Logstash和Kibana安装部署(ELK Stack)
前言 当今数字化时代,信息的快速增长使得各类组织和企业面临着海量数据的处理和分析挑战。在这样的背景下,ELK Stack(Elasticsearch、Logstash 和 Kibana)作为一套强大的开源工具组合,成为了解决数据管理、搜索和可视…...
MATLAB中movmean函数用法
目录 语法 说明 示例 向量的中心移动平均值 向量的尾部移动平均值 矩阵的移动平均值 包含缺失值的向量的移动平均值 基于样本点计算移动平均值 仅返回满窗口平均值 movmean函数的功能是对数据进行移动求平均值。 语法 M movmean(A,k) M movmean(A,[kb kf]) M mov…...
IIS短文件名泄露漏洞复现
IIS短文件名泄露漏洞复现 前言一、漏洞描述二、漏洞原理1.什么是短文件2.短文件特征 三、漏洞验证三、漏洞防御总结 前言 IIS短文件名泄露漏洞比较老了,而且只适合于windowsiisasp的网络结构,所有如下的复现步骤看下就行了,关键是要弄懂原理…...
万字解读 Android 车机核心 :CarService 的构成和链路~
前言 关于 Android 车机,之前分析过方控上自定义按键的输入机制和中控上旋钮输入的原理,但都局限于 Car Service 内 Input 相关模块。 一文了解 Android 车机如何处理中控的旋钮输入从实体按键看 Android 车载的自定义事件机制 本文将结合 Android 系…...
C#使用Panel
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System...
Jabbi的Rust学习日记(一)
Rust环境安装 Windows:Install Rust - Rust Programming Language (rust-lang.org) 访问网页,下载64bit | 32bit 版本 下载完成后打开,直接enter即可 Linux:输入指令 curl https://sh.rustup.rs-sSf | sh 我会报错,好像是链接不到这个网址&a…...
电脑磁盘分区形式是什么?如何更改?
磁盘分区形式介绍 在了解为什么以及如何更改分区形式之前,让我们对磁盘分区形式有一个基本的了解。一般来说,分区形式是指主引导记录(MBR)和 GUID 分区表(GPT)。 MBR和GPT是Windows系统中常用…...
Outlook无需API开发连接钉钉群机器人,实现新增会议日程自动发送群消息通知
Outlook用户使用场景: 在企业中,会议和活动的顺利举行对于业务运转和团队协作至关重要。然而,计划的变动总是无法避免,这可能会导致其他人的计划受到影响,打乱原有的安排。为了解决这个问题,许多企业开始使…...
elasticsearch分析插件 安装analysis-ik
首先下载安装es 和 插件 ,注意 两者的版本要保持一致,如果要用到kibana 则三者保持一致 ik:https://github.com/medcl/elasticsearch-analysis-ik/releases es/kibana:https://www.elastic.co/cn/downloads/past-releases/ 然后在 es— elast…...
2023年股票大宗减持研究报告
第一章 股票大宗减持概述 1.1 概念 大宗减持是指通过大宗交易的方式进行减持,即达到规定的最低限额的证券单笔买卖申报,买卖双方经过协议达成一致并经交易所确定成交的证券交易,其中A股单笔交易数量在30万股(含)以上…...
VS编译.cu文件源文件无法打开matrix.h和mex.h问题
配置好cu和VS相关库文件后CUDA程序仍然报错:无法打开matrix.h和mex.h,解决办法: (1)这两个头文件是matlab中的,可能无法直接在VS中调用,可以通过添加外部依赖项的方法将matlab中的头文件的文件路…...
小bugs搜集和解决方法,亲测有效(2022-2023)
有些小bugs几行指令就能解决,写太多不好,这里就进行一个2022-2023这段时间的bugs collection和solution。 Deep Learning How to make really empty tensor? a nn.Torch([]) b torch.empty(2,3) for i in rang(3):a torch.cat(a, b, dim0)Mismatc…...
归并排序和快速排序的两种实现
在此之前我们已经介绍过归并排序和快速排序:浅谈归并排序与快速排序,但其中的实现都是基于递归的。本文将重新温故这两种算法并给出基于迭代的实现。 目录 1. 归并排序1.1 基于递归1.2 基于迭代 2. 快速排序2.1 基于递归2.2 基于迭代 1. 归并排序 1.1 基…...
C#,《小白学程序》第十四课:随机数(Random)第一,几种随机数的计算方法与代码
1 文本格式 /// <summary> /// 《小白学程序》第十四课:随机数(Random)第一,几种随机数的计算方法与代码 /// 本课初步接触一下随机数。 /// </summary> /// <param name"sender"></param> ///…...
[杂谈]-快速了解Modbus协议
快速了解Modbus协议 文章目录 快速了解Modbus协议1、为何 Modbus 如此受欢迎2、范围和数据速率3、逻辑电平4、层数5、网络与通讯6、数据帧格式7、数据类型8、服务器如何存储数据9、总结 Modbus 是一种流行的低速串行通信协议,广泛应用于自动化行业。 该协议由 Mo…...
WhatsApp的两个商业模式该如何选择
WhatsApp Business 是什么 目前 WhatsApp 提供两种商业模式,企业应根据自身需求选择相应版本。 第一个版本是 WhatsApp Business:初创企业只需一个手机应用程序,便可以个体单位与客户轻松互动; 另一个版本是 WhatsApp Business APIÿ…...
动态表单设计
动态表单设计 背景方案讨论基于上面分析,对比调研,自定义动态表单数据模型表单详解(一) 表单模板:jim_dynamic_form(二)表单数据类型:jim_form_data_type(三)…...
如何在树莓派上用TinyProxy搭建轻量级HTTP代理(附性能优化技巧)
树莓派上部署TinyProxy的工程实践与深度调优指南 当你在咖啡厅用树莓派搭建的微型服务器调试物联网设备时,突然发现所有外网请求都需要经过代理——这就是TinyProxy在嵌入式场景下的典型应用。不同于x86服务器的部署,在ARM架构的树莓派上运行代理服务需要…...
幻兽帕鲁存档迁移完全手册:告别数据丢失的终极解决方案
幻兽帕鲁存档迁移完全手册:告别数据丢失的终极解决方案 【免费下载链接】palworld-host-save-fix 项目地址: https://gitcode.com/gh_mirrors/pa/palworld-host-save-fix 你是否曾在更换幻兽帕鲁服务器时,眼睁睁看着自己辛苦培养的角色数据消失无…...
即时通讯私有化,BeeWorks让每一次内网沟通都安全、安心、高效
BeeWorks以全维度安全防护体系为支撑,将安全设计深度融入每一项核心功能,让员工在日常办公中既能享受高效协同,又能全程守护企业核心数据安全。同时,规范的使用操作是发挥安全优势的关键,本文将重点介绍BeeWorks核心功…...
translategemma-4b-it快速入门:Ollama部署图文翻译模型,开箱即用
translategemma-4b-it快速入门:Ollama部署图文翻译模型,开箱即用 1. 认识translategemma-4b-it 1.1 什么是translategemma-4b-it translategemma-4b-it是Google基于Gemma 3架构开发的开源多模态翻译模型。与普通翻译工具不同,它不仅能处理…...
ALM扩展开发教程:如何为TypeScript IDE创建自定义插件
ALM扩展开发教程:如何为TypeScript IDE创建自定义插件 【免费下载链接】alm :rose: A :cloud: ready IDE just for TypeScript :heart: 项目地址: https://gitcode.com/gh_mirrors/al/alm ALM是一款专为TypeScript和JavaScript设计的云端IDE,为开…...
GraphSAGE实战:用PyTorch Geometric实现工业级节点分类(含邻居采样优化技巧)
GraphSAGE工业级实战:PyTorch Geometric实现与亿级节点优化指南 当电商平台的日活用户突破千万量级时,传统的用户行为预测模型开始显露出明显的局限性。静态的特征工程无法捕捉用户间复杂的交互关系,而基于全图计算的GNN方法又难以应对实时更…...
GPU算力高效利用:Pixel Language Portal在单卡多实例部署中的资源隔离与负载均衡教程
GPU算力高效利用:Pixel Language Portal在单卡多实例部署中的资源隔离与负载均衡教程 1. 引言:为什么需要单卡多实例部署 在AI应用开发中,GPU资源往往是稀缺且昂贵的。Pixel Language Portal作为一款基于Tencent Hunyuan-MT-7B的高端翻译工…...
鱼鱼刘怀旧手游|武林外传十年之约:同福灯火未熄,江湖老友归来
鱼鱼刘怀旧手游是国内人气老牌怀旧游戏专属平台,汇聚多款经典正版授权复刻手游,严格遵循端游原版设定匠心 1:1 还原复刻。本次特意为广大新手玩家准备了详细游戏攻略指南 ——岁月辗转,一晃十年。当年七侠镇的青石板还留着脚步,同…...
OpenClaw 入门完整教程:从零搭建自托管AI网关
OpenClaw入门到实战:自托管AI网关完整部署指南 作者:鲲鹏AI探索局 | 标签:OpenClaw, AI Agent, 自托管, 多平台聊天, 网关部署 摘要 本文详细介绍OpenClaw——一个开源自托管AI网关的安装、配置和实战部署全过程。通过实际案例演示如何连接T…...
PyTorch 2.8镜像高算力适配:10核CPU调度策略优化,避免I/O瓶颈拖慢训练
PyTorch 2.8镜像高算力适配:10核CPU调度策略优化,避免I/O瓶颈拖慢训练 1. 镜像核心优势与硬件适配 PyTorch 2.8深度学习镜像经过深度优化,专为高性能计算场景设计。这个环境最显著的特点是完美适配了10核CPU与RTX 4090D显卡的协同工作&…...
