自然语言处理 中文停用词词典
我整合了4个常用的中文停用词词典(https://gitcode.net/mirrors/goto456/stopwords/-/tree/master),剔除了其中的非中文词汇,得到停用词词典如下,可直接取用。
看见
并不是
有著
岂非
毫无保留地
这样
么
哎呀
互相
通过
偶尔
难怪
猛然间
以至于
各地
敢情
会
较为
共总
转变
相对
万一
比起
继续
再说
除了
余外
尽管
亲自
绝对
几度
呕
加上
谁知
各级
沿着
老是
那儿
由此可见
如
恰好
别说
范围
可好
当庭
格外
同一
实际
连同
为
弹指之间
上下
从优
一方面
差一点
今天
伙同
另行
大概
怎么办
照着
那里
其实
自后
中间
大张旗鼓
平素
不要
长话短说
俺们
怎奈
所有
你们
从事
碰巧
类如
转动
瑟瑟
至今
前进
只是
譬喻
纯粹
叫做
了
乌乎
经
因
日复一日
具有
他的
当口儿
拿
到了儿
最
构成
论
这
里面
这次
就是说
具体来说
如果
乃至于
逐步
般的
坚决
乘势
总的来看
从古至今
这么样
日益
较比
某个
可以
因着
以后
替代
偶而
嘿
同时
光是
介于
之后
呃
朝
非独
诚然
打开天窗说亮话
这个
其二
来
另方面
倘
相反
具体说来
近年来
略为
并排
接连不断
遵照
之所以
高低
尽可能
庶几
不光
达旦
顷刻间
公然
顷刻
良好
大量
难说
出去
内
咋
假若
虽说
维持
不同
沿
吗
大略
依
进步
不怎么
多次
必要
别是
对于
从未
只
加强
这麽
嘎嘎
莫不
从无到有
兼之
正常
千万千万
不可开交
屡次
最后
起来
多数
为止
此间
来着
云尔
并肩
帮助
从早到晚
都
以为
反应
那
最高
不必
倒是
何尝
有力
作为
已经
大多数
我的
望
纵
呢
抑或
为着
却不
就地
不久
不再
大举
何必
咧
矣
显著
敞开儿
有点
至若
注意
仍旧
反手
嘎登
巴巴
请勿
不胜
分别
咱
亦
方能
容易
这般
适应
将近
下面
恰似
我们
再有
看出
趁热
整个
看看
上来
就是了
几经
跟
多年来
是不是
傥然
倘然
果真
它的
当然
取道
往
取得
有的是
从不
即使
对方
向使
传闻
应该
偏偏
以前
从中
这时
些
来看
什麽
有着
如此等等
常常
前面
加以
其
清楚
怎麽
代替
忽然
不怕
起首
下来
以致
默然
牢牢
很少
进去
当着
长期以来
啊呀
一天
啦
她是
据实
然而
召开
充分
纵使
方面
率然
之类
全身心
十分
较
既是
趁
但凡
凝神
果然
又及
原来
此外
先不先
恰巧
这儿
具体
以来
重大
别管
特殊
特点
乃至
你
莫如
那个
不可抗拒
设若
哪个
近几年来
如下
嗡嗡
某些
起先
这就是说
反过来说
过
一则通过
您们
全力
隔日
充其极
左右
论说
继而
连连
满足
就要
没有
在于
过去
何以
挨个
明确
矣乎
后
不日
实现
待到
人
缕缕
任何
最好
况且
除此之外
诸如
上述
要求
立马
表示
甚而
但是
加之
中小
年复一年
有效
再则
认真
不单
尔等
反倒
全都
不是
他是
趁便
背靠背
嘎
毋宁
而是
由于
必然
轰然
暗自
不由得
两者
规定
那边
趁着
如何
倒不如说
从
是否
暗地里
抽冷子
冒
省得
变成
喽
为什么
呀
也
姑且
随着
它
虽然
真正
或
设或
去
人人
更为
立刻
假使
与否
管
以下
上面
交口
比及
自打
不对
上去
隔夜
与
重新
集中
充其量
赖以
之前
且不说
主要
另一个
决定
宣布
据我所知
相对而言
现在
附近
穷年累月
不得了
边
啪达
某
要是
共同
哎
要么
何乐而不为
诸位
有所
极为
能否
看
凑巧
那麽
明显
看来
加入
如若
严重
随
不迭
三番五次
不惟
等等
绝不
甚至
之後
甭
不尽
很多
专门
采取
进来
是的
日渐
者
无论
挨着
你是
则甚
等到
一个
种
为何
亲眼
认识
咚
总之
意思
起头
而后
儿
一次
不
可
一起
较之
不止一次
切不可
针对
正如
惟其
常言说
越是
暗中
也是
反之则
不成
吱
哪年
啐
嘘
不能不
然后
长此下去
自身
不但
相当
除却
坚持
有的
正巧
方便
因为
我
亲口
这么
直接
每
反而
也就是说
不拘
有时
假如
尽量
一下
认为
如上
总是
兮
毫无
切勿
何处
正是
按理
开展
能
强调
犹且
得出
哪天
显然
他
首先
反之
打
以
那时
是
使
逐渐
从小
对应
甚么
如其
那样
孰料
或者
与其
归
它是
竟而
各个
贼死
然後
不外乎
沙沙
简直
考虑
次第
倍加
他们
大凡
那么些
几番
于是乎
今後
最後
当地
砰
难道说
更进一步
传说
临
单纯
怎么样
曾经
其它
当场
每天
从严
不消
那末
仍然
咦
看上去
不时
行动
属于
致
决不
据悉
一片
着
照
例如
从宽
尽然
转贴
全面
策略地
一旦
吓
起
这么些
何时
以故
另外
其一
应当
乘隙
莫若
倍感
究竟
後来
必定
如期
乘机
全然
从古到今
比方
此地
这点
可能
扑通
伟大
到目前为止
联袂
有
简而言之
而
已矣
亲手
乃
适当
归齐
立地
看样子
存在
成为
连日
岂止
进入
三番两次
几时
该当
那会儿
将才
哈
自从
给
略微
譬如
不一
皆可
连声
吧哒
可见
刚才
彻底
即刻
反过来
以外
则
它们的
尤其
庶乎
何止
非特
促进
从此
依靠
高兴
只要
引起
各人
以後
后来
在下
常言说得好
即
仍
来自
关于
不亦乐乎
挨门挨户
哪儿
准备
但愿
再次
莫不然
凭借
好的
替
二话没说
切莫
多么
奋勇
亲身
纵然
本身
喂
再者说
何苦
即便
一些
哎哟
这边
莫非
恰如
今
曾
要
川流不息
至
马上
大致
不妨
更加
哩
多少
不料
不特
一边
企图
除去
当儿
且说
方才
连日来
不足
依照
必将
由
刚巧
谁人
非徒
说明
彼
不下
漫说
心里
遵循
匆匆
得天独厚
遇到
另
不至于
结合
别的
恰恰相反
正在
什么
多多
着呢
怪不得
啊哟
那些
并非
尽心尽力
除此
迟早
云云
借以
由此
举凡
怎
当前
不仅仅
且
啊
允许
使用
自各儿
不曾
不如
旁人
把
成年累月
设使
何须
连
你的
随后
哪
以及
就此
于是
不大
本地
嗡
哪怕
陡然
分期分批
基本
从重
一时
彻夜
并无
不经意
另一方面
接着
基于
任凭
若夫
尽心竭力
不够
从来
倒不如
无
不得
按时
组成
到头来
特别是
双方
极大
尔尔
反倒是
纵令
说说
全部
时候
与其说
猛然
这一来
精光
不止
一直
不外
此
起初
虽则
的话
呗
到处
好在
全年
再其次
在
始而
怎样
呵呵
小
不得不
而且
当真
下
也好
极度
哗
因此
先生
这么点儿
却
愤然
和
各自
得
最大
我是
得到
举行
好
届时
即令
像
动辄
形成
主张
少数
哇
常言道
恍然
居然
分头
处处
要不然
任
本人
离
以期
倘或
率尔
急匆匆
恰恰
不少
哉
自己
等
只消
为此
总而言之
日臻
他人
一样
故此
行为
既往
如前所述
巨大
哟
鄙人
何况
到头
继后
不限
表明
路经
一一
结果
将
叫
除非
岂但
当
不常
使得
掌握
如常
别处
难道
有利
不知不觉
话说
据称
而况
凡
得了
决非
焉
全体
一来
反映
并
广大
然则
权时
也罢
再
本
根本
赶
所幸
乎
多年前
咱们
一定
啷当
既
甚至于
趁机
当中
防止
拦腰
唯有
任务
前者
此时
一切
已
此中
固然
不了
此次
而外
数/
及时
凡是
出于
彼时
矣哉
不仅
截然
其余
一则
接著
出现
相似
屡屡
限制
真是
突然
够瞧的
己
来讲
极其
大力
归根到底
呵
向
某某
哪里
借
来说
不敢
比照
近来
总的说来
难得
每逢
了解
部分
正值
还要
故
一致
能够
顷刻之间
从速
比如说
为什麽
尚且
豁然
八成
一.
运用
不起
往往
除此以外
后面
欢迎
迅速
勃然
尔
大抵
这些
不巧
严格
刚好
这种
本着
竟然
从而
其次
多多益善
以免
其他
从头
唉
倘使
不得已
罢了
而又
还有
为主
临到
她的
过来
这里
及
尽如人意
就
出来
即将
让
似乎
赶早不赶晚
不免
第二
顿时
直到
相等
当下
应用
如次
诚如
俺
忽地
她们
一般
多多少少
三天两头
起见
各种
只限
根据
这会儿
甚且
积极
不然的话
距
如今
个
好象
成心
合理
之
完全
嘛
之一
哼
练习
简言之
多
按期
还是
哗啦
恐怕
及至
大
啥
并不
独自
各
所以
用来
不力
可是
同
造成
宁肯
有关
与此同时
老老实实
谁料
按
极端
末##末
谁
凭
扩大
经过
叮咚
对比
觉得
欤
对待
每个
于
开外
慢说
倘若
或曰
嘿嘿
深入
遭到
对
孰知
啊哈
个别
据此
呼啦
顺
另悉
毕竟
敢于
移动
总结
多亏
将要
此处
如此
诸
嘻
似的
累次
趁势
哪样
先后
看到
一
各位
一何
其后
尽
比较
周围
若果
处理
尽快
大面儿上
再者
即若
局外
它们
联系
的确
或许
宁愿
朝着
所
呜
因而
比
通常
必须
愿意
那么
被
反之亦然
靠
眨眼
日见
借此
现代
当即
或则
先後
不过
来不及
默默地
间或
为了
产生
用
具体地说
从今以后
哪边
紧接着
毫无例外
复杂
经常
存心
哈哈
据说
从轻
若
便于
非但
非常
不若
背地里
而已
而论
才
嗳
即如
没奈何
按说
每每
立即
从新
地
普遍
丰富
处在
不定
知道
不尽然
是以
今年
您是
随时
如是
除
自个儿
怎么
毫不
那么样
需要
虽
及其
不管怎样
来得及
嗬
很
顶多
快要
极力
大大
不断
就是
挨门逐户
密切
绝顶
不会
巩固
屡次三番
不变
二来
乘
广泛
动不动
不已
自家
相应
就算
该
以便
不只
连袂
不满
一面
归根结底
相信
过于
的
咳
前后
二话不说
并没有
如上所述
说来
几乎
嗯
许多
获得
别人
每当
故而
无法
不问
理当
冲
普通
完成
还
不仅仅是
哦
否则
上升
们
後面
元/吨
喏
大批
但
总的来说
恰逢
随著
藉以
累年
即或
不然
不可
除开
开始
除此而外
迫于
尽早
何妨
每时每刻
综上所述
目前
昂然
相同
个人
同样
顺着
向着
今后
呆呆地
如同
下去
所在
依据
何
下列
前此
要不是
并且
或是
做到
立时
宁可
待
各式
基本上
或多或少
大不了
问题
宁
吧
绝非
换言之
按照
挨次
当时
极了
由是
适用
据
大体上
以上
继之
强烈
最近
争取
确定
进而
以至
尔后
比如
您
大约
每年
进行
她
断然
有些
只当
哪些
失去
而言
挨家挨户
几
风雨无阻
趁早
非得
保持
呸
犹自
当头
不比
彼此
若是
不独
腾
一转眼
并没
只怕
乘虚
尽管如此
一番
故意
赶快
后者
至于
切切
鉴于
什么样
重要
大家
人们
从此以后
其中
呼哧
喔唷
惯常
大多
既然
上
人家
阿
此后
所谓
单单
要不
哼唷
打从
若非
接下来
即是说
差不多
自
只有
到底
截至
第
巴
因了
到
除外
达到
换句话说
不能
理应
别
受到
避免
又
战斗
突出
略加
不论
安全
有及
甚或
无宁
看起来
那般
不择手段
才能
不管
理该
大都
呜呼
得起
相关文章:
自然语言处理 中文停用词词典
我整合了4个常用的中文停用词词典(https://gitcode.net/mirrors/goto456/stopwords/-/tree/master),剔除了其中的非中文词汇,得到停用词词典如下,可直接取用。 看见 并不是 有著 岂非 毫无保留地 这样 么 哎呀 互相 通…...

CocosCreator3.8研究笔记(十)CocosCreator 图像资源的理解
一、图像资源导入 Cocos Creator 可使用图像文件格式,支持 JPG、PNG、BMP、TGA、HDR、WEBBP、PSD、TIFF 等。 将图像资源直接拖拽到 资源管理器 即可将其导入 二、图像资源的类型 在 属性检查器 面板中便可根据需要设置图像资源的使用类型:raw 、 textu…...

计算机使用中常用截图与标注方法
一、截图常用方法 1.windows自带快捷键 Print Screen SysPq 截取全屏,可以粘到word文档中,可以粘贴到"画图"程序中,命名一个文件名,另存为图片,或.jpg后缀,或.png后缀 alt Print S…...

Elasticsearch,Logstash和Kibana安装部署(ELK Stack)
前言 当今数字化时代,信息的快速增长使得各类组织和企业面临着海量数据的处理和分析挑战。在这样的背景下,ELK Stack(Elasticsearch、Logstash 和 Kibana)作为一套强大的开源工具组合,成为了解决数据管理、搜索和可视…...

MATLAB中movmean函数用法
目录 语法 说明 示例 向量的中心移动平均值 向量的尾部移动平均值 矩阵的移动平均值 包含缺失值的向量的移动平均值 基于样本点计算移动平均值 仅返回满窗口平均值 movmean函数的功能是对数据进行移动求平均值。 语法 M movmean(A,k) M movmean(A,[kb kf]) M mov…...

IIS短文件名泄露漏洞复现
IIS短文件名泄露漏洞复现 前言一、漏洞描述二、漏洞原理1.什么是短文件2.短文件特征 三、漏洞验证三、漏洞防御总结 前言 IIS短文件名泄露漏洞比较老了,而且只适合于windowsiisasp的网络结构,所有如下的复现步骤看下就行了,关键是要弄懂原理…...

万字解读 Android 车机核心 :CarService 的构成和链路~
前言 关于 Android 车机,之前分析过方控上自定义按键的输入机制和中控上旋钮输入的原理,但都局限于 Car Service 内 Input 相关模块。 一文了解 Android 车机如何处理中控的旋钮输入从实体按键看 Android 车载的自定义事件机制 本文将结合 Android 系…...
C#使用Panel
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System...
Jabbi的Rust学习日记(一)
Rust环境安装 Windows:Install Rust - Rust Programming Language (rust-lang.org) 访问网页,下载64bit | 32bit 版本 下载完成后打开,直接enter即可 Linux:输入指令 curl https://sh.rustup.rs-sSf | sh 我会报错,好像是链接不到这个网址&a…...

电脑磁盘分区形式是什么?如何更改?
磁盘分区形式介绍 在了解为什么以及如何更改分区形式之前,让我们对磁盘分区形式有一个基本的了解。一般来说,分区形式是指主引导记录(MBR)和 GUID 分区表(GPT)。 MBR和GPT是Windows系统中常用…...

Outlook无需API开发连接钉钉群机器人,实现新增会议日程自动发送群消息通知
Outlook用户使用场景: 在企业中,会议和活动的顺利举行对于业务运转和团队协作至关重要。然而,计划的变动总是无法避免,这可能会导致其他人的计划受到影响,打乱原有的安排。为了解决这个问题,许多企业开始使…...

elasticsearch分析插件 安装analysis-ik
首先下载安装es 和 插件 ,注意 两者的版本要保持一致,如果要用到kibana 则三者保持一致 ik:https://github.com/medcl/elasticsearch-analysis-ik/releases es/kibana:https://www.elastic.co/cn/downloads/past-releases/ 然后在 es— elast…...

2023年股票大宗减持研究报告
第一章 股票大宗减持概述 1.1 概念 大宗减持是指通过大宗交易的方式进行减持,即达到规定的最低限额的证券单笔买卖申报,买卖双方经过协议达成一致并经交易所确定成交的证券交易,其中A股单笔交易数量在30万股(含)以上…...

VS编译.cu文件源文件无法打开matrix.h和mex.h问题
配置好cu和VS相关库文件后CUDA程序仍然报错:无法打开matrix.h和mex.h,解决办法: (1)这两个头文件是matlab中的,可能无法直接在VS中调用,可以通过添加外部依赖项的方法将matlab中的头文件的文件路…...
小bugs搜集和解决方法,亲测有效(2022-2023)
有些小bugs几行指令就能解决,写太多不好,这里就进行一个2022-2023这段时间的bugs collection和solution。 Deep Learning How to make really empty tensor? a nn.Torch([]) b torch.empty(2,3) for i in rang(3):a torch.cat(a, b, dim0)Mismatc…...

归并排序和快速排序的两种实现
在此之前我们已经介绍过归并排序和快速排序:浅谈归并排序与快速排序,但其中的实现都是基于递归的。本文将重新温故这两种算法并给出基于迭代的实现。 目录 1. 归并排序1.1 基于递归1.2 基于迭代 2. 快速排序2.1 基于递归2.2 基于迭代 1. 归并排序 1.1 基…...

C#,《小白学程序》第十四课:随机数(Random)第一,几种随机数的计算方法与代码
1 文本格式 /// <summary> /// 《小白学程序》第十四课:随机数(Random)第一,几种随机数的计算方法与代码 /// 本课初步接触一下随机数。 /// </summary> /// <param name"sender"></param> ///…...

[杂谈]-快速了解Modbus协议
快速了解Modbus协议 文章目录 快速了解Modbus协议1、为何 Modbus 如此受欢迎2、范围和数据速率3、逻辑电平4、层数5、网络与通讯6、数据帧格式7、数据类型8、服务器如何存储数据9、总结 Modbus 是一种流行的低速串行通信协议,广泛应用于自动化行业。 该协议由 Mo…...

WhatsApp的两个商业模式该如何选择
WhatsApp Business 是什么 目前 WhatsApp 提供两种商业模式,企业应根据自身需求选择相应版本。 第一个版本是 WhatsApp Business:初创企业只需一个手机应用程序,便可以个体单位与客户轻松互动; 另一个版本是 WhatsApp Business APIÿ…...

动态表单设计
动态表单设计 背景方案讨论基于上面分析,对比调研,自定义动态表单数据模型表单详解(一) 表单模板:jim_dynamic_form(二)表单数据类型:jim_form_data_type(三)…...
【算法训练营Day07】字符串part1
文章目录 反转字符串反转字符串II替换数字 反转字符串 题目链接:344. 反转字符串 双指针法,两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

C# 类和继承(抽象类)
抽象类 抽象类是指设计为被继承的类。抽象类只能被用作其他类的基类。 不能创建抽象类的实例。抽象类使用abstract修饰符声明。 抽象类可以包含抽象成员或普通的非抽象成员。抽象类的成员可以是抽象成员和普通带 实现的成员的任意组合。抽象类自己可以派生自另一个抽象类。例…...
相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...
JDK 17 新特性
#JDK 17 新特性 /**************** 文本块 *****************/ python/scala中早就支持,不稀奇 String json “”" { “name”: “Java”, “version”: 17 } “”"; /**************** Switch 语句 -> 表达式 *****************/ 挺好的ÿ…...
LRU 缓存机制详解与实现(Java版) + 力扣解决
📌 LRU 缓存机制详解与实现(Java版) 一、📖 问题背景 在日常开发中,我们经常会使用 缓存(Cache) 来提升性能。但由于内存有限,缓存不可能无限增长,于是需要策略决定&am…...

破解路内监管盲区:免布线低位视频桩重塑停车管理新标准
城市路内停车管理常因行道树遮挡、高位设备盲区等问题,导致车牌识别率低、逃费率高,传统模式在复杂路段束手无策。免布线低位视频桩凭借超低视角部署与智能算法,正成为破局关键。该设备安装于车位侧方0.5-0.7米高度,直接规避树枝遮…...
【实施指南】Android客户端HTTPS双向认证实施指南
🔐 一、所需准备材料 证书文件(6类核心文件) 类型 格式 作用 Android端要求 CA根证书 .crt/.pem 验证服务器/客户端证书合法性 需预置到Android信任库 服务器证书 .crt 服务器身份证明 客户端需持有以验证服务器 客户端证书 .crt 客户端身份…...
【深尚想】TPS54618CQRTERQ1汽车级同步降压转换器电源芯片全面解析
1. 元器件定义与技术特点 TPS54618CQRTERQ1 是德州仪器(TI)推出的一款 汽车级同步降压转换器(DC-DC开关稳压器),属于高性能电源管理芯片。核心特性包括: 输入电压范围:2.95V–6V,输…...

2025-05-08-deepseek本地化部署
title: 2025-05-08-deepseek 本地化部署 tags: 深度学习 程序开发 2025-05-08-deepseek 本地化部署 参考博客 本地部署 DeepSeek:小白也能轻松搞定! 如何给本地部署的 DeepSeek 投喂数据,让他更懂你 [实验目的]:理解系统架构与原…...

Python异步编程:深入理解协程的原理与实践指南
💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 持续学习,不断…...