C# 使用PanGu分词
写在前面
这是官方介绍:盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。
盘古分词组件需要配合其字典文件使用,该组件提供了多重输出解决分词粒度和分词精度权衡的问题,可配合Lucene.net一起使用实现精准的全文检索功能。还支持中文词性的识别,当然也支持英文分割。
可通过NuGet获取组件

代码实现
using PanGu;
public static class SplitWordMgr{/// <summary>/// 分词/// </summary>public static List<string> SplitContent(string word){var seg = new Segment();ICollection<WordInfo> splitWords = seg.DoSegment(word);var words = new List<string>();for (int i = 0; i < splitWords.Count; i++){words.Add(splitWords.ElementAt(i).Word);}return words;}}
资源及说明
链接:https://pan.baidu.com/s/1zTHOX5ioTPxQEO2CEhfXlg
提取码:llos
请将资源压缩包里的Dictionaries文件夹改名为Dict后,复制到项目的bin目录下。

相关文章:
C# 使用PanGu分词
写在前面 这是官方介绍:盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。 盘古分词组件需要配合其字典文件使用&am…...
Termius 一款优秀的跨平台 SSH 客户端工具
🔥🔥🔥 作为程序员或者运维管理人员,我们经常需要使用终端工具来进行服务器管理及各种操作,比如部署项目、调试代码、查看/优化服务、管理服务器等。 而实现远程服务器连接需要借助 SSH 协议来进行,SSH&am…...
生命科学领域 - 新药从研发到上市全流程
新药是指新研制的、临床尚未应用的药物,其化学本质应为新的化合物或称新化学实体、 新 分子实体、新活性实体。新药研发的根本目的是治疗疑难危重疾病,研制出来的药物即使是全新的化学结构,但是疗效或安全性却不及现有的药物便失去新药价值&a…...
血的教训------入侵redis之利用python来破解redis密码
血的教训------入侵redis之利用python来破解redis密码 利用强大的python来进行redis的密码破解,过程不亦乐乎,当然也可以用shell脚本 本篇文章只供学习交流,请勿他用,谢谢。 其他相关联的文章 [1]VMware安装部署kail镜像服务器【…...
yolov8-pose 推理流程
目录 一、关键点预测 二、图像预处理 二、推理 三、后处理与可视化 3.1、后处理 3.2、特征点可视化 四、完整pytorch代码 yolov8-pose tensorrt 一、关键点预测 注:本篇只是阐述推理流程,tensorrt实现后续跟进。 yolov8-pose的tensorrt部署代码…...
笔记十七、认识React的路由插件react-router-dom和基本使用
react-router 分类 web使用 react-router-dom native使用 react-router-native anywhere(使用麻烦) react-router 安装 yarn add react-router-dom main.jsx import React from "react"; import ReactDOM from "react-dom/client"…...
CleanMyMac X4.14.5Crack最新Mac电脑清理优化最佳应用
CleanMyMac X 4.14.5是用于清理和优化Mac的最佳应用程序和强大工具。它看起来很棒而且很容易理解。该软件可以清理、保护、优化、稳定和维护您的 Mac 系统。您可以立即删除不必要的、不寻常的、无用的垃圾文件、损坏的文件垃圾,并释放大量内存空间。此外,…...
Linux shell单双引号区别
shell单双引号区别: Shell脚本中很多时候都在用单引号或双引号来框住字符串,但是他们之间是存在区别的 避免踩坑记录… 单引号 单引号中的任何字符都没有特殊含义,即一些转义字符,$ 变量引用都会无效,它只把他们当作一个单纯的…...
ES 8.x开始(docker-compose安装、kibana使用、java操作)
学习文档地址 一、Docker安装 这里使用docker-compose来安装,方便后续迁移,Elasticserach和kibina一起安装。 1、创建安装目录 configdataplugins 2、配置文件 配置文件有两个,一个是ES的配置文件,一个docker-compose的配置文件 …...
有了倾斜摄影,如何搭建一座智慧城市?
随着无人机航测、倾斜摄影等全新一代测绘信息技术方法的发展,可以迅速搜集制作精细化的城市三维模型,搭建城市地理信息基础服务架构。 近期都在重点关注的“智慧城市”究竟是什么,有什么重大作用,同时又面临着什么难关,…...
设计测试用例的具体方法总结
📑打牌 : da pai ge的个人主页 🌤️个人专栏 : da pai ge的博客专栏 ☁️白马沉河共歃誓,怒涛没城亦不悔 ☁️基于需求进行测试用例的设计 基…...
计算机毕业设计|基于SpringBoot+MyBatis框架的仿天猫商城购物系统设计与实现
计算机毕业设计|基于SpringBootMyBatis框架的仿天猫商城购物系统设计与实现 迷你仿天猫商城是一个基于SSM框架的综合性B2C电商平台,需求设计主要参考天猫商城的购物流程:用户从注册开始,到完成登录,浏览商品,加入购物…...
JAXB的XmlValue注解
XmlValue注解用在Java属性、或者方法上。它可以使得映射到XML Schema中的Java类具有一个simpleContent 或者simpleType。 一个Java类中最多只能有一个属性被XmlValue注解。 如果被XmlValue注解的JavaBean属性是Java类中唯一映射到XML的成员,那么该Java类将会被映射…...
Git版本管理(05) git仓库迁移(保留原来记录分支体系)
说明:本文主要是一次git迁移仓库的实战记录。 1 迁移前的准备 仓库迁移前,需要将所有有必要的分支checkout到本地(想要转移到新仓库的分支就都 checkout一遍),接下来将old仓库从远程仓库克隆到本地: $git…...
科技与教育:未来教育的新趋势
在21世纪,科技的快速发展正在深刻地改变教育行业。从在线学习平台到虚拟现实教室,科技为教育带来了革命性的变化。本文将探讨科技如何影响现代教育,并预测未来教育的发展趋势。 一、科技在教育中的应用 在线学习平台:通过平台如C…...
E云管家微信群聊机器人开发
请求URL: http://域名地址/modifyGroupRemark 请求方式: POST 请求头Headers: Content-Type:application/jsonAuthorization:login接口返回 参数: 参数名必选类型说明wId是String登录实例标识chatRo…...
CVE-2023-27524:Apache Superset未授权访问漏洞复现
文章目录 Apache Superset 未授权访问漏洞(CVE-2023-27524)复现0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.漏洞复现 0x06 修复建议 Apache Superset 未授权访问漏洞(CVE-2023-27524)复现 0x01 前言 免责声明:请勿利用文…...
机器学习——多元线性回归升维
机器学习升维 升维使用sklearn库实现特征升维实现天猫年度销量预测实现中国人寿保险预测 升维 定义:将原始的数据表示从低维空间映射到高维空间。在线性回归中,升维通常是通过引入额外的特征来实现的,目的是为了更好地捕捉数据的复杂性&#…...
[C/C++]用堆实现TopK算法
一:引入 思考一个问题: 怎么在100个数中找到前10个最大的数? way1: 相信大多数人想到的方法是先把100个数放到数组中从大到小排序,再打印前10个数 way2: 前一文中我们讲了堆结构,那么就可以把这100个数建为大堆,再依次pop10次 这种方法虽然再这个问题下可行,但是如果是再1亿…...
3D点云目标检测:VoxelNex解读(带源码/未完)
VoxelNext 通用vsVoxelNext一、3D稀疏卷积模块1.1、额外的两次下采样1.2、稀疏体素删减 二、高度压缩三、稀疏池化四、head五、waymo数据集训练六、训练自己的数据集bug修改 通用vsVoxelNext 一、3D稀疏卷积模块 1.1、额外的两次下采样 使用通用的3D sparse conv,…...
AI摄影师助手:OpenClaw调用Qwen3-32B自动筛选与修图
AI摄影师助手:OpenClaw调用Qwen3-32B自动筛选与修图 1. 从手动修图到AI助手的转变 作为一名摄影爱好者,我经常面临一个令人头疼的问题:每次拍摄结束后,相机里堆积如山的RAW文件需要花费大量时间筛选和后期处理。直到上个月&…...
保姆级教程:在绿联NAS的Docker里部署PaddleOCR,打造本地私有化文字识别服务
绿联NASDockerPaddleOCR:三步构建家庭级隐私文字识别中心 想象一下这样的场景:周末整理书房时,你翻出一叠泛黄的老照片和手写笔记,想将它们数字化保存却又担心上传到云端OCR服务会泄露家庭隐私;或是收到一份重要合同需…...
【面板数据】地级市及区县人口空心化数据(2000-2024年)
人口空心化是指在城镇化和人口迁移过程中,区域青壮年劳动力及常住人口持续外流,导致人口规模收缩、人口老龄化加深、人口空间集聚能力下降和社会经济活力减弱的现象 参照陈义勇等(2025)文中关于人口空心化指标的衡量方式…...
DEBUG_UNIVERSAL:mbed OS轻量级协议无关调试框架
1. DEBUG_UNIVERSAL:面向mbed兼容微控制器的通用调试工具深度解析DEBUG_UNIVERSAL并非一个独立的商业调试器硬件,而是一个专为mbed OS生态设计的轻量级、可裁剪、协议无关的固件级调试框架。其核心价值在于将传统上依赖专用JTAG/SWD调试器(如…...
ESP32 PSRAM容器库:STL容器外扩至外部伪静态RAM
1. PSRAM Containers 项目概述PSRAM Containers 是一个面向 ESP32 平台的嵌入式 C 内存容器库,其核心目标是将标准 STL 容器(如std::vector、std::deque、std::list、std::map等)的功能完整迁移至外部伪静态 RAM(Pseudo-Static RA…...
DSI3协议四大模式(CRM/PDCM/BDM/DM)全解析:从汽车胎压监测到电池管理,看它如何工作
DSI3协议四大模式深度解析:从胎压监测到电池管理的实战应用 汽车电子系统正经历着从分布式架构向集中式控制的转型,而DSI3(Distributed System Interface 3)协议凭借其独特的单线通信设计,正在成为连接各类车载传感器的…...
前端必懂:开发环境、构建打包的核心差异,新手再也不踩坑
前端必懂:开发环境、构建打包的核心差异,新手再也不踩坑 文章目录前端必懂:开发环境、构建打包的核心差异,新手再也不踩坑一、先一句话打通核心逻辑(新手必记)二、开发环境:怎么舒服怎么写&…...
基于Yolov5的钢轨表面缺陷检测:数据集与含训练好的模型
基于yolov5的钢轨表面缺陷检测 数据集含训练好的模型一、项目概述 本项目基于YOLOv5 7.0版本构建,专注于钢轨表面缺陷检测任务,提供了完整的模型训练、推理、导出及性能评估工具链。项目包含47个核心文件,涵盖数据加载、模型构建、训练优化、…...
如何高效构建Steam游戏DRM解除自动化解决方案:开源框架技术实现
如何高效构建Steam游戏DRM解除自动化解决方案:开源框架技术实现 【免费下载链接】Steam-auto-crack Steam Game Automatic Cracker 项目地址: https://gitcode.com/gh_mirrors/st/Steam-auto-crack Steam游戏DRM解除自动化解决方案为技术爱好者提供了一套完整…...
光学工程师进阶指南:从入门到精通的实战路径
1. 光学工程师的职业发展路径 光学工程师的成长就像搭积木,需要从最基础的模块开始,一层层往上搭建。我刚入行时也走过不少弯路,后来才明白这个职业的发展是有明确路径的。一般来说,我们可以把成长过程分为三个阶段:初…...
