windows在conda下安装nlpia库
最近在学习《自然语言处理实战》这本书,书中用了其自己的库nlpia,我一直装不上,网上也找不到教程遂放弃,看到现在第四章没办法了,需要用到库里的一些文本语料,又折腾了一天,终于装好了,记录一下。
github:https://github.com/totalgood/nlpia
首先可以尝试照着github上官方的教程来装,不过最后基本上装不上,因为会有各种版本的包冲突,下面讲我的安装流程:
前提条件:
Anaconda3
git bash
(1)下载github库
git clone https://github.com/totalgood/nlpia.git
(2)使用environments.yml创建conda环境
在下载下来的文件里有文件:
nlpia\conda\environment.yml
查看自己的channels:
conda config --show channels

为什么要这样呢?这里就是我踩的一个坑了,因为environment.yml文件里用的channels和我conda配置的不一样,导致在使用environment.yml创建环境的时候巨慢无比,solveing enviroments执行了几个小时还没好,我猜测可能是conda要在各个channels里寻找合适版本的包,要考虑到各个版本之间的兼容性,解决办法就是把environment.yml里的channels换成conda中的:
用vscode打开environment.yml文件
改channels和注释掉三个包

注释的原因是我的清华源里没有这几个包,等待后面单独安装,你的channels和我不一样的话可以暂时不注释,等后面报错了再注释。
使用命令创建conda环境:
conda env create -f E:\DATA\nlpia\conda\environment.yml
如果报下面的错,那就照上一步注释掉后再次执行命令创建环境

再次执行上面conda创建环境的命令后,会报以下的错误:

这是因为enviroments.yml里还依赖了resuirements.txt文件,这个文件是给pip来执行的,里面有的包在PyPi里没有,所以报错,不用着急,接下来查看环境,可以发现环境nlpiaenv已经创建成功:

只是缺少一些包而已,接下来我们手动安装这些包即可:
我的办法很笨拙,用pip list 和 conda list按个比较enviroments.yml和requirements.txt里的包,看哪些没有被安装成功
首先比较requirements.txt最后得出以下的包没有安装:

把这个文件重命名成requirements1.txt,然后执行,
pip install -r E:\DATA\nlpia\requirements\requirements1.txt
这里实在不行的话挨个包安装也行,不过要注意版本要求
(3)安装被注释掉的包
还记得之前我们注释掉了enviroments.yml里的三个包吗?现在手动安装他们,拿opencv举例:
conda install opencv
enviroments.yml里限定了版本3.3.0,但是不好找,所以我直接安装的最新的,也能用。注意这种大型的包一般是可以实现向下兼容的,但是一些个人开发者的包最好安装要求的版本来安装,否则容易报各种奇怪的错误。
(4)安装nlpia库!
经过前面的安装,终于把环境搭好了,接下来安装nlpia库,进入nlpia文件夹,就是你下载的github文件夹,执行命令:
(nlpiaenv) PS E:\DATA\nlpia> pip install -e .
最后创建成功,测试一下:
(nlpiaenv) PS E:\DATA\nlpia> python -c "import nlpia; print(nlpia)"
<module 'nlpia' from 'e:\\data\\nlpia\\src\\nlpia\\__init__.py'>
成功了!
tips:遇见这种错误关掉梯子

有问题可以评论区问
相关文章:
windows在conda下安装nlpia库
最近在学习《自然语言处理实战》这本书,书中用了其自己的库nlpia,我一直装不上,网上也找不到教程遂放弃,看到现在第四章没办法了,需要用到库里的一些文本语料,又折腾了一天,终于装好了ÿ…...
分布式事务的前世今生-纯理论
一个可用的复杂的系统总是从可用的简单系统进化而来。反过来这句话也正确: 从零开始设计的复杂的系统从来都用不了,也没办法让它变的可用。 --John Gal 《系统学》 1975 1. 事务的概念 百科: 事务(Transaction),一般是…...
apache部署若依前后端分离项目(开启SSL)
网站部署之后,大多数需要配置https,所以本章教程,介绍使用apache部署若依前后端项目的时候,如何开启SSL,以及如何配置SSL证书。 一、安装ssl模块 默认情况下,ssl模块是没有安装的。需要手动安装,否则直接配置SSL模块的时候,会报错。 sudo yum install mod_ssl二、查询s…...
Elasticsearch scroll 之滚动查询
Elasticsearch scroll 之滚动查询 Elasticsearch 的 Scroll API 是一种用于处理大规模数据集的机制,特别是在需要从索引中检索大量数据时。通常情况下,Elasticsearch 的搜索请求会有一个结果集大小的限制 (fromsize 的检索数量默认是 10,000 条记录)&am…...
MySQL 内存使用率常用分析语句
最近连续遇到MySQL内存占用过高导致服务器内存不足的问题,整理下收集到的常用分析语句 一、 OS层 首先需要确认是否是MySQL占用的内存 top -p $(pidof mysqld) -n 1 或者 cat /proc/$(pidof mysqld)/status 二、 DB层 1. 全局情况 各种buffer pool大小…...
L20.【LeetCode笔记】用栈实现队列(方法2)(★详解★)
目录 1.实现方法 过程详解 1.执行push 1->push 2->push 3->push 4 2.执行第一个pop 3.执行第二个pop 4.执行push 5->push 6 编辑 5.执行pop->pop->pop 代码实现 队列创建函数myQueueCreate 入队函数myQueuePush 出队函数myQueuePop 返回队列开头…...
PR蒙太奇
简介 蒙太奇是将不同的镜头鬓角在一起,已不同的时间、地点来表现人物、环境、情节等,有时会产生意想不到的想过。广义上来说,这种剪接做法就是蒙太奇,是由镜头组合构成的隐式语言。 含义 镜头组接技巧 叙事蒙太奇:…...
高中数学:计数原理-排列组合
文章目录 一、排列排列数例题 二、组合组合数例题 三、使用方法总结 一、排列 排列数 例题 二、组合 组合数 例题 三、使用方法总结 组合:从n个元素中抽取m个元素,不排序,则用组合计算 排列:从n个元素中抽取m个元素,再…...
pytorch中有哪些归一化的方式?
在 PyTorch 中,归一化是一种重要的操作,用于调整数据分布或模型参数,以提高模型的训练效率和性能。以下是常见的归一化方式及其应用场景: 1. 数据归一化 (1)torch.nn.functional.normalize 对输入张量沿…...
Next.js系统性教学:增量静态再生成 (ISR) 完全解析
更多有关Next.js教程,请查阅: 【目录】Next.js 独立开发系列教程-CSDN博客 目录 1. 什么是增量静态再生成 (ISR)? 1.1 传统的静态生成与挑战 1.2 增量静态再生成(ISR)的出现 2. 如何使用增量静态再生成(ISR&…...
视频编辑技术的发展:AI技术在小咖视频混剪中的应用
随着数字技术的飞速发展,视频编辑领域也迎来了革命性的变化。AI技术的引入,使得视频编辑变得更加智能和高效。本文将探讨AI技术在视频混剪领域的应用,并介绍一些实用的工具,帮助用户提升视频编辑的效率和质量。 视频演示 AI技术在…...
【JVM】JVM基础教程(一)
目录 初识JVM JVM是什么? JVM的功能 解释、即时编译和运行 内存管理 常见的JVM JVM虚拟机规范 HotSpot的发展历程 JVM的组成 字节码文件详解 应用场景 以正确姿势打开字节码文件 编辑字节码文件的组成 基本信息 Magic魔数 主副版本号 常量池 接口…...
Python并发编程全解析
一、前言 在现代开发中,并发编程是提高性能、响应速度的关键技术之一。Python提供了多种实现并发的方式,如多线程、多进程和异步IO。本篇文章将逐一解析这些技术,探讨其适用场景,并通过代码示例帮助理解。 二、并发编程的核心概念 1. 并发与并行 并发:任务在时间片上交替…...
大语言模型应用Text2SQL本地部署实践初探
自从两年前OpenAI公司发布ChatGPT后,大模型(Large Language Model,简称LLM)相关技术在国内外可谓百家争鸣,遍地开花,在传统数据挖掘、机器学习和深度学习的基础上,正式宣告进入快速发展的人工智能(Artificial Intellig…...
每日十题八股-2024年12月7日
1.说说hashmap的负载因子 2.Hashmap和Hashtable有什么不一样的?Hashmap一般怎么用? 3.ConcurrentHashMap怎么实现的? 4.分段锁怎么加锁的? 5.分段锁是可重入的吗? 6.已经用了synchronized,为什么还要用CAS呢…...
VTK编程指南<三>:基于VTK入门程序解析来理解VTK基础知识
1、VTK入门程序 下面是一个完整的Vtk入门程序,我们基于这个程序来对VTK的基本知识进行一个初步了解。 #include <iostream>#include <vtkAutoInit.h> VTK_MODULE_INIT(vtkRenderingOpenGL2);// VTK was built with vtkRenderingOpenGL2 VTK_MODULE_INI…...
PyQt5快速开发与实战
PyQt5快速开发与实战相关资源 PyQt5快速开发与实战配套代码资源获取 PyQt5快速开发与实战 第一个要跟大家分享的就是的《PyQt5快速开发与实战》。该书既涵盖了 PyQt5 的基础知识,又包含了实战应用技巧,对 PyQt5 的基本概念和技术细节进行了详细阐述&…...
SpringBoot 开源停车场管理收费系统
一、下载项目文件 下载源码项目文件口令: 【前端小程序地址】(3.0):伏脂火器白泽知洞座/~6f8d356LNL~:/【后台管理地址】(3.0):伏脂火器仇恨篆洞座/~0f4a356Ks2~:/【岗亭端地址】(3.0):动作火器智汇堂多好/~dd69356K6r~:/复制口令…...
cmake: error while loading shared libraries: libssl.so.1.1
在ubuntu22.04中编译c文件时出现如下错误: cmake: error while loading shared libraries: libssl.so.1.1: cannot open shared object file: No such file or directory 解决办法:1.进网站下载对应的.deb文件,链接为:https://sec…...
部署loki,grafana 以及springcloud用法举例
文章目录 场景docker 部署grafanadocker-compose部署loki维护配置文件 local-config.yaml维护docker-compose.yml配置启动 grafana 添加loki数据源springcloud用法举例查看loki的explore,查看日志 场景 小公司缺少运维岗位,需要研发自己部署日志系统,elk…...
为什么你的脑影像分析总出错?聊聊AC-PC线标准化背后的原理与MIPAV实现
为什么你的脑影像分析总出错?AC-PC线标准化原理与MIPAV实战解析 在神经影像研究的实验室里,最常听到的抱怨莫过于"同样的分析方法,这次的结果怎么完全对不上?"。就像用不同比例尺的地图导航会迷路一样,忽略A…...
5分钟搞定AI超清画质增强:镜像部署与使用全攻略
5分钟搞定AI超清画质增强:镜像部署与使用全攻略 1. 引言:为什么需要AI画质增强 1.1 低清图像的普遍困扰 我们每天都会遇到各种低质量图片:模糊的老照片、压缩过度的网络图片、分辨率不足的截图。传统放大方法就像简单拉伸橡皮筋࿰…...
化工模拟老司机的原油蒸馏骚操作
Aspen 化工过程模拟虚拟组分蒸馏原油 本可模型 在本模型中,将使用pseudocomponents进行原油蒸馏。 将创建一个由常压蒸馏塔和真空蒸馏塔组成的模型。 常压蒸馏塔将使用 Chao-Seader 热力学模型建模,而真空蒸馏塔将使用 Braun K10 模型建模。在Aspen里折腾…...
RWKV7-1.5B-G1A快速原型:使用VMware虚拟机搭建隔离的模型测试环境
RWKV7-1.5B-G1A快速原型:使用VMware虚拟机搭建隔离的模型测试环境 1. 为什么需要虚拟机测试环境 在测试新的大语言模型时,最头疼的问题就是环境配置冲突。你可能遇到过这种情况:好不容易装好CUDA驱动,结果发现和现有项目的PyTor…...
Video2X:用AI突破视频质量瓶颈的全栈解决方案
Video2X:用AI突破视频质量瓶颈的全栈解决方案 【免费下载链接】video2x A lossless video/GIF/image upscaler achieved with waifu2x, Anime4K, SRMD and RealSR. Started in Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trending/vi/video…...
为什么你的局域网速度慢?可能是集线器和交换机的区别没搞懂
为什么你的局域网速度慢?可能是集线器和交换机的区别没搞懂 家里或办公室的网络总是不给力?明明升级了宽带套餐,下载文件时却还是像蜗牛爬行?问题可能出在你忽略的网络设备选择上。许多用户至今仍在用早已淘汰的集线器(…...
Tina Linux 适配 RTL8733bs WIFI 模块:从设备树到网络连接全流程解析
1. 硬件接口配置与设备树修改 第一次接触RTL8733bs这个Wi-Fi/蓝牙二合一模块时,我花了两天时间才搞明白硬件连接和设备树配置的关系。这个模块通过SDIO接口与全志V853主控通信,蓝牙部分则使用UART接口。下面我就把踩过的坑和验证过的正确配置分享给大家。…...
避坑指南:用Python调用腾讯混元大模型API时,你可能会遇到的5个常见错误及解决方法
避坑指南:用Python调用腾讯混元大模型API时,你可能会遇到的5个常见错误及解决方法 调试API接口就像在迷宫中寻找出口——每个转角都可能遇到意想不到的障碍。作为使用腾讯混元大模型的开发者,我在过去三个月里处理了超过200次API调用异常&…...
别再只用Dice Loss了!结合Focal Loss解决钢材缺陷分割中的小目标难题(附PyTorch代码)
突破小目标分割瓶颈:Focal Loss与Dice Loss的黄金组合实践 在工业质检领域,钢材表面缺陷分割任务常面临两个核心挑战:毫米级点状缺陷的漏检与复杂纹理背景下的误报。传统Dice Loss虽能缓解类别不平衡问题,但当遇到像素占比不足0.1…...
FPGA分频器避坑指南:为什么你的奇数倍分频时钟占空比总不对?
FPGA奇数倍分频器设计避坑实战:从原理到调试的完整解决方案 在FPGA开发中,时钟分频是最基础却又最容易出问题的环节之一。特别是当我们需要奇数倍分频时,很多工程师都会遇到一个共同的困扰——为什么仿真通过的代码,烧写到FPGA后输…...
