windows在conda下安装nlpia库
最近在学习《自然语言处理实战》这本书,书中用了其自己的库nlpia,我一直装不上,网上也找不到教程遂放弃,看到现在第四章没办法了,需要用到库里的一些文本语料,又折腾了一天,终于装好了,记录一下。
github:https://github.com/totalgood/nlpia
首先可以尝试照着github上官方的教程来装,不过最后基本上装不上,因为会有各种版本的包冲突,下面讲我的安装流程:
前提条件:
Anaconda3
git bash
(1)下载github库
git clone https://github.com/totalgood/nlpia.git
(2)使用environments.yml创建conda环境
在下载下来的文件里有文件:
nlpia\conda\environment.yml
查看自己的channels:
conda config --show channels

为什么要这样呢?这里就是我踩的一个坑了,因为environment.yml文件里用的channels和我conda配置的不一样,导致在使用environment.yml创建环境的时候巨慢无比,solveing enviroments执行了几个小时还没好,我猜测可能是conda要在各个channels里寻找合适版本的包,要考虑到各个版本之间的兼容性,解决办法就是把environment.yml里的channels换成conda中的:
用vscode打开environment.yml文件
改channels和注释掉三个包

注释的原因是我的清华源里没有这几个包,等待后面单独安装,你的channels和我不一样的话可以暂时不注释,等后面报错了再注释。
使用命令创建conda环境:
conda env create -f E:\DATA\nlpia\conda\environment.yml
如果报下面的错,那就照上一步注释掉后再次执行命令创建环境

再次执行上面conda创建环境的命令后,会报以下的错误:

这是因为enviroments.yml里还依赖了resuirements.txt文件,这个文件是给pip来执行的,里面有的包在PyPi里没有,所以报错,不用着急,接下来查看环境,可以发现环境nlpiaenv已经创建成功:

只是缺少一些包而已,接下来我们手动安装这些包即可:
我的办法很笨拙,用pip list 和 conda list按个比较enviroments.yml和requirements.txt里的包,看哪些没有被安装成功
首先比较requirements.txt最后得出以下的包没有安装:

把这个文件重命名成requirements1.txt,然后执行,
pip install -r E:\DATA\nlpia\requirements\requirements1.txt
这里实在不行的话挨个包安装也行,不过要注意版本要求
(3)安装被注释掉的包
还记得之前我们注释掉了enviroments.yml里的三个包吗?现在手动安装他们,拿opencv举例:
conda install opencv
enviroments.yml里限定了版本3.3.0,但是不好找,所以我直接安装的最新的,也能用。注意这种大型的包一般是可以实现向下兼容的,但是一些个人开发者的包最好安装要求的版本来安装,否则容易报各种奇怪的错误。
(4)安装nlpia库!
经过前面的安装,终于把环境搭好了,接下来安装nlpia库,进入nlpia文件夹,就是你下载的github文件夹,执行命令:
(nlpiaenv) PS E:\DATA\nlpia> pip install -e .
最后创建成功,测试一下:
(nlpiaenv) PS E:\DATA\nlpia> python -c "import nlpia; print(nlpia)"
<module 'nlpia' from 'e:\\data\\nlpia\\src\\nlpia\\__init__.py'>
成功了!
tips:遇见这种错误关掉梯子

有问题可以评论区问
相关文章:
windows在conda下安装nlpia库
最近在学习《自然语言处理实战》这本书,书中用了其自己的库nlpia,我一直装不上,网上也找不到教程遂放弃,看到现在第四章没办法了,需要用到库里的一些文本语料,又折腾了一天,终于装好了ÿ…...
分布式事务的前世今生-纯理论
一个可用的复杂的系统总是从可用的简单系统进化而来。反过来这句话也正确: 从零开始设计的复杂的系统从来都用不了,也没办法让它变的可用。 --John Gal 《系统学》 1975 1. 事务的概念 百科: 事务(Transaction),一般是…...
apache部署若依前后端分离项目(开启SSL)
网站部署之后,大多数需要配置https,所以本章教程,介绍使用apache部署若依前后端项目的时候,如何开启SSL,以及如何配置SSL证书。 一、安装ssl模块 默认情况下,ssl模块是没有安装的。需要手动安装,否则直接配置SSL模块的时候,会报错。 sudo yum install mod_ssl二、查询s…...
Elasticsearch scroll 之滚动查询
Elasticsearch scroll 之滚动查询 Elasticsearch 的 Scroll API 是一种用于处理大规模数据集的机制,特别是在需要从索引中检索大量数据时。通常情况下,Elasticsearch 的搜索请求会有一个结果集大小的限制 (fromsize 的检索数量默认是 10,000 条记录)&am…...
MySQL 内存使用率常用分析语句
最近连续遇到MySQL内存占用过高导致服务器内存不足的问题,整理下收集到的常用分析语句 一、 OS层 首先需要确认是否是MySQL占用的内存 top -p $(pidof mysqld) -n 1 或者 cat /proc/$(pidof mysqld)/status 二、 DB层 1. 全局情况 各种buffer pool大小…...
L20.【LeetCode笔记】用栈实现队列(方法2)(★详解★)
目录 1.实现方法 过程详解 1.执行push 1->push 2->push 3->push 4 2.执行第一个pop 3.执行第二个pop 4.执行push 5->push 6 编辑 5.执行pop->pop->pop 代码实现 队列创建函数myQueueCreate 入队函数myQueuePush 出队函数myQueuePop 返回队列开头…...
PR蒙太奇
简介 蒙太奇是将不同的镜头鬓角在一起,已不同的时间、地点来表现人物、环境、情节等,有时会产生意想不到的想过。广义上来说,这种剪接做法就是蒙太奇,是由镜头组合构成的隐式语言。 含义 镜头组接技巧 叙事蒙太奇:…...
高中数学:计数原理-排列组合
文章目录 一、排列排列数例题 二、组合组合数例题 三、使用方法总结 一、排列 排列数 例题 二、组合 组合数 例题 三、使用方法总结 组合:从n个元素中抽取m个元素,不排序,则用组合计算 排列:从n个元素中抽取m个元素,再…...
pytorch中有哪些归一化的方式?
在 PyTorch 中,归一化是一种重要的操作,用于调整数据分布或模型参数,以提高模型的训练效率和性能。以下是常见的归一化方式及其应用场景: 1. 数据归一化 (1)torch.nn.functional.normalize 对输入张量沿…...
Next.js系统性教学:增量静态再生成 (ISR) 完全解析
更多有关Next.js教程,请查阅: 【目录】Next.js 独立开发系列教程-CSDN博客 目录 1. 什么是增量静态再生成 (ISR)? 1.1 传统的静态生成与挑战 1.2 增量静态再生成(ISR)的出现 2. 如何使用增量静态再生成(ISR&…...
视频编辑技术的发展:AI技术在小咖视频混剪中的应用
随着数字技术的飞速发展,视频编辑领域也迎来了革命性的变化。AI技术的引入,使得视频编辑变得更加智能和高效。本文将探讨AI技术在视频混剪领域的应用,并介绍一些实用的工具,帮助用户提升视频编辑的效率和质量。 视频演示 AI技术在…...
【JVM】JVM基础教程(一)
目录 初识JVM JVM是什么? JVM的功能 解释、即时编译和运行 内存管理 常见的JVM JVM虚拟机规范 HotSpot的发展历程 JVM的组成 字节码文件详解 应用场景 以正确姿势打开字节码文件 编辑字节码文件的组成 基本信息 Magic魔数 主副版本号 常量池 接口…...
Python并发编程全解析
一、前言 在现代开发中,并发编程是提高性能、响应速度的关键技术之一。Python提供了多种实现并发的方式,如多线程、多进程和异步IO。本篇文章将逐一解析这些技术,探讨其适用场景,并通过代码示例帮助理解。 二、并发编程的核心概念 1. 并发与并行 并发:任务在时间片上交替…...
大语言模型应用Text2SQL本地部署实践初探
自从两年前OpenAI公司发布ChatGPT后,大模型(Large Language Model,简称LLM)相关技术在国内外可谓百家争鸣,遍地开花,在传统数据挖掘、机器学习和深度学习的基础上,正式宣告进入快速发展的人工智能(Artificial Intellig…...
每日十题八股-2024年12月7日
1.说说hashmap的负载因子 2.Hashmap和Hashtable有什么不一样的?Hashmap一般怎么用? 3.ConcurrentHashMap怎么实现的? 4.分段锁怎么加锁的? 5.分段锁是可重入的吗? 6.已经用了synchronized,为什么还要用CAS呢…...
VTK编程指南<三>:基于VTK入门程序解析来理解VTK基础知识
1、VTK入门程序 下面是一个完整的Vtk入门程序,我们基于这个程序来对VTK的基本知识进行一个初步了解。 #include <iostream>#include <vtkAutoInit.h> VTK_MODULE_INIT(vtkRenderingOpenGL2);// VTK was built with vtkRenderingOpenGL2 VTK_MODULE_INI…...
PyQt5快速开发与实战
PyQt5快速开发与实战相关资源 PyQt5快速开发与实战配套代码资源获取 PyQt5快速开发与实战 第一个要跟大家分享的就是的《PyQt5快速开发与实战》。该书既涵盖了 PyQt5 的基础知识,又包含了实战应用技巧,对 PyQt5 的基本概念和技术细节进行了详细阐述&…...
SpringBoot 开源停车场管理收费系统
一、下载项目文件 下载源码项目文件口令: 【前端小程序地址】(3.0):伏脂火器白泽知洞座/~6f8d356LNL~:/【后台管理地址】(3.0):伏脂火器仇恨篆洞座/~0f4a356Ks2~:/【岗亭端地址】(3.0):动作火器智汇堂多好/~dd69356K6r~:/复制口令…...
cmake: error while loading shared libraries: libssl.so.1.1
在ubuntu22.04中编译c文件时出现如下错误: cmake: error while loading shared libraries: libssl.so.1.1: cannot open shared object file: No such file or directory 解决办法:1.进网站下载对应的.deb文件,链接为:https://sec…...
部署loki,grafana 以及springcloud用法举例
文章目录 场景docker 部署grafanadocker-compose部署loki维护配置文件 local-config.yaml维护docker-compose.yml配置启动 grafana 添加loki数据源springcloud用法举例查看loki的explore,查看日志 场景 小公司缺少运维岗位,需要研发自己部署日志系统,elk…...
RestClient
什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端,它允许HTTP与Elasticsearch 集群通信,而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点 轻量级ÿ…...
浅谈 React Hooks
React Hooks 是 React 16.8 引入的一组 API,用于在函数组件中使用 state 和其他 React 特性(例如生命周期方法、context 等)。Hooks 通过简洁的函数接口,解决了状态与 UI 的高度解耦,通过函数式编程范式实现更灵活 Rea…...
国防科技大学计算机基础课程笔记02信息编码
1.机内码和国标码 国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制,因此这个了16进制的数据既可以翻译成为这个机器码,也可以翻译成为这个国标码,所以这个时候很容易会出现这个歧义的情况; 因此,我们的这个国…...
日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻
在如今就业市场竞争日益激烈的背景下,越来越多的求职者将目光投向了日本及中日双语岗位。但是,一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧?面对生疏的日语交流环境,即便提前恶补了…...
【位运算】消失的两个数字(hard)
消失的两个数字(hard) 题⽬描述:解法(位运算):Java 算法代码:更简便代码 题⽬链接:⾯试题 17.19. 消失的两个数字 题⽬描述: 给定⼀个数组,包含从 1 到 N 所有…...
转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
SpringCloudGateway 自定义局部过滤器
场景: 将所有请求转化为同一路径请求(方便穿网配置)在请求头内标识原来路径,然后在将请求分发给不同服务 AllToOneGatewayFilterFactory import lombok.Getter; import lombok.Setter; import lombok.extern.slf4j.Slf4j; impor…...
自然语言处理——循环神经网络
自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元(GRU)长短期记忆神经网络(LSTM)…...
回溯算法学习
一、电话号码的字母组合 import java.util.ArrayList; import java.util.List;import javax.management.loading.PrivateClassLoader;public class letterCombinations {private static final String[] KEYPAD {"", //0"", //1"abc", //2"…...
FFmpeg:Windows系统小白安装及其使用
一、安装 1.访问官网 Download FFmpeg 2.点击版本目录 3.选择版本点击安装 注意这里选择的是【release buids】,注意左上角标题 例如我安装在目录 F:\FFmpeg 4.解压 5.添加环境变量 把你解压后的bin目录(即exe所在文件夹)加入系统变量…...
