当前位置：首页 > news >正文

[python] 安装numpy+scipy+matlotlib+scikit-learn及问题解决

news 2026/5/22 3:12:51

这篇文章主要讲述Python如何安装Numpy、Scipy、Matlotlib、Scikit-learn等库的过程及遇到的问题解决方法。最近安装这个真是一把泪啊，各种不兼容问题和报错，希望文章对你有所帮助吧！你可能遇到的问题包括：
  ImportError: No module named sklearn 未安装sklearn包
  ImportError: DLL load failed: 找不到指定的模块
  ImportError: DLL load failed: The specified module could not be found
Microsoft Visual C++ 9.0 is required Unable to find vcvarsall.bat
  Numpy Install RuntimeError: Broken toolchain: cannot link a simple C program
ImportError: numpy.core.multiarray failed to import
  ImportError: cannot import name __check_build
ImportError: No module named matplotlib.pyplot

一. 安装过程

最早我是使用"pip install scikit-learn"命令安装的Scikit-Learn程序，并没有注意需要安装Numpy、Scipy、Matlotlib，然后在报错"No module named Numpy"后，我接着使用PIP或者下载exe程序安装相应的包，同时也不理解安装顺序和版本的重要性。其中最终都会报错" ImportError: DLL load failed: 找不到指定的模块"，此时我的解决方法是：

错误：sklearn ImportError: DLL load failed: 找不到指定的模块
重点：安装python第三方库时总会出现各种兼容问题，应该是版本问题，版本需要一致。
下载：http://download.csdn.net/detail/eastmount/9366117

第一步：卸载原始版本，包括Numpy、Scipy、Matlotlib、Scikit-Learn
pip uninstall scikit-learn
pip uninstall numpy
pip uninstall scipy
pip uninstall matplotlib

第二步：不使用"pip install package"或"easy_install package"安装，或者去百度\CSDN下载exe文件，而是去到官网下载相应版本。
  http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
  http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy
  http://www.lfd.uci.edu/~gohlke/pythonlibs/#matplotlib
  http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn

安装过程中最重要的地方就是版本需要兼容。其中操作系统为64位，Python为2.7.8 64位，下载的四个whl文件如下，其中cp27表示CPython 2.7版本，cp34表示CPython 3.4，win_arm64指的是64位版本。
  numpy-1.10.2-cp27-none-win_amd64.whl
scipy-0.16.1-cp27-none-win_amd64.whl
matplotlib-1.5.0-cp27-none-win_amd64.whl
scikit_learn-0.17-cp27-none-win_amd64.whl

PS：不推荐使用"pip install numpy"安装或下载如"numpy-MKL-1.8.0.win-amd64-py2.7.exe"类似文件，地址如：
  Numerical Python - Browse /NumPy at SourceForge.net
  SciPy: Scientific Library for Python - Browse Files at SourceForge.net

第三步：去到Python安装Scripts目录下，再使用pip install xxx.whl安装，先装Numpy\Scipy\Matlotlib包，再安装Scikit-Learn。

其中我的python安装路径"G:\software\Program software\Python\python insert\Scripts"，同时四个whl文件安装核心代码：
pip install G:\numpy+scipy+matplotlib\numpy-1.10.2-cp27-none-win_amd64.whl
pip install G:\numpy+scipy+matplotlib\scikit_learn-0.17-cp27-none-win_amd64.whl

C:\>G:

G:\>cd G:\software\Program software\Python\python insert\Scripts

G:\software\Program software\Python\python insert\Scripts>pip install G:\numpy+s

cipy+matplotlib\numpy-1.10.2-cp27-none-win_amd64.whl

Processing g:\numpy+scipy+matplotlib\numpy-1.10.2-cp27-none-win_amd64.whl

Installing collected packages: numpy

Successfully installed numpy-1.10.2

G:\software\Program software\Python\python insert\Scripts>pip install G:\numpy+s

cipy+matplotlib\matplotlib-1.5.0-cp27-none-win_amd64.whl

Installing collected packages: matplotlib

Successfully installed matplotlib-1.5.0

G:\software\Program software\Python\python insert\Scripts>pip install G:\numpy+s

cipy+matplotlib\scipy-0.16.1-cp27-none-win_amd64.whl

Processing g:\numpy+scipy+matplotlib\scipy-0.16.1-cp27-none-win_amd64.whl

Installing collected packages: scipy

Successfully installed scipy-0.16.1

G:\software\Program software\Python\python insert\Scripts>pip install G:\numpy+s

cipy+matplotlib\scikit_learn-0.17-cp27-none-win_amd64.whl

Processing g:\numpy+scipy+matplotlib\scikit_learn-0.17-cp27-none-win_amd64.whl

Installing collected packages: scikit-learn

Successfully installed scikit-learn-0.17

第四步：此时配置完成，关键是Python64位版本兼容问题和Scripts目录。最后用北邮论坛一个神人的回复结束这个安装过程：“傻孩子，用套件啊，给你介绍一个Anaconda或winpython。只能帮你到这里了！ ”

二. 测试运行环境

搞了这么半天，为什么要装这些呢？给几个用例验证它的正确安装和强大吧！

Scikit-Learn是基于python的机器学习模块，基于BSD开源许可。Scikit-learn的基本功能主要被分为六个部分，分类，回归，聚类，数据降维，模型选择，数据预处理，具体可以参考官方网站上的文档。

NumPy（Numeric Python）系统是Python的一种开源的数值计算扩展，一个用python实现的科学计算包。它提供了许多高级的数值编程工具，如：矩阵数据类型、矢量处理，以及精密的运算库。专为进行严格的数字处理而产生。
内容包括：1、一个强大的N维数组对象Array；2、比较成熟的（广播）函数库；3、用于整合C/C++和Fortran代码的工具包；4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。

SciPy (pronounced "Sigh Pie") 是一个开源的数学、科学和工程计算包。它是一款方便、易于使用、专为科学和工程设计的Python工具包，包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等等。

Matplotlib是一个Python的图形框架，类似于MATLAB和R语言。它是python最著名的绘图库，它提供了一整套和matlab相似的命令API，十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件，嵌入GUI应用程序中。

第一个代码：斜线坐标，测试matplotlib

import matplotlib

import numpy

import scipy

import matplotlib.pyplot as plt

plt.plot([1,2,3])

plt.ylabel('some numbers')

plt.show()

运行结果：

第二个代码：桃心程序，测试numpy和matplotlib
代码参考：Windows 下 Python easy_install 的安装 - KingsLanding

import numpy as np

import matplotlib.pyplot as plt

X = np.arange(-5.0, 5.0, 0.1)

Y = np.arange(-5.0, 5.0, 0.1)

x, y = np.meshgrid(X, Y)

f = 17 * x ** 2 - 16 * np.abs(x) * y + 17 * y ** 2 - 225

fig = plt.figure()

cs = plt.contour(x, y, f, 0, colors = 'r')

plt.show()

运行结果：

第三个程序：显示Matplotlib强大绘图交互功能
代码参考：Python-Matplotlib安装及简单使用 - bery

import numpy as np

import matplotlib.pyplot as plt

N = 5

menMeans = (20, 35, 30, 35, 27)

menStd = (2, 3, 4, 1, 2)

ind = np.arange(N) # the x locations for the groups

width = 0.35 # the width of the bars

fig, ax = plt.subplots()

rects1 = ax.bar(ind, menMeans, width, color='r', yerr=menStd)

womenMeans = (25, 32, 34, 20, 25)

womenStd = (3, 5, 2, 3, 3)

rects2 = ax.bar(ind+width, womenMeans, width, color='y', yerr=womenStd)

# add some

ax.set_ylabel('Scores')

ax.set_title('Scores by group and gender')

ax.set_xticks(ind+width)

ax.set_xticklabels( ('G1', 'G2', 'G3', 'G4', 'G5') )

ax.legend( (rects1[0], rects2[0]), ('Men', 'Women') )

def autolabel(rects):

# attach some text labels

for rect in rects:

height = rect.get_height()

ax.text(rect.get_x()+rect.get_width()/2., 1.05*height, '%d'%int(height),

ha='center', va='bottom')

autolabel(rects1)

autolabel(rects2)

plt.show()

运行结果：

PS：如果设置legend没有显示比例图标，则参考下面代码：

[python] view plain copy

# coding=utf-8
import numpy as np
import matplotlib
import scipy
import matplotlib.pyplot as plt
#设置legend: http://bbs.byr.cn/#!article/Python/7705
#mark样式: http://www.360doc.com/content/14/1026/02/9482_419859060.shtml
#国家融合特征值
x1 = [10, 20, 50, 100, 150, 200, 300]
y1 = [0.615, 0.635, 0.67, 0.745, 0.87, 0.975, 0.49]
#动物
x2 = [10, 20, 50, 70, 90, 100, 120, 150]
y2 = [0.77, 0.62, 0.77, 0.86, 0.87, 0.97, 0.77, 0.47]
#人物
x3 = [10, 20, 50, 70, 90, 100, 120, 150]
y3 = [0.86, 0.86, 0.92, 0.94, 0.97, 0.97, 0.76, 0.46]
#国家
x4 = [10, 20, 50, 70, 90, 100, 120, 150]
y4 = [0.86, 0.85, 0.87, 0.88, 0.95, 1.0, 0.8, 0.49]
plt.title('Entity alignment result')
plt.xlabel('The number of class clusters')
plt.ylabel('Similar entity proportion')
plot1, = plt.plot(x1, y1, '-p', linewidth=2)
plot2, = plt.plot(x2, y2, '-*', linewidth=2)
plot3, = plt.plot(x3, y3, '-h', linewidth=2)
plot4, = plt.plot(x4, y4, '-d', linewidth=2)
plt.xlim(0, 300)
plt.ylim(0.4, 1.0)
#plot返回的不是matplotlib对象本身,而是一个列表,加个逗号之后就把matplotlib对象从列表里面提取出来
plt.legend( (plot1,plot2,plot3,plot4), ('Spot', 'Animal', 'People', 'Country'), fontsize=10)
plt.show()

输出如下图所示：

第四个代码：矩阵数据集，测试sklearn

from sklearn import datasets

iris = datasets.load_iris()

digits = datasets.load_digits()

print digits.data

运行结果：

第五个代码：计算TF-IDF词语权重，测试scikit-learn数据分析
参考代码：python scikit-learn计算tf-idf词语权重_python 分词权重_liuxuejiang158的博客-CSDN博客

# coding:utf-8

__author__ = "liuxuejiang"

import jieba

import jieba.posseg as pseg

import os

import sys

from sklearn import feature_extraction

from sklearn.feature_extraction.text import TfidfTransformer

from sklearn.feature_extraction.text import CountVectorizer

if __name__ == "__main__":

corpus=["我来到北京清华大学", #第一类文本切词后的结果词之间以空格隔开

"他来到了网易杭研大厦", #第二类文本的切词结果

"小明硕士毕业与中国科学院", #第三类文本的切词结果

"我爱北京天安门"] #第四类文本的切词结果

#该类会将文本中的词语转换为词频矩阵，矩阵元素a[i][j] 表示j词在i类文本下的词频

vectorizer=CountVectorizer()

#该类会统计每个词语的tf-idf权值

transformer=TfidfTransformer()

#第一个fit_transform是计算tf-idf，第二个fit_transform是将文本转为词频矩阵

tfidf=transformer.fit_transform(vectorizer.fit_transform(corpus))

#获取词袋模型中的所有词语

word=vectorizer.get_feature_names()

#将tf-idf矩阵抽取出来，元素a[i][j]表示j词在i类文本中的tf-idf权重

weight=tfidf.toarray()

#打印每类文本的tf-idf词语权重，第一个for遍历所有文本，第二个for便利某一类文本下的词语权重

for i in range(len(weight)):

print u"-------这里输出第",i,u"类文本的词语tf-idf权重------"

for j in range(len(word)):

print word[j],weight[i][j]

运行结果：

三. 其他错误解决方法

这里虽然讲解几个安装时遇到的其他错误及解决方法，但作者更推荐上面的安装步骤。

在这之前，我反复的安装、卸载、升级包，其中遇到了各种错误，改了又改，百度了又谷歌。常见PIP用法如下：

* pip install numpy --安装包numpy

* pip uninstall numpy --卸载包numpy

* pip show --files PackageName --查看已安装包

* pip list outdated --查看待更新包信息

* pip install --upgrade numpy --升级包

* pip install -U PackageName --升级包

* pip search PackageName --搜索包

* pip help --显示帮助信息

ImportError: numpy.core.multiarray failed to import
python安装numpy时出现的错误，这个通过stackoverflow和百度也是需要python版本与numpy版本一致，解决的方法包括"pip install -U numpy"升级或下载指定版本"pip install numpy==1.8"。但这显然还涉及到更多的包，没有前面的卸载下载安装统一版本的whl靠谱。

Microsoft Visual C++ 9.0 is required(unable to find vcvarsall.bat)
因为Numpy内部矩阵运算是用C语言实现的，所以需要安装编译工具，这和电脑安装的VC++或VS2012有关，解决方法：如果已安装Visual Studio则添加环境变量VS90COMNTOOLS即可，不同的VS版本对应不同的环境变量值：
Visual Studio 2010 (VS10)设置 VS90COMNTOOLS=%VS100COMNTOOLS%
Visual Studio 2012 (VS11)设置 VS90COMNTOOLS=%VS110COMNTOOLS%
Visual Studio 2013 (VS12)设置 VS90COMNTOOLS=%VS120COMNTOOLS%
但是这并没有解决，另一种方法是下载Micorsoft Visual C++ Compiler for Python 2.7的包。
下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=44266
参考文章：安装pandas出现错误“error: Microsoft Visual C++ 10.0 is required (Unable to find vcvarsall.bat).”的解决办法 - OSCHINA - 中文开源技术交流社区

PS：这些问题基本解决方法使用pip升级、版本一致、重新下载相关版本exe文件再安装。

总之，最后希望文章对你有所帮助！尤其是刚学习Python和机器学习的同学。

[python] 安装numpy+scipy+matlotlib+scikit-learn及问题解决

一. 安装过程

二. 测试运行环境

三. 其他错误解决方法

相关文章：

[python] 安装numpy+scipy+matlotlib+scikit-learn及问题解决

uniapp使用命令创建页面

Linux（进程控制）

Java学习笔记——（18）进制介绍

【数学建模】--灰色关联分析

图像像素梯度

[论文笔记]Batch Normalization

SpringCloud教程（中）

蓝帽杯2022

vue + el-table 表格数据导出为excel表格

ClickHouse（二十）：Clickhouse SQL DDL操作-2-分区表DDL操作

Springboot 在 redis 中使用 Guava 布隆过滤器机制

Docker本地镜像发布到阿里云

Postgresql源码（112）plpgsql执行sql时变量何时替换为值

OhemCrossEntropyLoss

prometheusalert区分告警到不同钉钉群

AUTOSAR规范与ECU软件开发(实践篇）3.2 ETAS AUTOSAR系统解决方案介绍（上）

【leetcode】第三章哈希表part02

【C语言】memset()函数

C++中重载（overload)、重写(override，也叫做“覆盖”）和重定义(redefine，也叫作“隐藏”)的区别？

Onekey Steam清单下载工具：3步搞定游戏清单管理的终极指南

免费图片去水印工具有哪些？2026年在线网站、APP软件完整盘点与推荐

深夜连上服务器，我再也不想敲命令行

淘金币自动化脚本：每天节省20分钟，解放双手的终极指南

mpv.net：Windows平台最强大的开源媒体播放器解决方案

JetBrains IDE试用期重置终极指南：轻松解决IDE过期问题

巨亏47亿，市值5000亿：拆解智谱AI的定价逻辑

宏裕塑胶代理沙伯基础创新SABIC（原GE塑料）全线工程塑料产品与技术服务

Taotoken官方折扣活动如何切实降低模型调用成本

3步掌握Jellyfin智能字幕插件：新手快速上手指南