Python 十大开源Python库,看看你熟悉几个?
嗨害大家好鸭!我是芝士❤
对于码农来说,
关注的永远是新近有什么流行的、
既能解决问题又好用的利器。
本文就为你盘点十大开源Python库。
1、Pipenv
第一名非它莫属,
这个工具2017年初才发布,
但它已经能够影响每个Python开发者的工作流了,
更别提现在连Python.org都官方推荐它作为支持库的管理工具!
Pipenv最开始不过是大神Kenneth Reitz搞的周末项目,
本意是将npm或yarn这些包管理器的闪光点引入Python世界。
别管什么安装virtualenv、virtualenvwrapper,
管理requirements.txt文件,
更别提根据支持库的版本来确保复用性了。
有了Pipenv,
再也不需要用命令来增加、删除或更新支持库了,
一个Pipfile文件就能搞定所有的支持库。
这个工具会生成一个Pipfile.lock文件,
确保编译的库都是最终版,
还能避免因为漏掉一些边边角角的支持库而导致的bug。
当然,Pipenv还有其他不少好功能,
并且它的文档也很赞。
赶紧去了解一下,
用它来支持你的Python项目吧,
我们已经在Tryolabs上用上啦:)
2、PyTorch
要说2017年深度学习社区里面哪个库实现了大爆发,
那必须是PyTorch,
这个深度学习框架是Facebook 2017年才推出的。
PyTorch是基于流行一时的Torch框架构建和改进的,
与Lua相比,它是基于Python的。
近几年,
越来越多的人开始用Python开展数据科学工作,
PyTorch让深度学习变得更加平易近人了。
值得注意的是,
采用了全新动态计算图范式的PyTorch已经成为很多研究者的专用框架之一。
使用TensorFlow、CNTK和MXNet等框架写代码时,
必须先定义计算图,
这个计算图指定了代码运行的所有操作,
随后在框架中进行编译与优化,
使它能进行GPU并行处理,运算速度更快
这种范式被称为静态计算图。
它的好处在于可以利用各种优化,
而且,因为构建与执行是分开进行的,
此图一旦被构建即可在不同设备上运行。
然而,对于诸如自然语言处理等任务,
其工作量是可变的。
将图片应用于算法前,
可以将图片调整为固定尺寸,
但是无法将不同长度的句子进行类似的处理。
PyTorch和动态图的又是在于可在代码中使用标准Python控制指令,
在执行指令时定义动态图,
这就给了你更多自由,
对于多任务,这点至关重要。
和其他现代深度学习框架一样,
PyTorch还可以进行梯度计算,
它的运行速度极快,还可以扩展,
既然如此,干嘛不试试?
3、Caffe2
听上去有点不可思议,但是Facebook 2017年还发布了另一款重磅深度学习框架。
多年前,Caffe框架就已被广泛应用,并以无可比拟的性能和实战检测的代码库著称。然而,深度学习的最新趋势使得这个框架在某些方向陷入了停滞。Caffe2试图将Caffe引入现代世界。
它支持分布式训练及部署,包括多种移动平台、最新的CPU与CUDA适配的硬件。PyTorch更适合研究,Caffe2则适用于Facebook那种大规模部署。
还可以了解一下ONNX(微软与Facebook共同推出的开源项目,全称为Open Neural Network Exchange)近期的努力。用PyTorch构建和训练模型,再用Caffe2进行部署!是不是挺棒?
4、Pendulum
2016年,
Arrow荣登本榜,
这个库是为了让Python处理datetimes更简单。
2017年,轮到Pendulum了。
Pendulum的一大优势是内嵌式取代Python的datetime类,
可以轻易地将它整合进现有代码,
并且可以在需要它的时候才进行调用。
作者精心调校了时区,确保时区的正确,
还让每个实例都对时区敏感,并且默认使用UTC。
还有就是提供了扩展的timedelta,使datetime计算更加容易。
与现有的其他库不同,它提供了一个可预测行为的API,
这样就可以知道后面会发生什么。
如果你正开发使用datetimes的复杂项目,这个库能让你更轻松!想要了解更多,请查阅文档。
5、Dash
从事数据科学工作,
少不了使用Pandas、scikit-learn这些Python生态系统中的利器,
还有就是控制工作流的Jupyter Notebooks,
没的说,你和同事都爱用。
但是,要想将工作成果分享给不会用这些工具的人,
那该怎么办?
怎么才能构建一个人人能够轻松上手的界面,
来操控数据和可视化?
以前,为实现这一目的,
需要一个精通Javascript的前端专职团队来搭建GUI,
以后就用不着啦。
2017年发布的Dash是一个在纯Python环境中构建数据可视化网站应用的开源库。
基于Flask、Plotly.js和React构建,提供抽象层,
无需学习上述框架即可快速上手开发。
它在浏览器中渲染和响应,
因此适用移动端。
如果你想知道Dash都能实现什么效果,
这个样例库可以让你大饱眼福。
6、PyFlux
很多Python库都适用于数据科学和机器学习,
但当数据点是随着时间进化的矩阵时,
比如股价或从设备获取的测量数据等,这就是另一回事儿了。
PyFlux是专门处理时间序列的Python开源库。
时间序列是统计学与计量经济学的子域,
其目标是描述时间序列行为(主要是关于潜在成分或利息特征),并且预测未来它们如何演化。
PyFlux允许通过概率方式进行时间序列建模,
并且实现了几个像GARCH这样的现代时间序列模型。
是个不错的好东西。
7、Fire
做项目的时候经常需要制作命令行界面(Command Line Interface~CLI)。
除了传统的argparse,
Python还有类似click或docopt等工具。
谷歌今年发布的Fire,
使用另一个视角来解决同样的问题。
Fire是一个为任意Python项目自动生成命令行界面的开源库。
请注意,
重点是自动构建命令行界面,
基本上不需要再写代码或文档说明啦。
只需要调用一个Fire方法,
把它传输给需要生成命令行界面的内容即可
比如,函数、对象、类、字典,就算没有参数都可以,
这样Fire就会为所有代码生成一个命令行界面(CLI)。
请仔细阅读此指南,
通过例子理解它如何运作。
密切关注这个库,
它绝对能给你节省不少时间。
8、imbalance-learn
理想状态下,
我们有均衡的数据集可以用来训练模型,一切都很如意。可惜,真实世界不是这样的,现实任务更多是非均衡数据。比如,在预测伪造信用卡交易时,预期超过99.9%的绝大多数交易是合法的。如果只是训练朴素机器学习算法会让你很糟心,因此需要格外关注这类数据集。
好在这个问题已经解决了,
还有各种不同的技术解决方案。
Imbalanced-learn 这个Python包提供了多种技术解决方案,
可以让开发工作变得更轻松。
它与scikit-learn兼容,
并且是scikit-learn-contrib项目的一部分。有用!
9、FlashText
一般来说,查找或替换文本可以使用正则表达式。
正则表达式能妥妥的完成这项任务。
但是,需要查找几千个术语时,
正则表达式就慢死了。
FlashText能够更好地解决这个问题。
在作者最初的基准测试中,
它大幅提高了整个操作运行时间,
从5天缩减到5分钟。
FlashText的美妙之处在于不论查找多少术语
其运行时间都是一样的,
而正则表达式的运行时间则会随着术语数量的增加而线性增加。
FlashText证明了算法和数据结构设计的重要性,
由此可知,即便是简单的问题,
更好的算法也可以比更强的CPU有效。
10、Luminoth
声明:本库是由Tryolab的研发中心开发的。
当今世界图片满天飞,
一些应用急需理解这些图片的内容。
多亏深度学习技术的发展,
图像处理技术也取得了长足的进步。
Luminoth是基于TensorFlow和Sonnet构建的一个处理计算机视觉的Python工具箱。
目前,它通过快速R-CNN模型支持对象检测。
Luminoth不仅实现了这个特定模型,
它还是基于模块化构建的,可以扩展。
因此,
自定义现有组件或结合新的模型来解决复杂问题是可行的,
好好复用这些代码吧。
在构建深度学习模型时,
它提供了必要的开发工具:
转换图像数据为适用的格式
以供数据管道(TensorFlow的tfrecords)处理,
进行数据增强,
在一个或多个GPU上进行训练
(在处理大型数据集时,必须使用分布式训练)
运行评估指标,
轻松地在TensorFlow中实现可视化,
通过简单的API或浏览器界面部署训练模型,
供人操作。
还有,Luminoth可以很简单地整合谷歌云的机器学习引擎
就算你没有强大的GPU,
也可以和在本机一样,
轻松一个指令就能在云端进行模型训练。
更多优秀库:这些也不错
PyVips
可能你从没听说过libvips这个库。
这么说吧,
它是个像Pillow或ImageMagick这样的图像处理库,
并且支持很多图片格式。
然而,和其他库相比,libvips更快,
占用内存更少。
比如说,基准测试显示它比ImageMagick快3倍,
占用内存仅为1/15。
有关libvips的优势,请点此查阅。
PyVips是近期发布的Python版libvips,
兼容Python2.7和3.6,还有PyPy。
使用pip安装,内嵌式兼容绑定的老版本,无需修改代码。
如果在APP中进行图像处理,那一定要关注它。
Requestium
声明:本库为Tryolabs发布。
更多Python相关视频、资料加qun540305994免费获取
有时,你可能会在网上实现一些自动化操作。比如抓取网站,进行应用测试,或在网上填表,但又不想使用API,这时自动化就变得很必要。Python提供了非常优秀的Requests库,可以辅助进行这些操作。可惜,很多网站采用基于JavaScript的重客户端,这就意味着Requests获取的HTML代码中,根本就没有想要用于自动化操作的表单,更别提自动填表了!它取回的基本上都是React或Vue这些现代前端库在浏览器中生成的空DIV这类的代码。
可以通过反向工程处理JavaScript生成的代码,但是这需要花几个小时来编译,处理这些丑陋的JS代码。谢谢,还是算了吧。还有一个方法就是使用Selenium库,允许以程序化的方式和浏览器进行交互,并运行JavaScript代码。用了这个库就没啥问题了,但是它比占用资源很少的Requests慢太多了。
如果能以Requests为主,只有在需要Selenium的时候才无缝调用,这样不是更好?看看Requestium吧,它以内嵌方式取代Requests,而且干的不错。它还整合了Parsel,用它编写的页面查询元素选择器代码特别清晰。它还为诸如点击元素和确保在DOM中渲染内容这些通用操作提供了帮助。又一个网页自动化省时利器!
skorch
喜欢scikit-learn的API,但又得用PyTorch来进行工作?别担心,skorch这个打包器为PyTorch提供了像sklearn一样的界面。只要你熟悉这些库,就会觉得它的句法直白易懂。有了skorch,就可以将一些代码抽象化,从而把精力集中在真正重要的事上,比如干点儿数据科学。
你喜欢哪个呢?
相关文章:

Python 十大开源Python库,看看你熟悉几个?
嗨害大家好鸭!我是芝士❤ 对于码农来说, 关注的永远是新近有什么流行的、 既能解决问题又好用的利器。 本文就为你盘点十大开源Python库。 1、Pipenv 第一名非它莫属, 这个工具2017年初才发布, 但它已经能够影响每个Python开发…...

不愧是阿里开发的SpringBoot实战文档:入门+基础+进阶+项目,应有尽有
SpringBoot SpringBoot毋庸置疑,在Java开发中会因为项目流量太大需要切换到SpringCloud(SpringBoot)也会极为顺利。而且现在越来越多的公司都在采用SpringBoot,对SpringBoot关注和使用的开发者也越来越多了! SpringB…...

Vue(3)-vue中的Ajax、Vuex、路由及UI组件库
课程链接 目录4.Vue中的Ajax4.1.vue脚手架配置代理4.1.1.方法一4.1.2.方法二4.2.插槽5.Vuex5.1.理解Vuex5.1.1.概念5.1.2.何时使用?5.1.3.vuex原理5.2.vuex使用5.2.1.搭建vuex环境5.2.2.基本使用5.2.3.getters的使用5.2.4.四个map方法的使用5.2.5.模块化命名空间6.路…...

jwt 学习笔记
概述 JWT,Java Web Token,通过 JSON 形式作为 Web 应用中的令牌,用于在各方之间安全地将信息作为 JSON 对象传输,在数据传输过程中还可以完成数据加密、签名等相关处理 JWT 的作用如下: 授权:一旦用户登…...

网络安全实战从 0 到 1 彻底掌握 XXE
0x01 什么是 XXE个人认为,XXE 可以归结为一句话:构造恶意 DTD介绍 XXE 之前,我先来说一下普通的 XML 注入,这个的利用面比较狭窄,如果有的话应该也是逻辑漏洞。既然能插入 XML 代码,那我们肯定不能善罢甘休…...
如何安装 Composer
下载 Composer 安装前请务必确保已经正确安装了 PHP。打开命令行窗口并执行 php -v 查看是否正确输出版本号。 打开命令行并依次执行下列命令安装最新版本的 Composer: php -r "copy(https://install.phpcomposer.com/installer, composer-setup.php);"p…...

WPF 常用控件
WPF六种常用控件:布局控件、内容控件、带标题内容控件、条目控件、带标题条目控件和特殊内容控件(如:TextBox,TextBlock,Image等)。实例链接:WPF常用控件实例Window(窗体)Winodw窗体派生自ContentControl,有一个Content属性,里面可…...

河南工程学院蓝桥培训(2.21)
1,金币 461. 金币 - AcWing题库 #include <iostream> using namespace std; int n,a,ans,s; int main(){cin>>n;while(n--){if(a0)as;anss,a--;}cout<<ans;return 0; }...

新人使用Git获取远程仓库项目
前言 这篇git技术篇非常的简单基础,写它的原因很简单,因为现在很多的年轻人都很浮躁,刚入门就想学最牛x的,看不起基础的一些技术,比如说git操作、Linux基础命令,编程基础啥的。我身边有很多这样的年轻人&a…...

理解信号的
在日常生活中我们也经常面临许多的信号,手机通知、过红绿灯。。。这些信号在没有发生之前我们就知道这种信号产生我们需要干什么,那Linux里信号产生后,又怎么知道要做什么呢? -- 那当然是由程序员自己去设置啊 由于我们的用户空间…...

SpringSecurity学习(七)授权
授权 什么是权限管理 权限管理核心概念 SpringSecurity权限管理策略 基于URL地址的权限管理 基于方法的权限管理 一、权限管理 二、授权核心概念 在认证的过程成功之后会将当前用户登录信息保存到Authentication对象中,Authentication对象中有一个getAuthorities…...

【Vue3】模板语法
🏆今日学习目标:模板语法 😃创作者:颜颜yan_ ✨个人格言:生如芥子,心藏须弥 ⏰本期期数:第三期 🎉专栏系列:Vue3 文章目录前言声明响应式状态插值文本Attributeÿ…...

Linux基础
环境搭建:linux安装、远程连接常用命令:文件、目录、拷贝、移动、打包、压缩、文本编辑安装软件:文件上传、jdk、tomcat、mysql项目部署:Java应用、Python应用、日志查看、系统管理、用户权限Linux是一套免费使用、自由传播的操作…...

Spark-序列化、依赖关系、持久化
序列化 闭包检查 序列化方法和属性 依赖关系 RDD 血缘关系 RDD 窄依赖 RDD 宽依赖 RDD 任务划分 RDD 持久化 RDD Cache 缓存 RDD CheckPoint 检查点 缓存和检查点区别 序列化 闭包检查 从计算的角度, 算子以外的代码都是在 Driver 端执行, 算子里面的代码都是在 E…...

蓝桥杯刷题冲刺 | 倒计时16天
作者:指针不指南吗 专栏:蓝桥杯倒计时冲刺 🐾马上就要蓝桥杯了,最后的这几天尤为重要,不可懈怠哦🐾 文章目录1.青蛙跳杯子1.青蛙跳杯子 题目 链接: 青蛙跳杯子 - 蓝桥云课 (lanqiao.cn) X 星球的…...

Java设计模式-12 、建造者模式
建造者模式 (将一个 复杂对象的构建与它的表示分离,使得同样的构建过程可以创建不同的表示。) 建造者模式是一种创建型的模式,有一些对象的创建过程new 是很繁杂的。 什么时候去使用建造者模式 由上文可以得出在一些对象创建…...

一款全新的基于GPT4的Python神器,关键还免费
chartgpt大火之后,随之而来的就是一大类衍生物了。 然后,今天要给大家介绍的是一款基于GPT4的新一代辅助编程神器——Cursor。 它最值得介绍的地方在于它免费,我们可以直接利用它来辅助我们编程,真正做到事半功倍。 注意&#…...
上岸整理:2023前端面试题-vue,小程序,js,css
前端: 今年疫情结束后,前端行情不好,竞争压力很大,现在整理下个人认为面试很频繁的前端问题。 正题:无分类,因为面试官的问题也是随机的 一、基础 1、浏览器常见的报错信息与含义 2、304与204的区别&am…...

Linux下LED设备驱动开发(LED灯实现闪烁)
文章目录一、配置连接说明二、更新设备树(1)将led灯引脚添加到pinctrl子系统(2)设备树中添加LDE灯的设备树节点(3)编译更新设备树三、驱动开发与测试(1)编写设备驱动代码(…...

JavaEE-多线程中wait和notify都有哪些区别?
更多内容请点击了解 本篇文章将详细讲述wait和notify的区别,请往下看 目录 更多内容请点击了解 文章目录 一、wait和notify概念 二、wait()方法详解 三、notify()方法详解 代码如下: 3.1notifyAll()详解 四、wait和sleep的对比 一、wait和notif…...

C++实现分布式网络通信框架RPC(3)--rpc调用端
目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中,我们已经大致实现了rpc服务端的各项功能代…...

相机Camera日志实例分析之二:相机Camx【专业模式开启直方图拍照】单帧流程日志详解
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了: 这一篇我们开始讲: 目录 一、场景操作步骤 二、日志基础关键字分级如下 三、场景日志如下: 一、场景操作步骤 操作步…...

Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)
目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...
工程地质软件市场:发展现状、趋势与策略建议
一、引言 在工程建设领域,准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具,正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...
Python爬虫(二):爬虫完整流程
爬虫完整流程详解(7大核心步骤实战技巧) 一、爬虫完整工作流程 以下是爬虫开发的完整流程,我将结合具体技术点和实战经验展开说明: 1. 目标分析与前期准备 网站技术分析: 使用浏览器开发者工具(F12&…...

《基于Apache Flink的流处理》笔记
思维导图 1-3 章 4-7章 8-11 章 参考资料 源码: https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...
【Nginx】使用 Nginx+Lua 实现基于 IP 的访问频率限制
使用 NginxLua 实现基于 IP 的访问频率限制 在高并发场景下,限制某个 IP 的访问频率是非常重要的,可以有效防止恶意攻击或错误配置导致的服务宕机。以下是一个详细的实现方案,使用 Nginx 和 Lua 脚本结合 Redis 来实现基于 IP 的访问频率限制…...
LRU 缓存机制详解与实现(Java版) + 力扣解决
📌 LRU 缓存机制详解与实现(Java版) 一、📖 问题背景 在日常开发中,我们经常会使用 缓存(Cache) 来提升性能。但由于内存有限,缓存不可能无限增长,于是需要策略决定&am…...
【前端异常】JavaScript错误处理:分析 Uncaught (in promise) error
在前端开发中,JavaScript 异常是不可避免的。随着现代前端应用越来越多地使用异步操作(如 Promise、async/await 等),开发者常常会遇到 Uncaught (in promise) error 错误。这个错误是由于未正确处理 Promise 的拒绝(r…...
DAY 26 函数专题1
函数定义与参数知识点回顾:1. 函数的定义2. 变量作用域:局部变量和全局变量3. 函数的参数类型:位置参数、默认参数、不定参数4. 传递参数的手段:关键词参数5 题目1:计算圆的面积 任务: 编写一…...