Python 库大全(下)
格式化输出
模块 reprlib 提供了一份定制的 repr(),用于简洁 地展示各种大的或者多层嵌套的容器变量:
>>> import reprlib
>>> reprlib.repr(set(\'supercalifragilisticexpialidocious\'))
"{\'a\', \'c\', \'d\', \'e\', \'f\', \'g\', ...}"
模块 pprint以解释器可读的方式提供了更复杂的控制内置或用户自定义对象的打印方式的机制。 当输出结果长于一行时,这个「 漂亮的打印器 」就会通过添加换行符和缩进的方式更清晰地揭示数据的结构:
>>> import pprint
>>> t = [[[[\'black\', \'cyan\'], \'white\', [\'green\', \'red\']], [[\'magenta\',
... \'yellow\'], \'blue\']]]
...
>>> pprint.pprint(t, width=30)
[[[[\'black\', \'cyan\'],\'white\',[\'green\', \'red\']],[[\'magenta\', \'yellow\'],\'blue\']]]
模块 textwrap 格式化文本段落以适应指定宽度的屏幕:
>>> import textwrap
>>> doc = """The wrap() method is just like fill() except that it returns
... a list of strings instead of one big string with newlines to separate
... the wrapped lines."""
...
>>> print(textwrap.fill(doc, width=40))
The wrap() method is just like fill()
except that it returns a list of strings
instead of one big string with newlines
to separate the wrapped lines.
模块 locale使用一份包含地区习俗相关的数据库。locale 的 format 函数的 grouping 参数提供了一种直接通过分组符来格式化数字的方式:
>>> import locale
>>> locale.setlocale(locale.LC_ALL, \'English_United States.1252\')
\'English_United States.1252\'
>>> conv = locale.localeconv() # 获取一种惯例的映射
>>> x = 1234567.8
>>> locale.format("%d", x, grouping=True)
\'1,234,567\'
>>> locale.format_string("%s%.*f", (conv[\'currency_symbol\'],
... conv[\'frac_digits\'], x), grouping=True)
\'$1,234,567.80\'模板
string 模块包含了 丰富的模板 Template 类用来为终端用户简化语法的书写。这使得用户可以通过自定义语法设置他们的应用程序而不再是修改程序本身。
这种模板格式使用占位符 $ 和有效的 Python 标识符 (字母 数字和下划线)。通过使用大括号包裹占位符,我们可以在其后面添加更多不包含空格的数字和字母。如果你想输出打印占位符 $ 的话,你需要通过书写 $$ 来进行转义:
>>> from string import Template
>>> t = Template(\'${village}folk send $$10 to $cause.\')
>>> t.substitute(village=\'Nottingham\', cause=\'the ditch fund\')
\'Nottinghamfolk send $10 to the ditch fund.\'
当占位符没有被字典或者关键词参数占用时, substitute() 方法 会产生 KeyError。对于邮件合并风格的应用程序,上述方法可能会导致用户数据的缺失。这时候,你会更喜欢用 safe_substitute() 方法 — 当出现数据缺失的时候它会忽略对应的占位符:
>>> t = Template(\'Return the $item to $owner.\')
>>> d = dict(item=\'unladen swallow\')
>>> t.substitute(d)
Traceback (most recent call last):...
KeyError: \'owner\'
>>> t.safe_substitute(d)
\'Return the unladen swallow to $owner.\'
模板类的子类支持自定义设置占位符。例如,照片浏览器的批量重命名实用程序可以选择百分号作为占位符,当前日期,图像序列号或文件格式都可以这样做:
>>> import time, os.path
>>> photofiles = [\'img_1074.jpg\', \'img_1076.jpg\', \'img_1077.jpg\']
>>> class BatchRename(Template):
... delimiter = \'%\'
>>> fmt = input(\'Enter rename style (%d-date %n-seqnum %f-format): \')
Enter rename style (%d-date %n-seqnum %f-format): Ashley_%n%f>>> t = BatchRename(fmt)
>>> date = time.strftime(\'%d%b%y\')
>>> for i, filename in enumerate(photofiles):
... base, ext = os.path.splitext(filename)
... newname = t.substitute(d=date, n=i, f=ext)
... print(\'{0} --> {1}\'.format(filename, newname))
img_1074.jpg --> Ashley_0.jpg
img_1076.jpg --> Ashley_1.jpg
img_1077.jpg --> Ashley_2.jpg
模板的另一个应用是将应用程序的逻辑和输出格式进行分离。这就使得通过自定义模板替换 XML 文件,纯文本文件,HTML web 文件成为了可能。
使用二进制数据记录布局
struct 模块提供了 pack() 和 unpack() 两种功能,以便操作不同长度的二进制记录形式。下面我们将提供一个例子,来演示如何在不使用 zipfile 模块的情况下,通过头文件来进行循环操作。Pack 代码 “H” 和 “I” 分别代表两字节和四字节无符号数字。 “<” 表示这些数据是标准长度并且是按 little-endian 字节排列的。
import structwith open(\'myfile.zip\', \'rb\') as f:data = f.read()start = 0
for i in range(3): # 显示前三行的头文件start += 14fields = struct.unpack(\'<IIIHH\', data[start:start+16])crc32, comp_size, uncomp_size, filenamesize, extra_size = fieldsstart += 16filename = data[start:start+filenamesize]start += filenamesizeextra = data[start:start+extra_size]print(filename, hex(crc32), comp_size, uncomp_size)start += extra_size + comp_size # 跳过下一个头文件
多线程
线程化是一种用于对一些没有顺序依赖的任务进行解耦的技术。多线程可以通过在接受用户输入的同时保持其他任务在后台运行,提高应用的响应效率。并行地进行输入输出操作,并在另外一个线程中执行计算就是一个相关的例子。
下面的代码段展示了主程序保持运行的同时, threading 模块在后台执行其他任务的过程。
import threading, zipfileclass AsyncZip(threading.Thread):def __init__(self, infile, outfile):threading.Thread.__init__(self)self.infile = infileself.outfile = outfiledef run(self):f = zipfile.ZipFile(self.outfile, \'w\', zipfile.ZIP_DEFLATED)f.write(self.infile)f.close()print(\'后台解压文件完成:\', self.infile)background = AsyncZip(\'mydata.txt\', \'myarchive.zip\')
background.start()
print(\'主程序持续执行.\')background.join() # 等待后台任务完成
print(\'主程序等待后台任务结束.\')
多线程应用中主要的挑战是如何协调共享数据及其他资源的多个线程。threading 模块提供了一些同步的基本单元来解决这个问题,包括锁(lock)、事件(event)、条件变量(condition variable)、信号量(semaphore)。
在多线程应用中,微小的设计错误也能导致难以复现的问题。一种建议的协调多任务的方法为,将所有对同一资源的访问封装到一个线程中,然后在这个线程中使用 队列(queue) 处理其他线程的访问请求。在线程间通信中使用 queue模块中的 Queue 对象可以让应用变得更容易设计,更可读,也更可依赖。
日志管理
日志管理模块 logging 为我们提供了一个精致灵活的日志系统。通常,我们最简单的做法就是将日志信息输出到文件或者标准错误流 sys.stderr:
import logging
logging.debug(\'Debugging information\')
logging.info(\'Informational message\')
logging.warning(\'Warning:config file %s not found\', \'server.conf\')
logging.error(\'Error occurred\')
logging.critical(\'Critical error -- shutting down\')
上面代码产生标准输出如下:WARNING:root:Warning:config file server.conf not found
ERROR:root:Error occurred
CRITICAL:root:Critical error -- shutting down
默认情况下,INFO 和 DEBUG 级别的信息会被抑制,而输出则会被发送到标准错误流。其他的一些日志信息输出路径包括电子邮件,数据报,sockets, 甚至一台 HTTP 服务器。新的过滤器允许日志系统根据不同的信息级别 (DEBUG, INFO, WARNING, ERROR, 和 CRITICAL) 选择不同的输出方式。
我们可以直接通过 Python 程序配置日志管理系统,也可以通过从配置文件中读取配置信息进而设置日志系统。显然,配置文件的方式可以避免我们去修改应用程序。
弱引用
Python 自动进行内存管理(对大多数的对象进行引用计数和垃圾回收 ------ 垃圾回收 ------ 以循环利用)在最后一个引用消失后,内存会很快释放。
这个工作方式对大多数应用程序工作良好,但是偶尔会需要跟踪对象来做一些事。不幸的是,仅仅为跟踪它们创建引用也会使其长期存在。weakref 模块提供了不用创建引用的跟踪对象工具,一旦对象不再存在,它自动从弱引用表上删除并触发回调。典型的应用包括捕获难以构造的对象:
>>> import weakref, gc
>>> class A:
... def __init__(self, value):
... self.value = value
... def __repr__(self):
... return str(self.value)
...
>>> a = A(10) # 创建一个应用
>>> d = weakref.WeakValueDictionary()
>>> d[\'primary\'] = a
>>> d[\'primary\'] # 如果对象仍然是活动的,则获取它
10
>>> del a # 删除一个引用
>>> gc.collect() # 立即运行垃圾收集
0
>>> d[\'primary\'] # 条目被自动删除
Traceback (most recent call last):File "<stdin>", line 1, in <module>d[\'primary\'] # 条目被自动删除File "C:/python37/lib/weakref.py", line 46, in __getitem__o = self.data[key]()
KeyError: \'primary\'
处理列表的工具
内置的列表类型可以满足许多数据结构的需要。然而,有时候需要具有不同性能权衡的替代实现。
array 模块提供了一个 array() 对象,该对象和列表很像,只存储同构数据,并且存储比列表更紧凑。下面的示例说明一个数值数组被存储为两个字节的无符号二进制数 (类型码 「H」) 而不是 Python 整数对象的常规列表中 每个项通常的 16 字节:
>>> from array import array
>>> a = array(\'H\', [4000, 10, 700, 22222])
>>> sum(a)
26932
>>> a[1:3]
array(\'H\', [10, 700])
collections 模块提供了一个 deque() 对象, 该对象和列表很像,在左边有更块的附加和弹出速度,但是在中间的查找速度很慢。这些对象非常适合实现队列和广度优先树搜索:
>>> from collections import deque
>>> d = deque(["task1", "task2", "task3"])
>>> d.append("task4")
>>> print("Handling", d.popleft())
Handling task1
unsearched = deque([starting_node])
def breadth_first_search(unsearched):node = unsearched.popleft()for m in gen_moves(node):if is_goal(m):return munsearched.append(m)
除了可供选择的列表实现以外,该库还提供了其它的工具,如 bisect模块,具有操作排序列表的功能:
>>> import bisect
>>> scores = [(100, \'perl\'), (200, \'tcl\'), (400, \'lua\'), (500, \'python\')]
>>> bisect.insort(scores, (300, \'ruby\'))
>>> scores
[(100, \'perl\'), (200, \'tcl\'), (300, \'ruby\'), (400, \'lua\'), (500, \'python\')]heapq 模块提供了基于常规列表实现堆的函数。最小值项总位于零位置,这对于重复访问最小元素但不想运行完整列表排序的应用程序非常有用。>>> from heapq import heapify, heappop, heappush
>>> data = [1, 3, 5, 7, 9, 2, 4, 6, 8, 0]
>>> heapify(data) # 将列表重新排列为堆顺序
>>> heappush(data, -5) # 添加一个新项
>>> [heappop(data) for i in range(3)] # 获取三个最小的项
[-5, 0, 1]十进制浮点运算
关于 decimal 模块提供的 Decimal 数据结构用于十进制浮点运算的介绍。相较于内置的 float 实现的二进制浮点运算,本类对以下方面有特别地优化:
财经类或类似应用需要精确的十进制表示,
精细的操控,
对取整方法的规范以应对法律和监管上的需求,
对重要的使用十进制的场合持续追踪,或者说
对用户要求运行结果吻合人工计算结果的应用进行跟踪优化
例如,当计算一笔 70 美分的电话费中抽取的 5% 的税费时,十进制浮点运算的结果往往与二进制运算大相径庭。两者的差距会因为取整到邻近的美分而更加严重:
>>> from decimal import *
>>> round(Decimal(\'0.70\') * Decimal(\'1.05\'), 2)
Decimal(\'0.74\')
>>> round(.70 * 1.05, 2)
0.73
Decimal 的结果保留了尾部的零,从两位精确度的被乘数上自动推导出结果的 4 位精确度。Decimal 的数学过程模拟了人工计算的方法,从而避免了二进制浮点运算不能精确表示十进制数量时可能出现的问题。
完全表示法让 Decimal 类可以应用于模运算和数值相等的判断,而二进制浮点数常常难以胜任。
>>> Decimal(\'1.00\') % Decimal(\'.10\')
Decimal(\'0.00\')
>>> 1.00 % 0.10
0.09999999999999995>>> sum([Decimal(\'0.1\')]*10) == Decimal(\'1.0\')
True
>>> sum([0.1]*10) == 1.0
False
decimal 模块为算术运算提供了尽可能大的精确度:>>> getcontext().prec = 36
>>> Decimal(1) / Decimal(7)
Decimal(\'0.142857142857142857142857142857142857\')
相关文章:

Python 库大全(下)
格式化输出 模块 reprlib 提供了一份定制的 repr(),用于简洁 地展示各种大的或者多层嵌套的容器变量: >>> import reprlib >>> reprlib.repr(set(\supercalifragilisticexpialidocious\)) "{\a\, \c\, \d\, \e\, \f\, \g\, ...…...

如何用链表实现LRU缓存淘汰算法
链表学习 一、 缓存1.1缓存介绍1.2 缓存策略 二、链表结构2.1 单链表2.2 循环链表2.3 双向链表2.4 双向循环链表2.5 链表与数组性能对比 三、如何基于链表实现LRU缓存淘汰算法 一、 缓存 1.1缓存介绍 缓存是一种提高数据读取性能的技术,在硬件设计、软件开发中都有…...

【01】数据结构与算法基础-数据、数据元素、数据项和数据对象 | 数据类型和抽象数据类型 | 抽象数据类型的表示和C++实现
目录) 0.数据结构的研究内容1.数据、数据元素、数据项和数据对象1.1数据1.2数据元素(Data element)和数据项1.3数据项1.4数据对象1.5数据结构(Data Structure)1.6逻辑结构的种类1.7存储结构的种类2.数据类型和抽象数据类型2.1数据类型(Data Type)2.2抽象数据类型(Abstract …...

PHP匿名类的使用场景有哪些?PHP匿名类怎么用?有什么好处?PHP匿名类如何在运行时动态生成?
以下是一些使用匿名类的场景: 2. 简单的工厂模式:当需要在运行时动态创建一些简单的对象时,可以使用匿名类替代创建不必要的类定义和文件。 function createGreeter($name) {return new class($name) {private $name;public function __cons…...

【并发基础】一篇文章带你彻底搞懂Java线程中断的底层原理——interrupt()、interrupted()、isInterrupted()
目录 〇、Java线程中断与阻塞的区别 0.1 线程中断 0.2 线程阻塞 一、线程的中断 二、中断方法 2.1 void interrupt() 2.1.1 可中断的阻塞 2.1.2 不可中断的阻塞 2.1.3 实践案例 2.2 boolean isInterrupted() 2.3 boolean interrupted() 2.4 代码案例 三、源码分析…...

【c语言】函数的数据传递原理 | 数组传入函数方法
创作不易,本篇文章如果帮助到了你,还请点赞支持一下♡>𖥦<)!! 主页专栏有更多知识,如有疑问欢迎大家指正讨论,共同进步! 给大家跳段街舞感谢支持!ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ…...

vue3源码(3)——computed
Vue3中的computed底层源码主要是通过使用Proxy对象来实现的。下面是对Vue3中computed底层源码的详细解读: 在Vue3中,computed的实现是通过使用createComputed函数来创建的。createComputed函数接收两个参数:getter和setter。 在createComput…...

数学建模第七天:数学建模算法篇之插值及MATLAB实现
目录 一、前言 1、引例 2、拟合定义 3、拟合与插值的关系 二、拟合 1、线性最小二乘法求解 ①思路 ②解法 2、MATLAB对线性最小二乘拟合的实现 ①函数说明 ②求解例题 3、MATLAB实现非线性曲线拟合 ①lsqcurvefit函数 ②代码求解 4、MATLAB实现非线性最小二乘拟…...

RUST 每日一省:生命周期作用域
生命周期 一个变量的生命周期就是它从创建到销毁的整个过程。 作用域 我们声明的每个变量都有作用域。作用域其实是变量和值存在的环境。作用域是由一对花括号表示的。例如,使用块表达式会创建一个作用域,即任何以花括号开头和结尾的表达式。此…...

【过程8】——能量守恒视角总结感受
一、背景 另一个角度的看到,观望着过程中自己曾经类似的经历(小舅子的工作)。 时间久了,经历多了,感悟会更加的充实;最近自己对于人在维持能量的过程中也有很多的感悟,一并做一下总结 二、过程 1.人为什么天性不愿意…...

kong(4):限流配置
Kong 提供了 Rate Limiting 插件,实现对请求的限流功能,避免过大的请求量过大,将后端服务打挂。 Rate Limiting 支持秒/分/小时/日/月/年多种时间维度的限流,并且可以组合使用。例如说:限制每秒最 多 100 次请求&…...

人脸识别 Face Recognition 入门
人脸识别 Face Recognition 入门概述 总述传统特征方法深度学习方法损失函数改进基于欧几里德和距离的损失基于角度/余弦边距的损失SoftMax 损失及其变体 一级标题二级标题二级标题二级标题 找论文搭配 Sci-Hub 食用更佳 💪 Sci-Hub 实时更新 : https://tool.yovisu…...

【AI绘画】Midjourney的使用及程序示例
Midjourney 1.背景2.Midjourney的原理3.Midjourney的使用方法4.Midjourney的示例代码 1.背景 Midjourney 是一款基于深度学习的图像转换工具,其可以将一张图像转换成具有不同风格的图像,例如将一张照片转换成卡通风格的图像。Midjourney 基于 TensorFlow…...

无公网IP?教你在外远程访问本地wamp服务器「内网穿透」
目录 前言 1.Wamp服务器搭建 1.1 Wamp下载和安装 1.2 Wamp网页测试 2. Cpolar内网穿透的安装和注册 2.1 本地网页发布 2.2 Cpolar云端设置 2.3 Cpolar本地设置 3. 公网访问测试 4. 结语 前言 软件技术的发展日新月异,各种能方便我们生活、工作和娱乐的新…...

leetcode 628. 三个数的最大乘积
题目描述解题思路执行结果 leetcode 628. 三个数的最大乘积 题目描述 三个数的最大乘积 给你一个整型数组 nums ,在数组中找出由三个数组成的最大乘积,并输出这个乘积。 示例 1: 输入:nums [1,2,3] 输出:6 示例 2&…...

fork函数如何创建进程,exit/_exit函数如何使进程终止的详细分析与代码实现
🎊【进程通信与并发】专题正在持续更新中,进程,线程,IPC,线程池等的创建原理与运用✨,欢迎大家前往订阅本专题,获取更多详细信息哦🎏🎏🎏 🪔本系列…...

重置电脑时提示“缺少所需的驱动器分区”怎么办?
当您启动Windows 10电脑并收到“您的电脑/设备需修复”这个消息提示时,您会马上尝试修复电脑,如果您这样做了,您可能会收到一个“安装Windows的驱动器已被锁定”的信息。如果您尝试重置您的电脑,您可能会收到一条提示,…...

在KylinV10安装Dm8
前言 因为近期,业外和几个朋友想搞点有趣的项目玩玩,既然不以盈利为主,就> 主推国产化,所以这篇记录一下,我在KylinV10安装dm8.最近真的很忙,要负责专研一下国产化工具开发的事,还要负责tb级…...

「SQL面试题库」 No_46 交换工资
🍅 1、专栏介绍 「SQL面试题库」是由 不是西红柿 发起,全员免费参与的SQL学习活动。我每天发布1道SQL面试真题,从简单到困难,涵盖所有SQL知识点,我敢保证只要做完这100道题,不仅能轻松搞定面试࿰…...

SLAM论文速递【SLAM—— RDS-SLAM:基于语义分割方法的实时动态SLAM—4.24(1)
论文信息 题目: RDS-SLAM:Real-Time Dynamic SLAM Using Semantic Segmentation Methods RDS-SLAM:基于语义分割方法的实时动态SLAM论文地址: https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber9318990发表期刊: IEEE Access ( Volum…...

OJ练习第82题——填充书架
填充书架 力扣链接:1105. 填充书架 题目描述 给定一个数组 books ,其中 books[i] [thicknessi, heighti] 表示第 i 本书的厚度和高度。你也会得到一个整数 shelfWidth 。 按顺序 将这些书摆放到总宽度为 shelfWidth 的书架上。 先选几本书放在书架…...

OHOS IDE和SDK的安装方法
参照OpenHarmony应用开发环境安装流程,下载安装OHOS的IDE,过程中需要全程联网。 IDE,安装至D:\Tools\Huawei\DevEcoStudio。 IDE安装成功之后,按照提示下载安装HOS和OHOS的SDK。 nodejs,安装至D:\Tools\Huawei\nodejs…...

New Year Garland(计数类DP)
New Year Garland 题意 用m种颜色的球装饰n层的圣诞树,圣诞树的第i层由 l i l_{i} li个彩球串成,且同一层相邻的球颜色不同,相邻的层之间彩球颜色的集合不同,问有多少种方案,对p取模。 分析 首先先计算每一…...

32岁阿里P7,把简历改成不知名小公司,学历改成普通本科,工作内容不变,投简历全挂!...
hr靠什么来招人? 一位猎头讲述了自己和朋友打赌的故事: 朋友在阿里云,32岁,P7,他把简历上的公司改成不知名,学历改成普通本科,工作内容不变,结果投其他公司(比如京东&…...

从三室心脏MRI影像检测主动脉瓣病变
Detecting Aortic Valve Pathology from the 3-Chamber Cine Cardiac MRI View 摘要 背景 心脏磁共振(CMR)是量化心脏容量、功能和血流量的金标准。定制的MR脉冲序列定义了对比机制,采集几何形状和定时,可以在CMR期间应用,以实现独特的组织…...

【JavaWeb】JavaScript
1、JavaScript 介绍 Javascript 语言诞生主要是完成页面的数据验证。因此它运行在客户端,需要运行浏览器来解析执行 JavaScript 代码。 JS 是 Netscape 网景公司的产品,最早取名为 LiveScript;为了吸引更多 java 程序员。更名为 JavaScript。 JS 是弱…...

Apache Doris 1.2.4 Release 版本正式发布|版本通告
亲爱的社区小伙伴们,我们很高兴地宣布,Apache Doris 于 2023 年 4 月 27 日迎来 1.2.4 Release 版本的正式发布!在 1.2.4 版本中,Doris 团队已经修复了自 1.2.3 版本发布以来近 150 个问题或性能改进项。同时,1.2.4 版…...

【C++STL】map
文章目录 一. map的介绍二. map的使用结束语 一. map的介绍 map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素在map中,键值key通常用于排序和唯一地标识元素,而value中存储与此键值…...

vue2项目PC端如何适配不同分辨率屏幕
项目构建:基于vue-cli3构建,使用postcss-px2rem px2rem-loader进行rem适配 实现原理:每次打包,webpack通过使用插件postcss-px2rem,帮我们自动将px单位转换成rem单位前方有坑:UI框架部分组件使用JavaScript…...

CorelDRAW2023最新版本图像设计软件
CorelDRAW 2023作为最新版的图像设计软件,在功能上做了较大提升,主要新的功能特性如下: 1. 全新界面设计:采用简约现代的 UI 设计,菜单和工具重新组织,更加直观易用。提供自动提示与设计指导,易于上手。 2. 智能工具与提示:运用 AI技术对用户操作行为和设计习惯进行分析,给出…...