Python 库大全(下)
格式化输出
模块 reprlib 提供了一份定制的 repr(),用于简洁 地展示各种大的或者多层嵌套的容器变量:
>>> import reprlib
>>> reprlib.repr(set(\'supercalifragilisticexpialidocious\'))
"{\'a\', \'c\', \'d\', \'e\', \'f\', \'g\', ...}"
模块 pprint以解释器可读的方式提供了更复杂的控制内置或用户自定义对象的打印方式的机制。 当输出结果长于一行时,这个「 漂亮的打印器 」就会通过添加换行符和缩进的方式更清晰地揭示数据的结构:
>>> import pprint
>>> t = [[[[\'black\', \'cyan\'], \'white\', [\'green\', \'red\']], [[\'magenta\',
... \'yellow\'], \'blue\']]]
...
>>> pprint.pprint(t, width=30)
[[[[\'black\', \'cyan\'],\'white\',[\'green\', \'red\']],[[\'magenta\', \'yellow\'],\'blue\']]]
模块 textwrap 格式化文本段落以适应指定宽度的屏幕:
>>> import textwrap
>>> doc = """The wrap() method is just like fill() except that it returns
... a list of strings instead of one big string with newlines to separate
... the wrapped lines."""
...
>>> print(textwrap.fill(doc, width=40))
The wrap() method is just like fill()
except that it returns a list of strings
instead of one big string with newlines
to separate the wrapped lines.
模块 locale使用一份包含地区习俗相关的数据库。locale 的 format 函数的 grouping 参数提供了一种直接通过分组符来格式化数字的方式:
>>> import locale
>>> locale.setlocale(locale.LC_ALL, \'English_United States.1252\')
\'English_United States.1252\'
>>> conv = locale.localeconv() # 获取一种惯例的映射
>>> x = 1234567.8
>>> locale.format("%d", x, grouping=True)
\'1,234,567\'
>>> locale.format_string("%s%.*f", (conv[\'currency_symbol\'],
... conv[\'frac_digits\'], x), grouping=True)
\'$1,234,567.80\'模板
string 模块包含了 丰富的模板 Template 类用来为终端用户简化语法的书写。这使得用户可以通过自定义语法设置他们的应用程序而不再是修改程序本身。
这种模板格式使用占位符 $ 和有效的 Python 标识符 (字母 数字和下划线)。通过使用大括号包裹占位符,我们可以在其后面添加更多不包含空格的数字和字母。如果你想输出打印占位符 $ 的话,你需要通过书写 $$ 来进行转义:
>>> from string import Template
>>> t = Template(\'${village}folk send $$10 to $cause.\')
>>> t.substitute(village=\'Nottingham\', cause=\'the ditch fund\')
\'Nottinghamfolk send $10 to the ditch fund.\'
当占位符没有被字典或者关键词参数占用时, substitute() 方法 会产生 KeyError。对于邮件合并风格的应用程序,上述方法可能会导致用户数据的缺失。这时候,你会更喜欢用 safe_substitute() 方法 — 当出现数据缺失的时候它会忽略对应的占位符:
>>> t = Template(\'Return the $item to $owner.\')
>>> d = dict(item=\'unladen swallow\')
>>> t.substitute(d)
Traceback (most recent call last):...
KeyError: \'owner\'
>>> t.safe_substitute(d)
\'Return the unladen swallow to $owner.\'
模板类的子类支持自定义设置占位符。例如,照片浏览器的批量重命名实用程序可以选择百分号作为占位符,当前日期,图像序列号或文件格式都可以这样做:
>>> import time, os.path
>>> photofiles = [\'img_1074.jpg\', \'img_1076.jpg\', \'img_1077.jpg\']
>>> class BatchRename(Template):
... delimiter = \'%\'
>>> fmt = input(\'Enter rename style (%d-date %n-seqnum %f-format): \')
Enter rename style (%d-date %n-seqnum %f-format): Ashley_%n%f>>> t = BatchRename(fmt)
>>> date = time.strftime(\'%d%b%y\')
>>> for i, filename in enumerate(photofiles):
... base, ext = os.path.splitext(filename)
... newname = t.substitute(d=date, n=i, f=ext)
... print(\'{0} --> {1}\'.format(filename, newname))
img_1074.jpg --> Ashley_0.jpg
img_1076.jpg --> Ashley_1.jpg
img_1077.jpg --> Ashley_2.jpg
模板的另一个应用是将应用程序的逻辑和输出格式进行分离。这就使得通过自定义模板替换 XML 文件,纯文本文件,HTML web 文件成为了可能。
使用二进制数据记录布局
struct 模块提供了 pack() 和 unpack() 两种功能,以便操作不同长度的二进制记录形式。下面我们将提供一个例子,来演示如何在不使用 zipfile 模块的情况下,通过头文件来进行循环操作。Pack 代码 “H” 和 “I” 分别代表两字节和四字节无符号数字。 “<” 表示这些数据是标准长度并且是按 little-endian 字节排列的。
import structwith open(\'myfile.zip\', \'rb\') as f:data = f.read()start = 0
for i in range(3): # 显示前三行的头文件start += 14fields = struct.unpack(\'<IIIHH\', data[start:start+16])crc32, comp_size, uncomp_size, filenamesize, extra_size = fieldsstart += 16filename = data[start:start+filenamesize]start += filenamesizeextra = data[start:start+extra_size]print(filename, hex(crc32), comp_size, uncomp_size)start += extra_size + comp_size # 跳过下一个头文件
多线程
线程化是一种用于对一些没有顺序依赖的任务进行解耦的技术。多线程可以通过在接受用户输入的同时保持其他任务在后台运行,提高应用的响应效率。并行地进行输入输出操作,并在另外一个线程中执行计算就是一个相关的例子。
下面的代码段展示了主程序保持运行的同时, threading 模块在后台执行其他任务的过程。
import threading, zipfileclass AsyncZip(threading.Thread):def __init__(self, infile, outfile):threading.Thread.__init__(self)self.infile = infileself.outfile = outfiledef run(self):f = zipfile.ZipFile(self.outfile, \'w\', zipfile.ZIP_DEFLATED)f.write(self.infile)f.close()print(\'后台解压文件完成:\', self.infile)background = AsyncZip(\'mydata.txt\', \'myarchive.zip\')
background.start()
print(\'主程序持续执行.\')background.join() # 等待后台任务完成
print(\'主程序等待后台任务结束.\')
多线程应用中主要的挑战是如何协调共享数据及其他资源的多个线程。threading 模块提供了一些同步的基本单元来解决这个问题,包括锁(lock)、事件(event)、条件变量(condition variable)、信号量(semaphore)。
在多线程应用中,微小的设计错误也能导致难以复现的问题。一种建议的协调多任务的方法为,将所有对同一资源的访问封装到一个线程中,然后在这个线程中使用 队列(queue) 处理其他线程的访问请求。在线程间通信中使用 queue模块中的 Queue 对象可以让应用变得更容易设计,更可读,也更可依赖。
日志管理
日志管理模块 logging 为我们提供了一个精致灵活的日志系统。通常,我们最简单的做法就是将日志信息输出到文件或者标准错误流 sys.stderr:
import logging
logging.debug(\'Debugging information\')
logging.info(\'Informational message\')
logging.warning(\'Warning:config file %s not found\', \'server.conf\')
logging.error(\'Error occurred\')
logging.critical(\'Critical error -- shutting down\')
上面代码产生标准输出如下:WARNING:root:Warning:config file server.conf not found
ERROR:root:Error occurred
CRITICAL:root:Critical error -- shutting down
默认情况下,INFO 和 DEBUG 级别的信息会被抑制,而输出则会被发送到标准错误流。其他的一些日志信息输出路径包括电子邮件,数据报,sockets, 甚至一台 HTTP 服务器。新的过滤器允许日志系统根据不同的信息级别 (DEBUG, INFO, WARNING, ERROR, 和 CRITICAL) 选择不同的输出方式。
我们可以直接通过 Python 程序配置日志管理系统,也可以通过从配置文件中读取配置信息进而设置日志系统。显然,配置文件的方式可以避免我们去修改应用程序。
弱引用
Python 自动进行内存管理(对大多数的对象进行引用计数和垃圾回收 ------ 垃圾回收 ------ 以循环利用)在最后一个引用消失后,内存会很快释放。
这个工作方式对大多数应用程序工作良好,但是偶尔会需要跟踪对象来做一些事。不幸的是,仅仅为跟踪它们创建引用也会使其长期存在。weakref 模块提供了不用创建引用的跟踪对象工具,一旦对象不再存在,它自动从弱引用表上删除并触发回调。典型的应用包括捕获难以构造的对象:
>>> import weakref, gc
>>> class A:
... def __init__(self, value):
... self.value = value
... def __repr__(self):
... return str(self.value)
...
>>> a = A(10) # 创建一个应用
>>> d = weakref.WeakValueDictionary()
>>> d[\'primary\'] = a
>>> d[\'primary\'] # 如果对象仍然是活动的,则获取它
10
>>> del a # 删除一个引用
>>> gc.collect() # 立即运行垃圾收集
0
>>> d[\'primary\'] # 条目被自动删除
Traceback (most recent call last):File "<stdin>", line 1, in <module>d[\'primary\'] # 条目被自动删除File "C:/python37/lib/weakref.py", line 46, in __getitem__o = self.data[key]()
KeyError: \'primary\'
处理列表的工具
内置的列表类型可以满足许多数据结构的需要。然而,有时候需要具有不同性能权衡的替代实现。
array 模块提供了一个 array() 对象,该对象和列表很像,只存储同构数据,并且存储比列表更紧凑。下面的示例说明一个数值数组被存储为两个字节的无符号二进制数 (类型码 「H」) 而不是 Python 整数对象的常规列表中 每个项通常的 16 字节:
>>> from array import array
>>> a = array(\'H\', [4000, 10, 700, 22222])
>>> sum(a)
26932
>>> a[1:3]
array(\'H\', [10, 700])
collections 模块提供了一个 deque() 对象, 该对象和列表很像,在左边有更块的附加和弹出速度,但是在中间的查找速度很慢。这些对象非常适合实现队列和广度优先树搜索:
>>> from collections import deque
>>> d = deque(["task1", "task2", "task3"])
>>> d.append("task4")
>>> print("Handling", d.popleft())
Handling task1
unsearched = deque([starting_node])
def breadth_first_search(unsearched):node = unsearched.popleft()for m in gen_moves(node):if is_goal(m):return munsearched.append(m)
除了可供选择的列表实现以外,该库还提供了其它的工具,如 bisect模块,具有操作排序列表的功能:
>>> import bisect
>>> scores = [(100, \'perl\'), (200, \'tcl\'), (400, \'lua\'), (500, \'python\')]
>>> bisect.insort(scores, (300, \'ruby\'))
>>> scores
[(100, \'perl\'), (200, \'tcl\'), (300, \'ruby\'), (400, \'lua\'), (500, \'python\')]heapq 模块提供了基于常规列表实现堆的函数。最小值项总位于零位置,这对于重复访问最小元素但不想运行完整列表排序的应用程序非常有用。>>> from heapq import heapify, heappop, heappush
>>> data = [1, 3, 5, 7, 9, 2, 4, 6, 8, 0]
>>> heapify(data) # 将列表重新排列为堆顺序
>>> heappush(data, -5) # 添加一个新项
>>> [heappop(data) for i in range(3)] # 获取三个最小的项
[-5, 0, 1]十进制浮点运算
关于 decimal 模块提供的 Decimal 数据结构用于十进制浮点运算的介绍。相较于内置的 float 实现的二进制浮点运算,本类对以下方面有特别地优化:
财经类或类似应用需要精确的十进制表示,
精细的操控,
对取整方法的规范以应对法律和监管上的需求,
对重要的使用十进制的场合持续追踪,或者说
对用户要求运行结果吻合人工计算结果的应用进行跟踪优化
例如,当计算一笔 70 美分的电话费中抽取的 5% 的税费时,十进制浮点运算的结果往往与二进制运算大相径庭。两者的差距会因为取整到邻近的美分而更加严重:
>>> from decimal import *
>>> round(Decimal(\'0.70\') * Decimal(\'1.05\'), 2)
Decimal(\'0.74\')
>>> round(.70 * 1.05, 2)
0.73
Decimal 的结果保留了尾部的零,从两位精确度的被乘数上自动推导出结果的 4 位精确度。Decimal 的数学过程模拟了人工计算的方法,从而避免了二进制浮点运算不能精确表示十进制数量时可能出现的问题。
完全表示法让 Decimal 类可以应用于模运算和数值相等的判断,而二进制浮点数常常难以胜任。
>>> Decimal(\'1.00\') % Decimal(\'.10\')
Decimal(\'0.00\')
>>> 1.00 % 0.10
0.09999999999999995>>> sum([Decimal(\'0.1\')]*10) == Decimal(\'1.0\')
True
>>> sum([0.1]*10) == 1.0
False
decimal 模块为算术运算提供了尽可能大的精确度:>>> getcontext().prec = 36
>>> Decimal(1) / Decimal(7)
Decimal(\'0.142857142857142857142857142857142857\')
相关文章:
Python 库大全(下)
格式化输出 模块 reprlib 提供了一份定制的 repr(),用于简洁 地展示各种大的或者多层嵌套的容器变量: >>> import reprlib >>> reprlib.repr(set(\supercalifragilisticexpialidocious\)) "{\a\, \c\, \d\, \e\, \f\, \g\, ...…...

如何用链表实现LRU缓存淘汰算法
链表学习 一、 缓存1.1缓存介绍1.2 缓存策略 二、链表结构2.1 单链表2.2 循环链表2.3 双向链表2.4 双向循环链表2.5 链表与数组性能对比 三、如何基于链表实现LRU缓存淘汰算法 一、 缓存 1.1缓存介绍 缓存是一种提高数据读取性能的技术,在硬件设计、软件开发中都有…...
【01】数据结构与算法基础-数据、数据元素、数据项和数据对象 | 数据类型和抽象数据类型 | 抽象数据类型的表示和C++实现
目录) 0.数据结构的研究内容1.数据、数据元素、数据项和数据对象1.1数据1.2数据元素(Data element)和数据项1.3数据项1.4数据对象1.5数据结构(Data Structure)1.6逻辑结构的种类1.7存储结构的种类2.数据类型和抽象数据类型2.1数据类型(Data Type)2.2抽象数据类型(Abstract …...
PHP匿名类的使用场景有哪些?PHP匿名类怎么用?有什么好处?PHP匿名类如何在运行时动态生成?
以下是一些使用匿名类的场景: 2. 简单的工厂模式:当需要在运行时动态创建一些简单的对象时,可以使用匿名类替代创建不必要的类定义和文件。 function createGreeter($name) {return new class($name) {private $name;public function __cons…...

【并发基础】一篇文章带你彻底搞懂Java线程中断的底层原理——interrupt()、interrupted()、isInterrupted()
目录 〇、Java线程中断与阻塞的区别 0.1 线程中断 0.2 线程阻塞 一、线程的中断 二、中断方法 2.1 void interrupt() 2.1.1 可中断的阻塞 2.1.2 不可中断的阻塞 2.1.3 实践案例 2.2 boolean isInterrupted() 2.3 boolean interrupted() 2.4 代码案例 三、源码分析…...

【c语言】函数的数据传递原理 | 数组传入函数方法
创作不易,本篇文章如果帮助到了你,还请点赞支持一下♡>𖥦<)!! 主页专栏有更多知识,如有疑问欢迎大家指正讨论,共同进步! 给大家跳段街舞感谢支持!ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ…...
vue3源码(3)——computed
Vue3中的computed底层源码主要是通过使用Proxy对象来实现的。下面是对Vue3中computed底层源码的详细解读: 在Vue3中,computed的实现是通过使用createComputed函数来创建的。createComputed函数接收两个参数:getter和setter。 在createComput…...

数学建模第七天:数学建模算法篇之插值及MATLAB实现
目录 一、前言 1、引例 2、拟合定义 3、拟合与插值的关系 二、拟合 1、线性最小二乘法求解 ①思路 ②解法 2、MATLAB对线性最小二乘拟合的实现 ①函数说明 ②求解例题 3、MATLAB实现非线性曲线拟合 ①lsqcurvefit函数 ②代码求解 4、MATLAB实现非线性最小二乘拟…...

RUST 每日一省:生命周期作用域
生命周期 一个变量的生命周期就是它从创建到销毁的整个过程。 作用域 我们声明的每个变量都有作用域。作用域其实是变量和值存在的环境。作用域是由一对花括号表示的。例如,使用块表达式会创建一个作用域,即任何以花括号开头和结尾的表达式。此…...

【过程8】——能量守恒视角总结感受
一、背景 另一个角度的看到,观望着过程中自己曾经类似的经历(小舅子的工作)。 时间久了,经历多了,感悟会更加的充实;最近自己对于人在维持能量的过程中也有很多的感悟,一并做一下总结 二、过程 1.人为什么天性不愿意…...

kong(4):限流配置
Kong 提供了 Rate Limiting 插件,实现对请求的限流功能,避免过大的请求量过大,将后端服务打挂。 Rate Limiting 支持秒/分/小时/日/月/年多种时间维度的限流,并且可以组合使用。例如说:限制每秒最 多 100 次请求&…...

人脸识别 Face Recognition 入门
人脸识别 Face Recognition 入门概述 总述传统特征方法深度学习方法损失函数改进基于欧几里德和距离的损失基于角度/余弦边距的损失SoftMax 损失及其变体 一级标题二级标题二级标题二级标题 找论文搭配 Sci-Hub 食用更佳 💪 Sci-Hub 实时更新 : https://tool.yovisu…...

【AI绘画】Midjourney的使用及程序示例
Midjourney 1.背景2.Midjourney的原理3.Midjourney的使用方法4.Midjourney的示例代码 1.背景 Midjourney 是一款基于深度学习的图像转换工具,其可以将一张图像转换成具有不同风格的图像,例如将一张照片转换成卡通风格的图像。Midjourney 基于 TensorFlow…...

无公网IP?教你在外远程访问本地wamp服务器「内网穿透」
目录 前言 1.Wamp服务器搭建 1.1 Wamp下载和安装 1.2 Wamp网页测试 2. Cpolar内网穿透的安装和注册 2.1 本地网页发布 2.2 Cpolar云端设置 2.3 Cpolar本地设置 3. 公网访问测试 4. 结语 前言 软件技术的发展日新月异,各种能方便我们生活、工作和娱乐的新…...
leetcode 628. 三个数的最大乘积
题目描述解题思路执行结果 leetcode 628. 三个数的最大乘积 题目描述 三个数的最大乘积 给你一个整型数组 nums ,在数组中找出由三个数组成的最大乘积,并输出这个乘积。 示例 1: 输入:nums [1,2,3] 输出:6 示例 2&…...

fork函数如何创建进程,exit/_exit函数如何使进程终止的详细分析与代码实现
🎊【进程通信与并发】专题正在持续更新中,进程,线程,IPC,线程池等的创建原理与运用✨,欢迎大家前往订阅本专题,获取更多详细信息哦🎏🎏🎏 🪔本系列…...

重置电脑时提示“缺少所需的驱动器分区”怎么办?
当您启动Windows 10电脑并收到“您的电脑/设备需修复”这个消息提示时,您会马上尝试修复电脑,如果您这样做了,您可能会收到一个“安装Windows的驱动器已被锁定”的信息。如果您尝试重置您的电脑,您可能会收到一条提示,…...

在KylinV10安装Dm8
前言 因为近期,业外和几个朋友想搞点有趣的项目玩玩,既然不以盈利为主,就> 主推国产化,所以这篇记录一下,我在KylinV10安装dm8.最近真的很忙,要负责专研一下国产化工具开发的事,还要负责tb级…...
「SQL面试题库」 No_46 交换工资
🍅 1、专栏介绍 「SQL面试题库」是由 不是西红柿 发起,全员免费参与的SQL学习活动。我每天发布1道SQL面试真题,从简单到困难,涵盖所有SQL知识点,我敢保证只要做完这100道题,不仅能轻松搞定面试࿰…...

SLAM论文速递【SLAM—— RDS-SLAM:基于语义分割方法的实时动态SLAM—4.24(1)
论文信息 题目: RDS-SLAM:Real-Time Dynamic SLAM Using Semantic Segmentation Methods RDS-SLAM:基于语义分割方法的实时动态SLAM论文地址: https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber9318990发表期刊: IEEE Access ( Volum…...

利用最小二乘法找圆心和半径
#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...

Flask RESTful 示例
目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务 中文乱码问题: 下面创建一个简单的Flask RESTful API示例。首先,我们需要创建环境,安装必要的依赖,然后…...

Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动
一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...

通过Wrangler CLI在worker中创建数据库和表
官方使用文档:Getting started Cloudflare D1 docs 创建数据库 在命令行中执行完成之后,会在本地和远程创建数据库: npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库: 现在,您的Cloudfla…...
c++ 面试题(1)-----深度优先搜索(DFS)实现
操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 地上有一个 m 行 n 列的方格,从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子,但不能进入行坐标和列坐标的数位之和大于 k 的格子。 例…...

12.找到字符串中所有字母异位词
🧠 题目解析 题目描述: 给定两个字符串 s 和 p,找出 s 中所有 p 的字母异位词的起始索引。 返回的答案以数组形式表示。 字母异位词定义: 若两个字符串包含的字符种类和出现次数完全相同,顺序无所谓,则互为…...

【论文阅读28】-CNN-BiLSTM-Attention-(2024)
本文把滑坡位移序列拆开、筛优质因子,再用 CNN-BiLSTM-Attention 来动态预测每个子序列,最后重构出总位移,预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵(S…...

Linux --进程控制
本文从以下五个方面来初步认识进程控制: 目录 进程创建 进程终止 进程等待 进程替换 模拟实现一个微型shell 进程创建 在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程,创建出来的进程就是子进程,原来的进程为父进程。…...
JS设计模式(4):观察者模式
JS设计模式(4):观察者模式 一、引入 在开发中,我们经常会遇到这样的场景:一个对象的状态变化需要自动通知其他对象,比如: 电商平台中,商品库存变化时需要通知所有订阅该商品的用户;新闻网站中࿰…...

AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机
这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机,因为在使用过程中发现 Airsim 对外部监控相机的描述模糊,而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置,最后在源码示例中找到了,所以感…...