当前位置: 首页 > news >正文

注册表模式:使用注册表和装饰器函数的模块化设计

在现代软件开发中,模块化设计是提高代码可维护性和可扩展性的关键技术之一。本文将探讨如何使用注册表(Registry)和装饰器函数(Decorator Function)来实现模块化设计,提升代码的灵活性和可扩展性。

什么是注册表(Registry)?

注册表是一种设计模式,用于集中管理和访问不同模块。在 Python 中,注册表通常是一个字典,用来存储模块名称和模块类对象的映射关系。通过注册表,可以方便地对模块进行注册、获取和列出操作,从而实现模块化管理。

基本的注册表实现

以下是一个基本的注册表实现:

from loguru import loggerclass Registry(object):"""This class is used to register some modules to registry by a repo name."""def __init__(self, name: str):self._name = nameself._modules = {}@propertydef name(self):return self._name@propertydef modules(self):return self._modulesdef list(self):for m in self._modules.keys():logger.info(f'{self._name}\t{m}')def get(self, module_key):return self._modules.get(module_key, None)def _register_module(self, module_name=None, module_cls=None, force=False):if module_name is None:module_name = module_cls.__name__if module_name in self._modules and not force:raise KeyError(f'{module_name} is already registered in {self._name}')self._modules[module_name] = module_clsmodule_cls._name = module_namedef register_module(self, module_name: str = None, module_cls: type = None, force=False):if not (module_name is None or isinstance(module_name, str)):raise TypeError(f'module_name must be either of None, str, got {type(module_name)}')if module_cls is not None:self._register_module(module_name=module_name, module_cls=module_cls, force=force)return module_clsdef _register(module_cls):self._register_module(module_name=module_name, module_cls=module_cls, force=force)return module_clsreturn _register

特别注意register_module中的_register,register_module 方法根据传入的 module_namemodule_cls 参数,返回一个装饰器函数 _register

使用装饰器函数注册模块

装饰器函数是一种高阶函数,可以在不改变原函数或类的前提下,动态地增加功能。在注册表模式中,装饰器函数可以用于注册模块,简化模块注册的过程。

以下是如何使用装饰器函数注册模块的示例:

DATASETS = Registry('Datasets')@DATASETS.register_module('ChineseDataset')
class ChineseDataset:def __init__(self, oss_dir, max_sample_per_cat=50, shuffle=False):self.oss_dir = oss_dirself.max_sample_per_cat = max_sample_per_catself.shuffle = shuffledef info(self):# 实现具体的逻辑passdef format(self, res):# 实现具体的逻辑pass

在这个示例中,ChineseDataset 类通过装饰器函数 @DATASETS.register_module('ChineseDataset') 自动注册到 DATASETS 注册表中。

装饰器函数的工作原理

在上面的代码中,@DATASETS.register_module('ChineseDataset') 是一个装饰器函数调用。这个装饰器函数的工作原理如下:

  1. DATASETS.register_module('ChineseDataset') 返回一个装饰器函数 _register
  2. @_register 装饰器应用于 ChineseDataset 类,将其作为参数传递给 _register 函数。
  3. _register 函数内部调用 _register_module 方法,将 ChineseDataset 类注册到 DATASETS 注册表中。

具体的 _register 函数定义如下:

def register_module(self, module_name: str = None, module_cls: type = None, force=False):if not (module_name is None or isinstance(module_name, str)):raise TypeError(f'module_name must be either of None, str, got {type(module_name)}')if module_cls is not None:self._register_module(module_name=module_name, module_cls=module_cls, force=force)return module_clsdef _register(module_cls):self._register_module(module_name=module_name, module_cls=module_cls, force=force)return module_clsreturn _register

在这个实现中,register_module 方法根据传入的 module_namemodule_cls 参数,返回一个装饰器函数 _register。当 ChineseDataset 类被装饰时,_register 函数将其注册到 DATASETS 注册表中。

实例化 ChineseDataset

实例化 ChineseDataset 类的步骤发生在 deal_one_dataset 函数中,通过以下代码实现:

ds = DATASETS.get(name)(oss_path)

这段代码首先通过 DATASETS.get(name) 获取注册的 ChineseDataset 类,然后通过 (oss_path) 对其进行实例化。这样,ChineseDataset 类的一个实例就被创建,并存储在 ds 变量中,用于后续的数据处理操作。

为了更清晰地解释,让我们回顾一下实例化 ChineseDataset 类的完整过程。在下面的代码片段中,实例化过程发生在 deal_one_dataset 函数中:

import os, json, argparse
from tqdm import tqdm
import multiprocessing as mp
from src import DATASETS, utilsdef parse_args():parser = argparse.ArgumentParser(description='data_parsing', formatter_class=argparse.RawTextHelpFormatter)parser.add_argument("--name", type=str, default='ChineseDataset', help="dataset name")parser.add_argument("--oss-dir", type=str, default='/root/dengbing/bigdata/benchmark/extract/ChineseDataset/', help="oss directory of the dataset")parser.add_argument("--save-path", type=str, default='output.jsonl', help="path for the generated jsonl")args = parser.parse_args()return argsdef deal_one_dataset(name, oss_path):ds = DATASETS.get(name)(oss_path)  # 这里实例化 ChineseDataset 类res = ds.info()res = ds.format(res)return resif __name__ == "__main__":args = parse_args()with open(args.save_path, 'w') as outfile:res = deal_one_dataset(args.name, args.oss_dir)for r in res:j = utils.format_decimals(r)outfile.write(json.dumps(j, ensure_ascii=False) + '\n')

具体步骤

  1. 解析命令行参数

    • parse_args 函数解析命令行参数,获取数据集名称(--name)、OSS 目录(--oss-dir)和保存路径(--save-path)。
  2. 处理单个数据集

    • deal_one_dataset 函数根据传入的 nameoss_path 参数,处理单个数据集。
    • 在这一步中,DATASETS.get(name) 获取已经注册的 ChineseDataset 类,然后通过 (oss_path) 对其进行实例化。
  3. 实例化 ChineseDataset

    • ds = DATASETS.get(name)(oss_path) 实际上是两步操作:
      • DATASETS.get(name) 获取注册在 DATASETS 注册表中的 ChineseDataset 类。
      • (oss_path) 调用类的构造函数,创建一个 ChineseDataset 类的实例,并传递 oss_path 参数。
  4. 调用数据集方法

    • res = ds.info() 调用实例的 info 方法,获取数据集信息。
    • res = ds.format(res) 调用实例的 format 方法,格式化数据集信息。
  5. 保存结果

    • 主程序部分将处理后的数据集结果保存到指定的 JSONL 文件中。
总结

通过使用装饰器函数,ChineseDataset 类可以自动注册到 DATASETS 注册表中,而不需要显式地调用注册方法。这种方式简化了模块的注册过程,使代码更加简洁和易于维护。

装饰器函数和注册表的结合使用,提高了代码的灵活性和可扩展性,使得模块化设计更加高效。在实际开发中,这种设计模式可以广泛应用于插件系统、数据处理管道和其他需要动态管理模块的场景。

相关文章:

注册表模式:使用注册表和装饰器函数的模块化设计

在现代软件开发中,模块化设计是提高代码可维护性和可扩展性的关键技术之一。本文将探讨如何使用注册表(Registry)和装饰器函数(Decorator Function)来实现模块化设计,提升代码的灵活性和可扩展性。 什么是…...

怎样将vue项目 部署在ngixn的子目录下

如果同一服务器的80端口下,需要部署两个或以上数量的vue项目,那么就需要将其中一个vue项目部署在根目录下,其他的项目部署在子目录下. 像这样的配置 访问根目录 / 访问灭火器后台管理,访问 /mall/ 访问商城的后台管理 那么商场的vue项目,这样配置,才能在/mall/下正常访问? 1…...

FPGA开发:Verilog数字设计基础

EDA技术 EDA指Electronic Design Automation,翻译为:电子设计自动化,最早发源于美国的影像技术,主要应用于集成电路设计、FPGA应用、IC设计制造、PCB设计上面。 而EDA技术就是指以计算机为工具,设计者在EDA软件平台上…...

哈希表,算法

一.什么是哈希表 哈希表是一种用于快速数据存取的数据结构。它通过哈希函数将键(key)映射到表中的一个位置,从而实现高效的插入、删除和查找操作。 二.哈希冲突 哈希冲突发生在多个键通过哈希函数映射到哈希表的同一位置时。由于哈希表的大…...

Java数组的定义及遍历

数组的声明 长度不能超过定义的长度。超过则会报错通过下标来访问 数组的遍历 最常用最简单的方法是增强for循环。...

【电路笔记】-反相运算放大器

反相运算放大器 文章目录 反相运算放大器1、概述2、理想反相运算放大器3、实际反相运算放大器3.1 闭环增益3.2 输入阻抗3.3 输出阻抗4、反相运算放大器示例5、总结1、概述 上一篇关于同相运算放大器的文章中已介绍了该运算放大器配置的所有细节,该配置在同相引脚 (+) 上获取输…...

【电子通识】半导体工艺——刻蚀工艺

在文章【电子通识】半导体工艺——光刻工艺中我们讲到人们经常将 Photo Lithography(光刻)缩写成 Photo。光刻工艺是在晶圆上利用光线来照射带有电路图形的光罩,从而绘制电路。光刻工艺类似于洗印黑白照片,将在胶片上形成的图像印…...

vue-router 之如何在模版(template)中获取路由配置信息?

vue-router 之如何在模版(template)中获取路由配置信息? 获取当前路由信息 在vue3 中,route通常使用useRoute()钩子获取的,**代表当前激活的路由信息。**它包含了与当前路由相关的数据,比如路径、参数、查…...

HPL 源码结构分析

文件夹结构: $ cd /home/hipper/ex_hpl_hpcg/ $ pwd $ mkdir ./openmpi $mkdir ./openblas $mkdir ./hpl $ tree 1. 安装openmpi 1.1.1 使用Makefile下载配置编译安装 openmpi Makefile: all:wget https://download.open-mpi.org/release/open-m…...

Java代码审计篇 | ofcms系统审计思路讲解 - 篇3 | 文件上传漏洞审计

文章目录 0. 前言1. 文件上传代码审计【有1处】1.1 可疑点1【无漏洞】1.1.1 直接搜索upload关键字1.1.2 选择第一个,点进去分析一下1.1.3 分析this.getFile()方法1.1.4 分析new MultipartRequest(request, uploadPath)1.1.5 分析isSafeFile()方法1.1.6 分析request.…...

【Kubernetes】常见面试题汇总(五)

目录 13.简述 Kubernetes Replica Set 和 Replication Controller 之间有什么区别? 14.简述 kube-proxy 作用? 15.简述 kube-proxy iptables 原理? 16.简述 kube-proxy ipvs 原理? 13.简述 Kubernetes Replica Set 和 Replicat…...

MySQL 解决时区相关问题

在使用 MySQL 的过程中,你可能会遇到时区相关问题,比如说时间显示错误、时区不是东八 区、程序取得的时间和数据库存储的时间不一致等等问题。其实,这些问题都与数据库时区设 置有关。 MySQL Server 中有 2 个环境变量和时区有关,…...

SpringSecurity Context 中 获取 和 更改 当前用户信息的问题

SpringSecurity Context 获取和更改用户信息的问题 SecurityContext 异步线程中获取用户信息 今天在做项目时遇到了一个问题,我需要获取当前用户的 ID。之前,前端并没有存储用户信息,我一直是在后端的 service 中通过 SecurityContext 来获…...

Makefile的四种赋值运算符

Makefile有四种赋值运算符:简单赋值(:)、递归赋值()、条件赋值(?)和追加赋值() 1. 简单赋值(:) 作用:覆盖之前的值。若在多次简单赋…...

framebuffer

framebuffer:帧缓冲、帧缓存 Linux内核为显示提供的一套应用程序接口(驱动内核支持) 分辨率:像素点的总和 像素点: 显示屏:800*600(横向有800个像素点,纵向有600个像素点&#x…...

7.科学计算模块Numpy(4)ndarray数组的常用操作(二)

引言 书接上回,numpy能作为python中最受欢迎的数据处理模块,脱离不了它最核心的部件——ndarray数组。那么,我们今天就来了解一下numpy中对ndarray的常用操作。 通过阅读本篇博客,你可以: 1.掌握ndarray数组的分割 …...

抖音评论区截流脚本软件详细使用教学,抖音私域获客引流的五种方法。

1.先说下什么是抖音截流玩法,截流顾名思义就是在别的博主的视频下面去截流评论潜在流量,然后用评论文案的形式或者其它方式吸引用户加我们的私域~ 玩截流一定不是主动去私信别人,这个就不叫截流了,且一个账号私信多了一定会降权和…...

Linux_kernel移植uboot07

一、移植 根据硬件平台的差异,将代码进行少量的修改,修改过后的代码在目标平台上运行起来 移植还需要考虑硬件环境,驱动只需要考虑内核的环境 二、移植内容 1、移植Uboot uboot属于bootloader的一种,还有其他的bootloader&#x…...

Day-04-QFile打开文件的两种方式

一、UI界面设置两个按键&#xff0c;并直接转到槽函数 二、两种代码展示 #include <QFile> #include <QDebug>//此两种方式中调用函数&#xff0c;应包含的头文件void Widget::on_btnReadFile01_clicked()//第一种打开方式 {//1. 打开文件QFile file;file.setFile…...

第三部分:4---进程地址空间

目录 数组的空间分配解析&#xff1a; 物理地址和虚拟地址&#xff1a; 虚拟地址空间&#xff1a; 进程地址空间的本质&#xff1a; 为什么要有进程地址空间&#xff1f; 页表对进程访问内存的检查&#xff1a; 进程地址空间和页表如何关联起来&#xff1f; 进程的独立…...

AI Agent与Agentic AI:原理、应用、挑战与未来展望

文章目录 一、引言二、AI Agent与Agentic AI的兴起2.1 技术契机与生态成熟2.2 Agent的定义与特征2.3 Agent的发展历程 三、AI Agent的核心技术栈解密3.1 感知模块代码示例&#xff1a;使用Python和OpenCV进行图像识别 3.2 认知与决策模块代码示例&#xff1a;使用OpenAI GPT-3进…...

深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出&#xff1a;JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中&#xff0c;随机数的生成看似简单&#xff0c;却隐藏着许多玄机。无论是生成密码、加密密钥&#xff0c;还是创建安全令牌&#xff0c;随机数的质量直接关系到系统的安全性。Jav…...

如何在最短时间内提升打ctf(web)的水平?

刚刚刷完2遍 bugku 的 web 题&#xff0c;前来答题。 每个人对刷题理解是不同&#xff0c;有的人是看了writeup就等于刷了&#xff0c;有的人是收藏了writeup就等于刷了&#xff0c;有的人是跟着writeup做了一遍就等于刷了&#xff0c;还有的人是独立思考做了一遍就等于刷了。…...

C# 求圆面积的程序(Program to find area of a circle)

给定半径r&#xff0c;求圆的面积。圆的面积应精确到小数点后5位。 例子&#xff1a; 输入&#xff1a;r 5 输出&#xff1a;78.53982 解释&#xff1a;由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982&#xff0c;因为我们只保留小数点后 5 位数字。 输…...

九天毕昇深度学习平台 | 如何安装库?

pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子&#xff1a; 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...

AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机

这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机&#xff0c;因为在使用过程中发现 Airsim 对外部监控相机的描述模糊&#xff0c;而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置&#xff0c;最后在源码示例中找到了&#xff0c;所以感…...

掌握 HTTP 请求:理解 cURL GET 语法

cURL 是一个强大的命令行工具&#xff0c;用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中&#xff0c;cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。 一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...

uniapp 小程序 学习(一)

利用Hbuilder 创建项目 运行到内置浏览器看效果 下载微信小程序 安装到Hbuilder 下载地址 &#xff1a;开发者工具默认安装 设置服务端口号 在Hbuilder中设置微信小程序 配置 找到运行设置&#xff0c;将微信开发者工具放入到Hbuilder中&#xff0c; 打开后出现 如下 bug 解…...

前端高频面试题2:浏览器/计算机网络

本专栏相关链接 前端高频面试题1&#xff1a;HTML/CSS 前端高频面试题2&#xff1a;浏览器/计算机网络 前端高频面试题3&#xff1a;JavaScript 1.什么是强缓存、协商缓存&#xff1f; 强缓存&#xff1a; 当浏览器请求资源时&#xff0c;首先检查本地缓存是否命中。如果命…...

OCR MLLM Evaluation

为什么需要评测体系&#xff1f;——背景与矛盾 ​​ 能干的事&#xff1a;​​ 看清楚发票、身份证上的字&#xff08;准确率>90%&#xff09;&#xff0c;速度飞快&#xff08;眨眼间完成&#xff09;。​​干不了的事&#xff1a;​​ 碰到复杂表格&#xff08;合并单元…...