当前位置: 首页 > article >正文

PP-DocLayoutV3实操手册:批量分析日志统计(平均耗时/类别召回率/置信分布)

PP-DocLayoutV3实操手册批量分析日志统计平均耗时/类别召回率/置信分布1. 引言从单张测试到批量分析如果你已经用上了PP-DocLayoutV3的Web界面上传几张图片看着它把文档里的标题、文本、表格一个个框出来肯定会觉得挺有意思的。但用过几次后你可能就会开始想一些更实际的问题这玩意儿到底有多快处理100张图要多久能不能赶上我批量处理PDF的需求它识别得准不准说能识别25种布局但每种到底能认出来多少会不会漏掉很多表格那个置信度滑块到底该怎么调0.5和0.7差别有多大有没有一个“黄金数值”这些问题靠手动一张张上传、肉眼对比是回答不了的。我们需要数据需要批量测试需要从日志里挖出真正的性能指标。这就是这篇实操手册要解决的问题教你如何对PP-DocLayoutV3进行批量分析并解读关键日志计算出平均处理耗时、各类别的召回率以及置信度分数的分布情况。简单说我们要把“感觉挺快”变成“平均每张图耗时2.3秒”把“识别得还行”变成“标题召回率95%表格召回率88%”。有了这些数据你才能胸有成竹地把这个工具用到真实的项目里去。2. 核心概念理解我们要统计什么在开始动手之前我们先花几分钟用人话搞清楚三个核心统计指标是什么以及为什么它们重要。2.1 平均耗时速度的客观衡量平均耗时就是PP-DocLayoutV3处理一张图片所花费的平均时间。这个指标直接关系到你的使用体验和项目规划。为什么重要假设你要处理一份500页的报告如果每页要10秒你得等一个多小时如果只要2秒十分钟就搞定了。这个时间决定了你的工作流是“实时处理”还是“扔后台跑一晚上”。它包含什么从你点击“开始分析”到拿到JSON结果这中间模型加载图片、推理计算、生成边界框和标签、输出结果的全过程时间。怎么看日志在服务的运行日志里通常会记录每个请求的处理时间我们的任务就是把这些时间都找出来算个平均数。2.2 类别召回率精度的核心指标召回率简单说就是“该找出来的你找出来了多少”。对于PP-DocLayoutV3我们关心的是对25种布局类别如文本、标题、表格、图片等的识别能力。为什么重要一个文档分析工具如果连标题都经常漏掉或者把正文误认为是图片那基本就不可用了。召回率告诉你对于某一类元素比如“表格”模型成功找到了其中百分之多少。怎么算召回率 (模型正确检测出的某类元素数量) / (数据集中实际存在的该类元素总数) * 100%。比如测试的10张图里共有20个表格模型只找到了18个那么表格的召回率就是90%。挑战在哪要计算这个你需要一份“标准答案”也就是已经人工标注好的测试数据集用来和模型的输出结果做对比。2.3 置信度分布模型自信心的晴雨表PP-DocLayoutV3为它检测出的每一个框都会输出一个0到1之间的score这就是置信度可以理解为模型对自己这次判断的“自信心分数”。为什么重要置信度的分布情况能告诉我们很多信息整体把握度如果大部分检测结果的置信度都集中在0.8以上说明模型整体上很自信结果可能比较可靠。阈值调优依据Web界面上的“置信度阈值”滑块就是用来过滤掉低置信度结果的。通过分析分布你能知道把阈值设为0.6会过滤掉多少结果设为0.7又会过滤掉多少从而帮你找到兼顾“查得全”和“查得准”的平衡点。发现难点类别如果“公式”类别的置信度普遍偏低而“文本”类别的置信度普遍很高那就说明模型识别公式比较吃力这可能是因为训练数据中公式样本少或样式太复杂。怎么看我们把所有检测结果的置信度score收集起来画个直方图或密度图一眼就能看出它们主要集中在哪个分数段。3. 实战准备搭建批量测试环境理论说完了我们开始动手。要跑批量测试你得先准备好“原料”测试图片和“厨房”脚本环境。3.1 准备测试数据集理想的测试集应该能反映你真实的使用场景。来源建议你的真实业务文档这是最好的测试材料比如你要处理的扫描合同、电子报告、论文PDF截图等。公开数据集可以找一些文档布局分析的公开数据集但注意其类别标签是否与PP-DocLayoutV3的25类对齐。数据要求数量至少准备50-100张图片统计结果才有一定说服力。多样性尽量包含各种布局类别并且有意识地包含一些“难点”比如倾斜的扫描件、光照不均的翻拍照、带有复杂表格的页面等。标注文件用于计算召回率如果你要计算召回率就必须为每张测试图准备一个标注文件通常为JSON格式里面记录了每个文档元素的标准位置bbox和类别label。这个工作需要人工完成或者使用已有标注的数据集。3.2 编写批量调用脚本Web界面是给人用的批量测试得用程序。我们需要写一个脚本自动地、一张接一张地把测试图片“喂”给PP-DocLayoutV3服务。这里提供一个Python脚本示例使用requests库来调用服务的API接口假设服务提供了类似/predict的API端点具体需根据实际部署情况调整import os import json import time import requests from tqdm import tqdm # 用于显示进度条 # 配置信息 API_URL http://你的服务器IP:7861/predict # 替换为你的实际API地址 TEST_IMAGE_DIR ./test_images # 测试图片存放的文件夹 OUTPUT_DIR ./batch_results # 结果输出目录 os.makedirs(OUTPUT_DIR, exist_okTrue) # 准备图片列表 image_files [f for f in os.listdir(TEST_IMAGE_DIR) if f.lower().endswith((.png, .jpg, .jpeg, .bmp))] print(f找到 {len(image_files)} 张测试图片。) results_log [] timing_log [] for img_file in tqdm(image_files, desc批量处理中): img_path os.path.join(TEST_IMAGE_DIR, img_file) # 构造请求 files {image: open(img_path, rb)} data {confidence_threshold: 0.5} # 可以在这里调整置信度阈值 # 记录开始时间 start_time time.time() try: # 发送请求 response requests.post(API_URL, filesfiles, datadata) response.raise_for_status() # 检查请求是否成功 result response.json() # 记录处理耗时 elapsed_time time.time() - start_time timing_log.append({ image: img_file, time_cost: elapsed_time }) # 保存本次结果 result_record { image: img_file, inference_time: elapsed_time, detections: result.get(detections, []) # 假设返回结构中有detections } results_log.append(result_record) # 将结果单独保存为JSON文件 output_path os.path.join(OUTPUT_DIR, f{os.path.splitext(img_file)[0]}_result.json) with open(output_path, w, encodingutf-8) as f: json.dump(result_record, f, ensure_asciiFalse, indent2) except Exception as e: print(f处理图片 {img_file} 时出错: {e}) timing_log.append({ image: img_file, time_cost: None, error: str(e) }) finally: if files in locals(): files[image].close() # 保存汇总日志 with open(os.path.join(OUTPUT_DIR, timing_log.json), w) as f: json.dump(timing_log, f, indent2) with open(os.path.join(OUTPUT_DIR, all_results.json), w, encodingutf-8) as f: json.dump(results_log, f, ensure_asciiFalse, indent2) print(f\n批量处理完成详细结果保存在: {OUTPUT_DIR})脚本说明遍历指定文件夹下的所有图片。每张图片都通过HTTP POST请求发送给PP-DocLayoutV3服务。精确记录每个请求的处理时间。将每张图片的检测结果包括边界框、类别、置信度和耗时分别保存下来。最后生成两个汇总文件timing_log.json纯耗时记录和all_results.json全部详细结果。运行这个脚本你就得到了批量测试的原始数据。4. 数据分析从原始日志到统计图表数据到手了现在我们来“烹饪”它提取出有价值的统计信息。4.1 计算平均耗时与性能分析这是最简单直接的分析。打开timing_log.json里面记录了每张图的处理时间。import json import numpy as np # 加载耗时日志 with open(./batch_results/timing_log.json, r) as f: timing_data json.load(f) # 提取所有成功处理的时间 success_times [item[time_cost] for item in timing_data if item[time_cost] is not None] if success_times: avg_time np.mean(success_times) min_time np.min(success_times) max_time np.max(success_times) std_time np.std(success_times) # 标准差看时间波动大不大 print(f性能分析报告:) print(f 处理图片总数: {len(success_times)}) print(f 平均耗时: {avg_time:.2f} 秒) print(f 最短耗时: {min_time:.2f} 秒) print(f 最长耗时: {max_time:.2f} 秒) print(f 耗时标准差: {std_time:.2f} 秒 (值越小说明速度越稳定)) # 简单判断 if avg_time 1: print( - 速度极快适合实时交互。) elif avg_time 3: print( - 速度良好适合中小批量处理。) elif avg_time 10: print( - 速度一般建议批量后台处理。) else: print( - 速度较慢需检查配置或考虑GPU加速。) else: print(没有成功的处理记录。)通过这个分析你就能对工具的处理速度有一个非常量化的认识。4.2 统计类别召回率需标注数据这一步需要你的测试集有标注文件Ground Truth。你需要将模型的输出与标注文件进行比对判断每个检测框是否匹配到了正确的真实元素。这里涉及一个关键操作计算IoU交并比来判断两个框是否匹配。流程简述如下数据准备对于每张图你有两个列表gt_boxes标注的真值框和pred_boxes模型预测框。匹配过程遍历每个预测框在所有未匹配的真值框中寻找与其类别相同且IoU大于某个阈值如0.5的框。如果找到就算一次“正确检测”True Positive, TP。统计计算TP_c: 类别c被正确检测的数量。GT_c: 数据集中类别c的真实总数量。召回率_c TP_c / GT_c由于代码较长这里给出核心逻辑框架# 伪代码/框架示意 def calculate_recall(predictions, ground_truths, iou_threshold0.5): predictions: 模型输出结果列表 ground_truths: 标注真值列表 category_stats {} for img_name in all_images: preds 加载该图的预测结果 gts 加载该图的标注真值 for cat in all_categories: pred_boxes_cat [p for p in preds if p[label] cat] gt_boxes_cat [g for g in gts if g[label] cat] # 调用匹配函数计算TP tp match_boxes(pred_boxes_cat, gt_boxes_cat, iou_threshold) # 累加统计 category_stats[cat][TP] tp category_stats[cat][GT] len(gt_boxes_cat) # 计算每个类别的召回率 recall_report {} for cat, stats in category_stats.items(): if stats[GT] 0: recall stats[TP] / stats[GT] recall_report[cat] recall else: recall_report[cat] None # 该类别在测试集中未出现 return recall_report计算完成后你可以生成一个表格或柱状图直观展示25个类别各自的召回率一眼就能看出哪些是模型的强项哪些是弱项。4.3 分析置信度分布置信度数据直接来自模型输出无需标注。我们分析所有检测结果的score。import json from collections import defaultdict import matplotlib.pyplot as plt # 用于画图 # 加载所有结果 with open(./batch_results/all_results.json, r, encodingutf-8) as f: all_results json.load(f) # 收集所有置信度分数 all_scores [] scores_by_category defaultdict(list) for result in all_results: for det in result.get(detections, []): score det.get(score) label det.get(label) if score is not None: all_scores.append(score) if label: scores_by_category[label].append(score) # 1. 整体分布 print(f置信度整体分析:) print(f 总检测框数量: {len(all_scores)}) print(f 平均置信度: {np.mean(all_scores):.3f}) print(f 中位数置信度: {np.median(all_scores):.3f}) print(f 置信度标准差: {np.std(all_scores):.3f}) # 2. 按类别分析示例看几个关键类别 key_categories [文本, 标题, 表格, 图片] for cat in key_categories: if cat in scores_by_category and scores_by_category[cat]: scores scores_by_category[cat] print(f [{cat}]: 平均置信度{np.mean(scores):.3f}, 样本数{len(scores)}) # 3. 绘制整体置信度直方图 (可选需要matplotlib) plt.figure(figsize(10, 6)) plt.hist(all_scores, bins20, edgecolorblack, alpha0.7) plt.xlabel(置信度分数) plt.ylabel(检测框数量) plt.title(PP-DocLayoutV3 检测结果置信度分布) plt.grid(True, alpha0.3) # 可以在图上画几条阈值参考线 for thresh in [0.3, 0.5, 0.7, 0.9]: plt.axvline(xthresh, colorr, linestyle--, alpha0.5, labelf阈值{thresh} if thresh0.5 else ) plt.legend() plt.tight_layout() plt.savefig(./batch_results/confidence_distribution.png, dpi150) print(置信度分布图已保存。)通过这个分析你会知道模型大部分结果是否都很有把握分布偏向1.0。如果分布很分散甚至有很多低分结果你可能需要调高Web界面的阈值来过滤噪声。不同类别的置信度水平是否有差异这能侧面反映模型对不同类别识别的难易程度。5. 总结让数据指导你的应用走完这一套流程你对PP-DocLayoutV3的认识就不再停留在“能用”的层面而是进入了“知其所以然”的阶段。关于速度你得到了一个明确的平均耗时数字。如果这个数字对于你的批量处理需求来说偏大你可以据此去寻找优化方案比如确认是否启用了GPU或者调整处理图像的尺寸。关于精度你得到了一份详细的类别召回率报告。如果发现“表格”召回率低而你的业务又高度依赖表格提取那么你可能需要寻找增强方案或者对这部分结果进行额外的人工复核。关于置信度你清楚了模型输出的“自信心”分布。这直接指导你如何设置Web界面上的阈值滑块。如果分布显示大量有效结果的置信度在0.6-0.8之间那么把阈值设为0.5可能就会引入很多噪声框设为0.7可能会更干净。最终建议不要只做一次分析。当你更换了文档类型比如从现代报告换成古籍或者调整了服务配置比如从CPU切换到GPU都应该重新跑一遍这个批量分析流程。让数据成为你评估和优化文档处理流程的可靠依据。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

PP-DocLayoutV3实操手册:批量分析日志统计(平均耗时/类别召回率/置信分布)

PP-DocLayoutV3实操手册:批量分析日志统计(平均耗时/类别召回率/置信分布) 1. 引言:从单张测试到批量分析 如果你已经用上了PP-DocLayoutV3的Web界面,上传几张图片,看着它把文档里的标题、文本、表格一个…...

OpenClaw飞书机器人配置:基于Phi-3-mini-128k-instruct的智能对话

OpenClaw飞书机器人配置:基于Phi-3-mini-128k-instruct的智能对话 1. 为什么选择OpenClaw飞书Phi-3的组合? 去年我负责一个小型远程团队的文档协作项目,每天要处理几十个飞书群消息和文档修改请求。当我在GitHub偶然发现OpenClaw时&#xf…...

Gemma 4推理增强版:专注数学与代码的QLoRA适配器

Gemma 4推理增强版:专注数学与代码的QLoRA适配器 【免费下载链接】gemma4-31b-Opus-4.6-reasoning 项目地址: https://ai.gitcode.com/hf_mirrors/kai-os/gemma4-31b-Opus-4.6-reasoning 导语:Google Gemma 4系列再添新成员,专注数学…...

I.MX6ULL GPIO配置避坑指南:HYS、PUS、DSE这些寄存器位到底怎么设?

I.MX6ULL GPIO配置实战手册:寄存器位场景化解析与避坑策略 如果你正在使用I.MX6ULL开发嵌入式系统,GPIO配置可能是你遇到的第一个"拦路虎"。与常见的STM32不同,I.MX6ULL的GPIO配置寄存器充满了各种缩写——HYS、PUS、PUE、PKE、ODE…...

【MPU6050】从数据融合到姿态解算:互补滤波实战指南

1. MPU6050传感器基础与姿态解算挑战 第一次接触MPU6050时,我被这个小巧的6轴传感器惊艳到了——它集成了三轴加速度计和三轴陀螺仪,尺寸比指甲盖还小。但真正用它做姿态解算时,问题接踵而至:加速度计输出的数据在动态情况下抖动严…...

深入JESD204B子类1/2与时钟域:FPGA高速数据采集中的Sysref与多帧边界实战解析

深入JESD204B子类1/2与时钟域:FPGA高速数据采集中的Sysref与多帧边界实战解析 在高速数据采集系统的设计中,JESD204B协议已成为连接高速ADC/DAC与FPGA的事实标准。对于雷达、无线通信等对时序要求极为严苛的应用场景,仅仅实现链路连通是远远不…...

海思SS524/SS522系列SDK编译实战:从零构建DVR开发环境

1. 海思SS524/SS522芯片与DVR开发入门 第一次接触海思SS524/SS522系列芯片时,我被它强大的视频处理能力震撼到了。这颗芯片简直就是为DVR产品量身定制的,特别是当你需要处理多路高清视频流时,它的优势就更加明显。SS524和SS522虽然型号不同&a…...

OpenClaw+Qwen2.5-VL-7B:自动化处理多模态数据

OpenClawQwen2.5-VL-7B:自动化处理多模态数据 1. 为什么需要多模态自动化助手 作为一名经常处理各种数据的技术从业者,我经常遇到这样的困扰:电脑里堆满了各种格式的文件——PDF报告、Excel表格、会议录音、产品图片,每次需要从…...

OpenClaw+Qwen3-14B自媒体助手:全平台内容一键分发

OpenClawQwen3-14B自媒体助手:全平台内容一键分发 1. 为什么需要全平台内容分发助手 作为一个技术博主兼自媒体运营者,我每天最头疼的事情不是写内容,而是要把同一篇文章适配到不同平台发布。公众号需要特殊排版的Markdown、知乎喜欢带目录…...

MM32 MCU烧录故障排查指南:从硬件到软件的全面解析

1. 硬件问题排查:从电源到接口的全面检查 遇到MM32 MCU烧录失败时,硬件问题往往是首要排查方向。我遇到过不少新手朋友一上来就怀疑芯片质量问题,结果折腾半天发现是电源没接好。硬件问题排查建议按照"供电→接口→调试器"的顺序进…...

Linux ALSA声卡驱动开发实战:手把手教你配置Cpu_dai参数(附MTK示例代码解析)

Linux ALSA声卡驱动开发实战:手把手教你配置Cpu_dai参数(附MTK示例代码解析) 在嵌入式Linux音频系统开发中,ALSA(Advanced Linux Sound Architecture)框架扮演着核心角色。作为连接硬件与应用的桥梁&#x…...

Halcon图像处理实战:trans_from_rgb颜色空间转换全解析(附常见问题解决方案)

Halcon图像处理实战:trans_from_rgb颜色空间转换全解析(附常见问题解决方案) 在工业视觉检测和医学图像分析领域,颜色空间转换是图像预处理的关键步骤。Halcon作为机器视觉领域的标杆工具,其trans_from_rgb算子支持六种…...

OpenClaw+千问3.5-35B-A3B-FP8:24小时运行的竞品监测系统

OpenClaw千问3.5-35B-A3B-FP8:24小时运行的竞品监测系统 1. 为什么需要个人级竞品监测系统 去年在做独立产品时,我每天要手动检查5个竞品官网的更新情况。重复的复制粘贴、版本号比对、功能点记录消耗了大量时间。直到发现OpenClaw千问3.5的组合&#…...

ESP32(VSCode+PlatformIO)开发环境搭建避坑指南(2024版)

1. 环境准备:避开Python安装的那些坑 第一次用ESP32开发板时,我兴冲冲地按照教程安装Python,结果在验证环节直接翻车。命令行输入python后居然提示"不是内部命令",这种基础问题浪费了我两小时。后来才发现是系统环境变量…...

OpenClaw+gemma-3-12b-it:自动化测试报告生成与分发

OpenClawgemma-3-12b-it:自动化测试报告生成与分发 1. 为什么需要自动化测试报告 作为一个小型开发团队的负责人,我每周都要面对一个重复性工作:收集各个成员的测试结果,整理成统一格式的报告,再通过邮件发送给所有相…...

BMC开发实战:i2c-tools显示‘UU’?别慌,这是PCA9545 I2C Switch在正常工作

BMC开发实战:i2c-tools显示UU?别慌,这是PCA9545 I2C Switch在正常工作 当你在BMC环境下使用i2cdetect扫描物理I2C总线时,看到PCA9545的地址显示为UU(忙碌状态)而不是预期的设备地址,这可能会让不…...

从安装到第一个Cypher查询:用Docker一键部署Neo4j 5社区版,告别环境冲突

容器化部署Neo4j 5社区版:告别环境冲突的极简实践 在数据科学和复杂关系分析领域,Neo4j作为领先的图数据库解决方案,正被越来越多的企业采用。然而,传统安装方式常伴随着Java版本冲突、环境变量污染等问题,让开发者头…...

基于SpringBoot + Vue的学生交流互助平台(角色:学生、管理员)

文章目录前言一、详细操作演示视频二、具体实现截图三、技术栈1.前端-Vue.js2.后端-SpringBoot3.数据库-MySQL4.系统架构-B/S四、系统测试1.系统测试概述2.系统功能测试3.系统测试结论五、项目代码参考六、数据库代码参考七、项目论文示例结语前言 💛博主介绍&#…...

基于SpringBoot + Vue的眼科患者随访管理系统(角色:患者、医生、管理员)

文章目录前言一、详细操作演示视频二、具体实现截图三、技术栈1.前端-Vue.js2.后端-SpringBoot3.数据库-MySQL4.系统架构-B/S四、系统测试1.系统测试概述2.系统功能测试3.系统测试结论五、项目代码参考六、数据库代码参考七、项目论文示例结语前言 💛博主介绍&#…...

基于SpringBoot + Vue的知识产权管理系统(角色:用户、知识产权人、管理员)

文章目录前言一、详细操作演示视频二、具体实现截图三、技术栈1.前端-Vue.js2.后端-SpringBoot3.数据库-MySQL4.系统架构-B/S四、系统测试1.系统测试概述2.系统功能测试3.系统测试结论五、项目代码参考六、数据库代码参考七、项目论文示例结语前言 💛博主介绍&#…...

OpenClaw安全指南:Qwen3.5-9B执行权限管控与操作审计

OpenClaw安全指南:Qwen3.5-9B执行权限管控与操作审计 1. 为什么需要OpenClaw安全防护 上周我在调试一个自动整理财务报表的OpenClaw任务时,差点酿成大祸。当时AI助手误将包含客户隐私的临时文件同步到了公开目录,幸亏我提前配置了文件操作审…...

基于Uniapp + SpringBoot + Vue的智能停车场管理系统(角色:用户、员工、管理员)

文章目录前言一、详细操作演示视频二、具体实现截图三、技术栈1.前端-Vue.js2.后端-SpringBoot3.数据库-MySQL4.系统架构-B/S四、系统测试1.系统测试概述2.系统功能测试3.系统测试结论五、项目代码参考六、数据库代码参考七、项目论文示例结语前言 💛博主介绍&#…...

在PHP中处理字符串连接和插值的多种方法

一、字符串连接方法1. 点号运算符(.)语法:通过.连接字符串或变量。示例:123$str1 "Hello";$str2 "World";echo $str1 . " " . $str2; // 输出 "Hello World"特点:简单直接&…...

PHP获取当前IP地址的方法

想象一下,你在寄信时需要填写收件人的地址(IP 地址)。在 PHP 中,我们可以通过读取 HTTP 请求中的信息来获取用户的 IP 地址。(1) 获取 IP 的方法$_SERVER 超全局变量:$_SERVER[REMOTE_ADDR]:直接获取客户端…...

PHP序列化数据格式的示例详解

PHP序列化是将PHP变量(包括对象)转换为可存储或传输的字符串表示形式的过程。了解这些序列化格式对于数据处理、调试和安全性分析非常重要。本文将详细介绍PHP中各种数据类型的序列化表示方式。基本数据类型序列化格式布尔值(Boolean&#xf…...

PHP短信发送功能的实现与优化指南

在现代Web应用中,短信通知是用户认证、营销推送和安全预警的重要渠道。本文将深入解析一个PHP短信发送函数的实现原理,并通过代码优化展示如何提升其安全性、可靠性和性能。核心实现原理短信发送的基本原理是通过HTTP请求调用第三方短信服务API。以下是一…...

macOS上OpenClaw排错指南:Qwen2.5-VL-7B连接失败解决方案

macOS上OpenClaw排错指南:Qwen2.5-VL-7B连接失败解决方案 1. 问题背景与现象描述 上周我在自己的MacBook Pro(M1芯片,macOS Ventura 13.5)上尝试部署OpenClaw并连接本地运行的Qwen2.5-VL-7B模型时,遭遇了一系列连接问…...

OpenClaw备份自动化:用SecGPT-14B识别关键数据并同步加密

OpenClaw备份自动化:用SecGPT-14B识别关键数据并同步加密 1. 为什么需要智能备份系统 作为一个长期在本地开发项目的程序员,我经历过太多次"误删文件后追悔莫及"的时刻。传统的定时全量备份虽然简单,但存在三个致命问题&#xff…...

LeetCode(16/100)

灵神的方法,采用教室坐座位类比,将在1~n范围的数排到他们应在的位置,然后分为都在自己的位置上和有位置没人坐的情况遍历找出缺失的第一个正数。非常形象容易理解,时间效率最优。 class Solution {public int firstMissingPositiv…...

LeetCode(15/100)

数组中除当前数外所有数乘积。不许用除法,时间复杂度O(N),左右指针求前缀乘积和后缀乘积,还能u空间。 class Solution {public int[] productExceptSelf(int[] nums) {int len nums.length;// L 和 R 分别表示左右两侧的乘积列表int[] L ne…...