当前位置: 首页 > article >正文

LPC数字保存快速指南,精准破局数字保存难题

​​关注我们 -数字罗塞塔计划-01数字保存快速指南介绍在数字时代图书馆出版商面临着技术快速迭代与用户需求不断变化带来的数字内容保存难题。2025年9月15日图书馆出版联盟Library Publishing CoalitionLPC的保存工作组Preservation Working Group宣布推出全新的一系列快速指南包含四份面向图书馆出版商的数字保存快速指南LPC Launches Quick Guides to Digital Preservation for Library Publishers。这些指南是根据LPC保存任务组2021-2023年的建议制定旨在填补现有资源空白提供简洁易懂的指导性材料帮助图书馆出版商迈出出版物数字保存的第一步。四份初始指南不局限于特定平台核心围绕“出版项目范围如何影响并关联数字保存项目”展开具体包括第零步——创建保存清单Creating a Preservation Inventory第一步——了解保存领域现状Understanding the Preservation Landscape第二步——为出版项目制定保存政策Starting a Preservation Policy for Your Publishing Program第三步——明确保存范围Scope下面逐一进行介绍。02第零步创建保存清单指导出版商全面梳理出版部门所有内容明确清单需捕获的权限、存储位置、格式等关键信息提供可灵活调整的表格模板强调清单是数字保存工作流的首要必要步骤。分项内容清单作为数字保存首步的必要性探索现状是对当前实践与过往工作的全面洞察明确范围如同“时间快照”回答“出版部门涵盖哪些内容”的核心问题梳理资产帮助出版商从宏观层面了解自身内容的异同点筛选依据并非所有inventoried内容都需保存或同等对待清单是确定“需纳入保存的材料等级”的必要步骤清单涵盖的文档类型正式出版物期刊及期刊文章、专著、教材、数字人文DH项目、书目补充材料数据集、视听材料及其文字记录内部支持文件与合作方的谅解备忘录/协议MOUs/MOAs、出版商或出版物与创作者的授权协议含关联合作方及外部创作者、生产文件如草稿、InDesign文件等、被拒稿件、同行评审意见及编辑与作者的沟通记录清单需捕获的关键信息权限相关文档的访问权限仅内部、仅校园关联人员 / 校内用户、开放获取等留存原因当前留存这些材料的目的如公共访问需求、潜在法律纠纷解决、灾难恢复需求、便于将出版物迁移至新平台、移交至大学档案馆等载体与来源材料为数字或物理形式是原生数字born-digital还是数字化digitized产物存储信息文档及副本的存储位置可能存在多地点副本物理与数字物品需区别考虑文档及存储的维护主体如个人本地设备、图书馆基础设施、外部管理存储等相关平台用于内容生产或分发的数字平台如OJS、Janeway、bepress、YouTube、Vimeo等格式与授权文档的具体格式如PDF、HTML、EPUB/XML等作品的授权方式标识符是否有关联的标识符如ISSN、ISBN等清单模板使用说明基础操作复制提供的电子表格用于梳理文件灵活调整可按平台、格式等宏观维度分类或按单本/单个标题逐一梳理无固定标准需根据自身出版项目需求调整如重排行、多次复制表格以优化结构额外功能可在清单中明确标注“不打算保留”的内容03第一步了解保存领域现状围绕数字保存的定义、开展数字保存的四大原因、机构层面需厘清的核心问题及推荐的数字保存工具/系统清单展开。分项内容数字保存的权威定义指为确保数字材料在必要期限内持续可访问而开展的一系列有管理的活动涵盖所有超越媒体故障、技术与组织变革限制维持数字材料可访问性的行动引用DPC《What Is Digital Preservation》核心属性·主动性是持续进行的过程而非“一劳永逸”因内容会不断变化· 长期性保存的内容是长期精选收藏不面向短期访问· 通用性不依赖特定出版机构或平台且可能比其存续时间更长开展出版物数字保存的原因学术价值层面出版的学术成果是学术记录的组成部分需为后代提供访问渠道作者权益层面出版物是作者的学术遗产作者需要确信其作品能纳入长期学术记录出版方价值层面出版物对出版方及所属机构具有重要价值可保障在内容上投入的时间与资金机构使命层面图书馆传统上承担学术保存职责而原生数字内容的出现使部分职责转移至出版商图书馆出版商兼具两者角色需确保内容长期保存机构层面需厘清的核心问题责任主体相关机构内是否有数字保存馆员Digital Preservation Librarian是否存在从事数字保存相关工作的小组档案管理员是否需要将部分材料纳入档案馆收藏现有政策相关机构是否制定数字保存政策其覆盖范围是什么机构是否有记录管理政策或留存时间表更新频率如何工具与平台相关需向数字保存馆员、采购馆员、IT人员等咨询机构是否订阅保存系统如Portio、CLOCKSS现有出版平台是否具备保存功能平台供应商是否可提供保存服务不确定时可主动联系标准备份与存储如何处理可用存储空间有多少机构本地正在使用哪些数字保存工具推荐的数字保存工具/系统清单网页爬取工具archive-it.org、conifer.rhizome.org、warcreate.com、webcuratortool.org保存系统preservica.com、libnova.com、arkivum.com、archivematica.org、Ex Libris Rosetta补充资源coptr.digipres.org提供更详尽的工具清单04第二步为出版项目制定保存政策指导出版商基于机构是否已有保存政策分场景行动并提供以NASIG北美学术交流图书馆员协会数字保存政策为核心的框架明确政策“引言”“原则”部分的定制要点。核心原则是“无需独自推进需与同事协作”核心目标是帮助图书馆出版商要么制定新的保存政策要么将出版项目更充分地融入图书馆现有保存政策完成本步骤后需达成以下任一结果1.确保出版项目严格遵循机构现有保存政策2.推动将出版项目纳入图书馆现有保存政策3.为图书馆或出版项目启动新的保存政策制定工作。根据机构是否已有数字保存政策提供两类行动路径已有政策按“阅读沟通-核查适配性-更新/补充/遵循”推进无政策则联合相关馆员协作制定01场景一机构已制定保存政策1基础步骤第一步仔细阅读该政策第二步与政策持有人或第一步中识别的相关人员沟通告知自身诉求并向利益相关方说明政策适配的激励价值。24种适配情况及对应应对措施适配情况具体应对方式出版项目已明确纳入政策且细节充足理解政策内容与政策持有人协作确保合规执行出版项目已纳入政策但政策过时联合相关方更新政策出版项目已纳入政策但细节不足·与政策持有人共同明确政策对出版项目的具体适用方式·明确政策与机构学术研究工作的关联性·了解数据管理实践与有效的学术交流模式政策未提及出版项目·推动政策持有人将出版项目纳入现有政策·若推动无果可为出版项目单独制定保存政策跳转至“场景二”的制定流程02场景二机构未制定保存政策若机构设有数字保存馆员主动沟通分享制定保存政策的意愿以此为契机协作起草新政策。若机构无数字保存馆员联系其他负责数字资源管理的馆员包括机构知识库馆员、数据馆员、大学档案管理员等——所有参与数字资源创建与管理的人员均属于机构数字保存的利益相关方。制定新政策的参考依据为NASIG模型数字保存政策由NASIG与LPC成员联合制定其样本文本及其他案例为新政策提供了良好框架重点拆解前两个核心章节的制定逻辑两大重点章节及定制要点如下重点章节定制要点引言Introduction可直接借鉴NASIG模型政策的引言样本再根据本地需求修订原则Principles可借鉴NASIG模型政策的原则章节纳入新政策草案05第三步明确保存范围指导出版商结合前期的保存清单第零步和政策引言/原则第二步通过在清单中新增“保存决策”列标注“保存/备份/不保留”明确政策范围界定需保存的核心内容、需评估是否保存的模糊内容、仅需备份的内容及无需保留的内容。核心行动框架如下项目描述行动前提已完成第二步启动保存政策确定引言与原则且持有第零步完成的内容清单核心操作在第零步的保存清单中新增一列“保存决策Preservation Decision”为每一项内容标注以下三类结果之一Preserve保存纳入数字保存政策范围由图书馆出版商负责长期保存Back up备份无需长期保存但需备份留存Do not retain不保留无需保存或备份可直接删除。决策参考因素内容是否面向公众、是否为内部文件等保存范围详细界定如下保存范围详细内容需保存的内容In-scope基于NASIG模型数字保存政策定义正式出版物期刊内容研究论文、综述等非期刊文本内容电子书、学位论文、开放教育资源 / OER 等非文本出版物播客、视频、数字展览等补充要求用户社区可直接访问提供多种输出格式如HTML、PDF、EPUB等包含勘误表Errata、卷首语如编辑信息、政策说明。辅助内容由图书馆出版商宿主、面向公众的辅助材料数据、视频、工作表等包括印刷版中省略的内容如额外表格、图表。数据集含支撑数字人文项目的数据集。元数据4类描述性元数据Descriptive管理性元数据Administrative含知识产权信息技术性元数据Technical各部分间的关系型元数据Relationships among the parts。需评估是否保存的内容需判断“保存/备份/不保留”平台上的往期版本如修改前的已接受稿件撤稿文章Retracted articles作者更名前的出版物版本出版版本中包含的广告外部链接External links公共网站上的注释或评论开放同行评审笔记及作者回复外部宿主的辅助内容如数据集需确认宿主平台的保存情况相关博客/社交媒体帖子或其他推广材料网站的“外观与风格”及所有功能对实验性出版物、数字人文项目尤为重要。仅需备份的内容Back up工作文件如InDesign、LaTex文件可用于创建更易访问的内容版本嵌入资产的独立文件如图像、视频等建议以开源格式留存完整尺寸便于带宽提升后提供更高质量资源出版相关的电子邮件通信与作者和/或编辑的谅解备忘录/协议MOUs/MOAs版权许可文件Copyright permissionsNASIGuide中“利益相关方访问”部分列出的“示例材料”。无需保留的内容Do not retain处于编辑和排版过程中的文章版本批量导入文件Batch ingest files。06结 语对图书馆出版商而言这套快速指南不仅是一套操作说明更是将保存工作从被动义务提升为出版实践核心环节的催化剂。在数字内容日益成为文化与学术遗产重要组成部分的当下这些资源助力图书馆出版商切实履行知识守护者的职责。LPC表示这四份指南仅为开端后续还计划推出针对特定平台及保存服务的专项指南目标是打造多样化、具吸引力且易于获取的内容助力出版商建立符合伦理且切实有效的数字保存体系。数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见共同为人类文明的传承而努力奋斗关注我们 -数字罗塞塔计划-

相关文章:

LPC数字保存快速指南,精准破局数字保存难题

​​关注我们 - 数字罗塞塔计划 -01数字保存快速指南介绍在数字时代,图书馆出版商面临着技术快速迭代与用户需求不断变化带来的数字内容保存难题。2025年9月15日,图书馆出版联盟(Library Publishing Coalition,LPC)的保…...

Python 核心数据结构实战全攻略:列表 / 字典 / 元组 / 集合从入门到精通

前言在 Python 编程中,列表(list)、字典(dict)、元组(tuple)、集合(set) 是最核心、最常用的四大内置数据结构,是所有 Python 开发者必须熟练掌握的基础核心能…...

两台 H.323 终端点对点直连通信完整步骤

下面给你最精简、最标准、可用于考试/开发/调试的: 两台 H.323 终端点对点直连通信完整步骤 无网守(Gatekeeper)、纯终端对终端,一步不落。一、前提条件 终端A:主叫(比如 192.168.1.10)终端B&am…...

LAYONTHEGROUND栈

一、什么是requests? requests 是一个用于发送HTTP请求的 Python 库。 它可以帮助你: 轻松发送GET、POST、PUT、DELETE等请求 处理Cookie、会话等复杂性 自动解压缩内容 处理国际化域名和URL 二、应用场景 requests 广泛应用于以下实际场景: …...

我不是在用 AI 助手,我在把自己的能力沉淀成组织资产衫

1. 什么是 Apache SeaTunnel? Apache SeaTunnel 是一个非常易于使用、高性能、支持实时流式和离线批处理的海量数据集成平台。它的目标是解决常见的数据集成问题,如数据源多样性、同步场景复杂性以及资源消耗高的问题。 核心特性 丰富的数据源支持&#…...

实测PyTorch-2.x-Universal-Dev-v1.0:开箱即用,GPU验证到Jupyter启动全流程

实测PyTorch-2.x-Universal-Dev-v1.0:开箱即用,GPU验证到Jupyter启动全流程 1. 引言:为什么选择这个镜像 深度学习开发环境配置一直是让开发者头疼的问题。从CUDA驱动安装到各种Python库的版本兼容性,每一步都可能遇到意想不到的…...

Qwen2.5-72B-Instruct-GPTQ-Int4多场景:医疗问诊记录结构化+术语标准化

Qwen2.5-72B-Instruct-GPTQ-Int4多场景:医疗问诊记录结构化术语标准化 1. 模型简介与核心能力 1.1 Qwen2.5系列模型概述 Qwen2.5是通义千问大模型系列的最新版本,提供了从0.5B到720B参数规模的基础模型和指令调优模型。相比前代Qwen2,Qwen…...

SensitivityMatcher:终极游戏鼠标灵敏度精准转换指南

SensitivityMatcher:终极游戏鼠标灵敏度精准转换指南 【免费下载链接】SensitivityMatcher Script that can be used to convert your mouse sensitivity between different 3D games. 项目地址: https://gitcode.com/gh_mirrors/se/SensitivityMatcher 想要…...

WHAT - Shell 工具 warp 介绍(融合 AI)

文章目录Warp Terminal 是什么和传统 Terminal 最大区别可以“用人话操作终端”输入体验像代码编辑器Block(块)概念(非常关键)AI Agent团队协作(Warp Drive)UI 和体验完全现代化和 iTerm2 / Terminal 的本…...

Markdown Viewer浏览器扩展:终极Markdown预览解决方案

Markdown Viewer浏览器扩展:终极Markdown预览解决方案 【免费下载链接】markdown-viewer Markdown Viewer / Browser Extension 项目地址: https://gitcode.com/gh_mirrors/ma/markdown-viewer 还在为浏览器中无法直接预览Markdown文件而烦恼吗?M…...

RVC多语言支持实测:中文/日文/韩文/英文语音转换效果横向对比

RVC多语言支持实测:中文/日文/韩文/英文语音转换效果横向对比 1. 引言:当AI学会“说”多国语言 想象一下,你手头有一段自己的中文录音,但你需要一段日文配音的视频,或者一段韩文的产品介绍。传统方法要么找专业配音&…...

我的OpenClaw使用体验:从怀疑到依赖的“数字员工”

最初接触OpenClaw时,我和许多人一样,抱着怀疑的态度。一个开源项目,真的能成为我口中那个“能干活”的AI助手吗?然而,经过几个月的深度使用,它已经从一个新奇的玩具,变成了我工作流中不可或缺的…...

LLM安全对齐工程白皮书(工业级落地版):覆盖92%企业场景的12项强制校验清单

第一章:LLM安全对齐工程化的核心范式与工业落地挑战 2026奇点智能技术大会(https://ml-summit.org) 大型语言模型的安全对齐已从实验室研究阶段迈入规模化工程实践的关键转折点。当前主流工业场景中,对齐不再仅依赖RLHF单点优化,而是演进为覆…...

大厂 HR 直言:IT 简历里最加分的 3 个项目类型,别乱写

每年金三银四、秋招旺季,我作为大厂HR,每天要刷几百份IT简历,平均每份停留不超过10秒。很多程序员明明技术不错,却因为项目写得乱七八糟,直接被ATS系统筛掉,连面试机会都没有。重点说一句:IT简历…...

GPU 租用:智星云抢占式实例的极致省钱攻略

按小时计费怎么省?GPU 租用竞价策略与抢占式实例实操——以智星云为例,解锁高性价比算力开篇:算力焦虑的最佳解药大模型时代的科研与开发,往往是一场“算力”的比拼。对于个人开发者、学生群体乃至初创团队来说,动辄数…...

PHP代码加密:2026年开发者必须面对的“最后一道防线“

开篇:一个真实的故事 2024年11月,一位做电商SaaS的朋友找到我,语气当中带着掩饰不住的沮丧。他的核心定价算法,也就是团队花了两年时间打磨出来的东西,被客户的技术团队完整地复制了。没有反编译,也没有逆向…...

3步从零到精通:Krita AI Diffusion插件模型加载全流程指南

3步从零到精通:Krita AI Diffusion插件模型加载全流程指南 【免费下载链接】krita-ai-diffusion Streamlined interface for generating images with AI in Krita. Inpaint and outpaint with optional text prompt, no tweaking required. 项目地址: https://git…...

SEATA分布式事务——AT模式撂

简介 AI Agent 不仅仅是一个能聊天的机器人(如普通的 ChatGPT),而是一个能够感知环境、进行推理、自主决策并调用工具来完成特定任务的智能系统,更够完成更为复杂的AI场景需求。 AI Agent 功能 根据查阅的资料,agent的…...

SkillLite 多入口架构实战:CLI / Python SDK / MCP / Desktop / Swarm 一页理清

摘要 SkillLite 是轻量级 AI Agent Skills 执行引擎:同一套 Rust workspace 拆分多 crate,向上提供「开箱即用的 Agent 产品」与「可嵌入的安全执行内核」。集成方既可通过终端 CLI 与 MCP 接入 IDE,也可在 Python 中调用 scan_code、execut…...

做质检员其实太容易了|云质QMS为您揭秘

质检员入门全流程手册一、质检员的基本业务知识1. 质检员的岗位使命严格执行质量检验标准,对各类生产原料、成品、辅料的质量检验,监控生产工艺的运行情况,对发现的问题及时上报,不断提升产品质量,维护企业质量信誉。2…...

Prompt工程已进入“微秒级响应”时代:奇点大会实测数据显示——提示结构优化带来3.7倍推理吞吐提升

第一章:Prompt工程已进入“微秒级响应”时代:奇点大会实测数据总览 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点智能技术大会上,全球首个面向生产环境的Prompt编译器——PromptLLVM v0.9正式发布,并同步公开其端到…...

5分钟掌握CAD_Sketcher:Blender中实现精确参数化设计的终极指南

5分钟掌握CAD_Sketcher:Blender中实现精确参数化设计的终极指南 【免费下载链接】CAD_Sketcher Constraint-based geometry sketcher for blender 项目地址: https://gitcode.com/gh_mirrors/ca/CAD_Sketcher CAD_Sketcher是Blender中基于约束的几何草图工具…...

告别无效流量!亚马逊关键词挖掘:新手 7 天精准获客不浪费

亚马逊日常运营,关键词选不对,广告全白费:​花大价钱投热门大词,点击多、转化少,ACoS 居高不下;​自己想的关键词没人搜,广告预算花不出去,零曝光零订单;​只盯着 10 几个…...

S32K3XX时钟树实战:从EB配置到外设时钟精准分配

1. S32K3XX时钟树基础:从晶振到外设的时钟旅程 第一次接触S32K3XX系列芯片时,我被它的时钟系统搞得晕头转向。直到把整个时钟链路比作城市供水系统才豁然开朗——晶振就像水源,PLL是增压泵,而七大时钟则是通往不同区域的主管道。这…...

博客建站选购香港云主机要注意哪些

博客建站选购香港云主机要注意哪些?很多人一上来就看价格,哪个便宜买哪个。这是个误区。选配置之前,先问自己三个问题:我的博客是什么类型?纯文字博客、图片站,还是会有视频?预计每天有多少访问量?我的技术能力如何?能自己折…...

Redis:延迟双删的适用边界与落地细节弦

pagehelper整合 引入依赖com.github.pagehelperpagehelper-spring-boot-starter2.1.0compile编写代码 GetMapping("/list/{pageNo}") public PageInfo findAll(PathVariable int pageNo) {// 设置当前页码和每页显示的条数PageHelper.startPage(pageNo, 10);// 查询数…...

大模型上线后模型突变怎么办:从灰度失败到秒级回滚的7个关键检查点

第一章:大模型工程化版本管理与回滚机制 2026奇点智能技术大会(https://ml-summit.org) 大模型工程化中的版本管理远超传统软件的 Git commit 粒度,需同时追踪模型权重、Tokenizer 配置、训练超参、推理服务镜像及依赖环境快照。单一 SHA 哈希已无法承载…...

Unity发布京东小游戏笔

从 UI 工程师到 AI 应用架构者 13 年前,我的工作是让按钮在 IE6 上对齐; 13 年后,我用 fetch-event-source 订阅大模型的“思维流”,用 OCR 解锁图片中的文字——前端,正在成为 AI 产品的第一道体验防线。 最近&#x…...

k8s集群搭建时提示Unable to connect to the server: tls: failed to verify certificateUnable to connect to the

当执行kubeadm init后kubeadm init \--apiserver-advertise-address192.168.79.132 \--pod-network-cidr192.168.0.0/16 \--kubernetes-version1.31.2 \--image-repository registry.aliyuncs.com/google_containerskubeadm init \--apiserver-advertise-address192.168.79.132…...

SITS2026平台重构全记录:从单体Java商城到LLM+RAG驱动的AI原生电商,6周完成核心链路迁移并提升GMV 42%

第一章:SITS2026案例:AI原生电商平台实践 2026奇点智能技术大会(https://ml-summit.org) SITS2026是面向下一代电商基础设施的AI原生平台原型,由阿里云与浙江大学联合实验室在2024年Q4启动构建,于2025年Q2完成全链路灰度验证。该…...