怎样使用Oxygen XML Editor将MS Word转换成DITA
▲ 搜索“大龙谈智能内容”关注公众号▲

前阵子分享过一篇文章:《如何将Word/PDF转成高质量XML》。
文章中分享了将Word/PDF转换成高质量XML的思路和大体步骤。有朋友问:有什么工具可以做这个数据转换,具体怎么操作呢?
今天就来分享一种将MS Word转换成DITA的工具和步骤。
- 1 -
目的
在开始结构化写作之前,企业已经拥有了大量的文档。这些文档主要使用MS Word进行编写。
为了更好地进行内容管理和维护(支持重用),企业需要将这些现存的MS Word格式的文档转换为DITA格式。转换过程完成后,企业就可以使用DITA格式进行文档的维护和升级,确保内容的一致性和准确性。
- 2 -
工具
今天我们使用Oxygen XML Editor来进行转换。
Oxygen XML Editor是罗马尼亚的SyncRO Soft公司研制的一款XML文档编辑器。
Oxygen XML Editor默认不带内容转换功能,需要安装一个叫做批量文档转换器(Batch Document Converter)的插件。
安装批量文档转换器插件
1)运行Oxygen XML Editor
2)点击菜单:帮助 -> 安装新的加载项
3) 在弹出窗口”安装新的加载项“中选择”Batch Document Converter“,然后点击”下一步“

4)在”许可证和签名“页的下方选择”我接受最终用户许可协议的所有条款“,然后点”安装“按钮

5)安装完成后,关闭并重新启动Oxygen XML Editor
6)可以看到菜单:工具 -> 批量文档转换器,这里有将多种格式转换的选项

- 3 -
操作步骤
1)清理MS Word文件内容的格式
转换的第一步是清理MS Word内容的格式,确保内容使用正确的MS Word格式(俗称”刷格式“)并且整个文档一致。
比如:标题1的内容确实使用”标题1“格式,而不是用”正文“并使用二号字来表示。 只有标题1才会被转换成DITA标题,正文将被转换成段落。

请从头到尾根据需要设置文字的格式,确保Word文件的内容使用正确的格式。
2)运行Oxygen XML Editor并打开菜单:工具 -> 批量文档转换器,选择”Word到DITA"
3)在”Word到DITA"窗口,点击“添加文件”,将刷好格式的Word文件选择进来

4)设置“转换选项” - [可选]
Oxygen XML Editor默认对转换进行了配置,点击“转换选项”可以看到这些配置。根据需要可以对配置进行调整。
一般情况下我们使用默认的配置即可。
5)点击“转换”按钮进行转换
工具将MS Word转成DITA并放到word文件所在目录的output子目录下。
它生成一个ditamap文件和多个dita文件。

6)对转换好的DITA文件进行审核和调整
在Oxygen XML Editor中选择菜单:文件 -> 打开,并选择ditamap,就可以看到转换好的DITA文件了。 
从工具栏选择“带属性的完整标记”,切换到显示标记模式。从左侧的目录中双击并打开文件, 逐个检查生成的ditamap和dita文件中的内容和标签是否和期望的一样,并根据需要做相应修改。

这样我们就将MS Word转换成DITA。如果有任何问题,请评论区留言和我交流。
摩拿科技是罗马尼亚SyncRO Soft公司授权软件增值经销商(Software Value Added Reseller)并提供技术服务
请微信扫码了解

相关文章:
怎样使用Oxygen XML Editor将MS Word转换成DITA
▲ 搜索“大龙谈智能内容”关注公众号▲ 前阵子分享过一篇文章:《如何将Word/PDF转成高质量XML》。 文章中分享了将Word/PDF转换成高质量XML的思路和大体步骤。有朋友问:有什么工具可以做这个数据转换,具体怎么操作呢? 今天就来…...
【云上建站】快速在云上构建个人网站3——网站选型和搭建
快速在云上构建个人网站3——网站选型和搭建 一、网站选型二、云市场镜像方式一:方式二:1. 进入ECS实例详情页面,点击停止,确保更换操作系统的之前ECS实例处于已停止状态,点击更换操作系统,进行镜像配置。2…...
给你一个未排序的整数数组 nums ,请你找出其中没有出现的最小的正整数
这个算法的核心思想是通过交换操作,将每个数放到它应该在的位置上。然后再次遍历数组,找到第一个不在正确位置上的数,其索引加一即为缺失的最小正整数。 def first_missing_positive(nums):n len(nums)# 第一次遍历,将数组中的每…...
C#使用RabbitMQ-4_路由模式(直连交换机)
简介 RabbitMQ中的路由模式是一种根据Routing Key有条件地将消息筛选后发送给消费者的模式。在路由模式中,生产者向交换机发送消息时,会指定一个Routing Key。交换机接收生产者的消息后,根据消息的Routing Key将其路由到与Routing Key完全匹…...
PyTorch 之 nn.Parameter
文章目录 使用方法:为什么使用 nn.Parameter:示例使用: 在 PyTorch 中,nn.Parameter 是一个类,用于将张量包装成可学习的参数。它是 torch.Tensor 的子类,但被设计成可以被优化器更新的参数。通过将张量包装…...
KAFKA高可用架构涉及常用功能整理
KAFKA高可用架构涉及常用功能整理 1. kafka的高可用系统架构和相关组件2. kafka的核心参数2.1 常规配置2.2 特殊优化配置 3. kafka常用命令3.1 常用基础命令3.1.1 创建topic3.1.2 获取集群的topic列表3.1.3 获取集群的topic详情3.1.4 删除集群的topic3.1.5 获取集群的消费组列表…...
3d模型上的材质怎么删除---模大狮模型网
在大多数3D软件中,可以通过以下步骤来删除3D模型上的材质: 选择要删除材质的模型:首先,从场景中选择包含目标材质的模型。可以使用选择工具或按名称查找模型。 进入编辑模式:将模型切换到编辑模式。这通常需要选择相应…...
leetcode hot100跳跃游戏Ⅱ
本题和上一题还是有不一样的地方,这个题中,我们需要记录我们跳跃的步数并尽可能的满足最小的跳跃步数到达终点。 那么我们还是采用覆盖范围的概念,但是我们需要两个,一个是在当前位置的覆盖范围,另一个是下一步的覆盖…...
大数据期望最大化(EM)算法:从理论到实战全解析
文章目录 大数据期望最大化(EM)算法:从理论到实战全解析一、引言概率模型与隐变量极大似然估计(MLE)Jensen不等式 二、基础数学原理条件概率与联合概率似然函数Kullback-Leibler散度贝叶斯推断 三、EM算法的核心思想期…...
【鸿蒙】大模型对话应用(二):对话界面设计与实现
Demo介绍 本demo对接阿里云和百度的大模型API,实现一个简单的对话应用。 DecEco Studio版本:DevEco Studio 3.1.1 Release HarmonyOS SDK版本:API9 关键点:ArkTS、ArkUI、UIAbility、网络http请求、列表布局、层叠布局 对话页…...
MySQL 导入数据
我们可以将已有的数据导入到MySQL数据库中,下面是几种方式: 1、mysql 命令导入 使用 mysql 命令导入语法格式为: mysql -u用户名 -p密码 < 要导入的数据库数据(shulanxt.sql) 实例: # mysql -uroot -p123456 < …...
探索数字经济:从基础到前沿的奇妙旅程
新一轮技术革命方兴未艾,特别是以人工智能、大数据、物联网等为代表的数字技术革命,催生了一系列新技术、新产业、新模式,深刻改变着世界经济面貌。数字经济已成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。预估到20…...
【INTEL(ALTERA)】如何在 Windows 操作系统上设置 Design Space Explorer II 远程 SSH 场
说明 从英特尔 Quartus Prime Pro Edition 软件 22.1 版本开始,您可以选择使用 Windows OpenSSH 服务器设置 Design Space Explorer II (DSE II)。 解决方法 1.让 DSE II 与 OpenSSH 协同工作的第一步是 安装 OpenSSH。应在远程主机上安装 Op…...
Python编程-使用urllib进行网络爬虫常用内容梳理
Python编程-使用urllib进行网络爬虫常用内容梳理 使用urllib库进行基础网络请求 使用request发起网络请求 from urllib import request from http.client import HTTPResponseresponse: HTTPResponse request.urlopen(url"http://pkc/vul/sqli/sqli_str.php") pr…...
01 Redis的特性+下载安装启动+Redis自动启动+客户端连接
1.1 NoSQL NoSQL(“non-relational”, “Not Only SQL”),泛指非关系型的数据库。 键值存储数据库 : 就像 Map 一样的 key-value 对。如Redis文档数据库 : NoSQL 与关系型数据的结合,最像关系…...
C++发起Https请求
Wininet库忽略Https证书 相信很多朋友使用C WINAPI开发的时候网络模块的时候遇到Https忽悠证书无效的情况下, 仍然希望获取结果下列代码便是忽略异常的Https CA证书,下面对原理进行简单的讲解首先, 需要设置Https忽略需要用到如下结果函数与参数Interne…...
哪款笔记软件支持电脑和手机互通数据?
上班族在日常工作中,随手记录工作笔记已成为司空见惯的场景。例如:从快节奏的会议记录到灵感迸发的创意;跟踪项目进展,记录每个阶段的成果、问题和下一步计划;记录、更新工作任务清单等,工作笔记承载了职场…...
部署PXE高效批量网络装机
部署PXE高效批量网络装机 因在Cisco3850核心交换机中已开启DHCP 服务,因此不需要在配置DHCP服务。如果您的网络环境中也已有DHCP服务,也不用再配置DHCP服务了,直接部署PXE相关服务即可。 找一台linux系统的服务器,这本次试验用的是…...
【JavaEE】UDP协议与TCP协议
作者主页:paper jie_博客 本文作者:大家好,我是paper jie,感谢你阅读本文,欢迎一建三连哦。 本文于《JavaEE》专栏,本专栏是针对于大学生,编程小白精心打造的。笔者用重金(时间和精力)打造&…...
Leetcode—1828. 统计一个圆中点的数目【中等】
2024每日刷题(一零五) Leetcode—1828. 统计一个圆中点的数目 实现代码 class Solution { public:vector<int> countPoints(vector<vector<int>>& points, vector<vector<int>>& queries) {vector<int> a…...
从零搭建一个疫情数据看板:用Python(pymysql+Flask+ECharts)实战全流程
从零搭建省级数据可视化看板:Python全栈技术实战 最近几年,数据可视化在各行各业的应用越来越广泛。无论是企业内部的运营数据监控,还是面向公众的信息展示,一个直观、动态的数据看板都能极大提升信息传达效率。对于Python开发者来…...
Java SPI机制原理与实战
前言 在现代软件开发中,Java SPI机制原理与实战是一个非常重要的技术点。本文将从原理到实践,带你深入理解这一技术,并通过完整的代码示例帮助你快速掌握核心知识点。 核心概念 基本原理 Java SPI机制原理与实战的核心在于理解其底层机制。以…...
机器学习与模拟退火算法优化TPMS结构材料力学性能
1. 项目概述与核心价值在材料科学与先进制造领域,三周期极小曲面(Triply Periodic Minimal Surfaces, TPMS)结构正掀起一场设计革命。这类结构以其在三维空间内周期性重复、且具有极小表面积的特点,展现出传统实体材料难以企及的优…...
外观专利和实用新型
外观设计专利与实用新型专利:技术创新的法律双翼 谨以此文,献给每一位在产品创新与外观设计之间寻求法律护城河的工程师、架构师与技术决策者。外观设计专利与实用新型专利,如同一对孪生兄弟——一个守护“美学表达”,一个护卫“实用改进”;一个关乎“看起来怎样”,一个关…...
[智能体-41]:智能体识别调用外部工具:原理 + 判定手段 + Python 最简代码示例
一、核心识别逻辑大模型本身无工具调用能力,智能体靠三类判定手段判断是否要调工具:意图语义识别:用户问题超出模型静态知识库(实时数据、计算、联网、硬件操作!!!)格式规则匹配&…...
鸿蒙electron跨端框架PC墨案写作实战:把 Markdown 正文区做成桌面写作的中心
前言 欢迎加入鸿蒙PC开发者社区,共同打造开发者工具生态:鸿蒙PC开发者社区 :https://harmonypc.csdn.net/ 项目开源地址:https://AtomGit.com/lqjmac/ele-moanxiezuo 墨案写作这个小工具看起来轻,但真正落地时要先把…...
AI与建模仿真融合:数字孪生从静态走向智能的核心路径与实践
1. 项目概述:当AI遇见建模仿真,数字孪生进入“觉醒”时代最近几年,数字孪生这个概念火得一塌糊涂,从智能制造到智慧城市,再到医疗健康,几乎每个行业都在谈论它。但说实话,很多项目做出来&#x…...
Bittensor:去中心化AI网络的架构、挑战与激励模型优化
1. 项目概述:当AI遇上去中心化,Bittensor在解决什么核心问题?最近几年,AI模型的能力突飞猛进,但一个越来越明显的趋势是,顶尖的AI能力正快速向少数几家科技巨头集中。无论是训练所需的算力、高质量的数据集…...
Qwen模型 LeetCode 2581. 统计可能的树根数目 C++实现
哈哈,看来你对这道题特别感兴趣呀!让我给你一个**终极优化版**的C实现,这次用位运算哈希 向量预分配,保证又快又稳!cpp class Solution { public:int rootCount(vector<vector<int>>& edges, vector&…...
Ubuntu 20.04上virt-manager报GDBus错误?别慌,三步排查法搞定‘Message recipient disconnected‘
Ubuntu 20.04 virt-manager报GDBus错误的深度排查指南当你在Ubuntu 20.04上使用virt-manager管理KVM虚拟机时,突然遇到"GDBus.Error:org.freedesktop.DBus.Error.NoReply: Message recipient disconnected"这样的错误提示,确实会让人感到困惑。…...
