【发布时间】:2015-02-11 15:23:00
【问题描述】:
目前,我正在尝试将 docx 移动到 mediawiki 文件并在 [[Image:]] 标签中保留正确的文件名。出于某种原因,正确的图像文件被吞噬了(即,通常它是media/image4.jpg,但它只是空的)。
我已经尝试提取 docx 并查看 docx/word/_rels/document.xml.rels,但我不知道如何找出复制的图像。我做了一个简单的脚本来做一些查找/替换,但在一个文件中我有 130 个 [[Image:]] 标签和只有 105 个图像。
因此,我希望 MediaWiki 过滤器在执行此操作时输出正确的图像名称:
soffice --headless --convert-to txt:MediaWiki myfile.docx
我在 ubuntu 14.10 上。
这可能吗?
【问题讨论】:
-
为什么不能直接将图片嵌入到文档文件中? (我个人也会使用像 OpenDocument odt 这样的正确文档格式。)
-
因为这是一项公司任务,将大量旧文档转换为 mediawiki 格式。它们必须按原样处理并正确转换,我最终做到了(见我的回答)。
-
啊。从问题和答案来看,都不清楚您正在将文档转换为 wikitext 页面。
-
@Nemo 我曾怀疑“从 docx 转换为 mediawiki”在那里会很清楚地描述。
标签: converter mediawiki docx libreoffice soffice