【问题标题】:Convert docx to mediawiki and preserve [[Image:]]将 docx 转换为 mediawiki 并保留 [[Image:]]
【发布时间】:2015-02-11 15:23:00
【问题描述】:

目前,我正在尝试将 docx 移动到 mediawiki 文件并在 [[Image:]] 标签中保留正确的文件名。出于某种原因,正确的图像文件被吞噬了(即,通常它是media/image4.jpg,但它只是空的)。

我已经尝试提取 docx 并查看 docx/word/_rels/document.xml.rels,但我不知道如何找出复制的图像。我做了一个简单的脚本来做一些查找/替换,但在一个文件中我有 130 个 [[Image:]] 标签和只有 105 个图像。

因此,我希望 MediaWiki 过滤器在执行此操作时输出正确的图像名称:

soffice --headless --convert-to txt:MediaWiki myfile.docx

我在 ubuntu 14.10 上。

这可能吗?

【问题讨论】:

  • 为什么不能直接将图片嵌入到文档文件中? (我个人也会使用像 OpenDocument odt 这样的正确文档格式。)
  • 因为这是一项公司任务,将大量旧文档转换为 mediawiki 格式。它们必须按原样处理并正确转换,我最终做到了(见我的回答)。
  • 啊。从问题和答案来看,都不清楚您正在将文档转换为 wikitext 页面。
  • @Nemo 我曾怀疑“从 docx 转换为 mediawiki”在那里会很清楚地描述。

标签: converter mediawiki docx libreoffice soffice


【解决方案1】:

这似乎是不可能的,但我已经写了一个解决方法,发现 here 可以解决它。总而言之,我转换文件并手动管理图像的上传/链接。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-07-10
    • 2015-04-29
    • 2017-02-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多