当基于文本的文件上传到 Confluence(例如,Word,PowerPoint 等),这些文件中的文本是可以提取并且添加到索引中的,用户可以通过索引来搜索这些文件中的文本内容,不仅仅是搜索文件名。当文件需要被重新索引的时候,我们存储提取后的文本,我们不需要对文本中的内容重新进行索引。

提取后的文本文件,通常是以版本号进行命名的,例如 2.extracted_text, 同时还会存储文件自己的版本(如上面第八级目录中描述的)。我们只保存提取后文件的最新的版本,而不是和文件一样同时还保存了早期的版本。

 

https://www.cwiki.us/display/CONF6ZH/Hierarchical+File+System+Attachment+Storage

相关文章:

  • 2021-12-04
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-05-13
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2021-04-29
  • 2021-12-02
  • 2021-04-22
  • 2022-02-08
  • 2021-11-04
相关资源
相似解决方案