【发布时间】:2011-12-01 09:29:03
【问题描述】:
我正在开展一个项目,该项目将包含数百万个我想保存在硬盘中的小 mp3 文件。
我有以下问题:
- 我应该使用什么结构来保存文件?一个文件夹或 许多文件夹。
- 搜索的最佳方式是什么?
【问题讨论】:
-
这感觉非常开放——“为我设计我的软件”,而“最好”取决于很多事情。
标签: c# search filesystems
我正在开展一个项目,该项目将包含数百万个我想保存在硬盘中的小 mp3 文件。
我有以下问题:
【问题讨论】:
标签: c# search filesystems
我不得不在一个涉及存储大量图像的项目上做类似的事情。使用文件的一些元数据,我生成了一个 MD5 哈希值,然后用作文件名。文件名的第一个字符是文件的祖父目录,第二个字符是父目录。导致文件结构如下:
这具有使文件均匀分布在目录中的优点。而且,如果您选择了用于生成哈希的元数据,那么它还具有无需使用数据库来存储对文件的引用即可找到文件的优势。
我发现这种方法可以很好地处理 100k 左右的文件,但如果没有更多关于您正在尝试做什么的信息,很难知道它是否适合您的问题...
【讨论】:
最好的方法可能是将要搜索的信息存储在数据库中并使用它进行搜索。然后,您可以使用 Lucene 或 Solr 之类的工具进行搜索。
数据库会将对该文件的引用存储在磁盘上,并在搜索弹出它的结果时直接使用它。这意味着您可以按您喜欢的任何顺序组织磁盘上的文件。
但是,如果没有更多信息,这实际上只是一个猜测。
【讨论】: