【发布时间】:2014-07-17 22:53:04
【问题描述】:
我添加了一个上传表单,以便人们可以将 HTML 文件上传到我的网站。如何解析 HTML 文件以在网站上创建内容页面?目前,我只需要获取文件的标题和正文,所以我认为像 Nokogiri 这样成熟的解析器会过大。
#this takes in a <ActionDispatch::Http::UploadedFile>
def import(file)
#code to get title and body?
end
【问题讨论】:
-
像 Nokogiri 这样的解析器可能仍然是最好的。解析 HTML 并不愉快,尤其是当它以任何方式无效嵌套时。
-
@pdobb,好的,我试试看。
标签: ruby-on-rails file-upload ruby-on-rails-4 html-parsing