【发布时间】:2014-08-02 09:04:47
【问题描述】:
有一个网页在加载时会随机放置表单/控件/谷歌广告。然而,该系列是封闭的——根据我的测试,至少有三种可能的变化,其中两种非常常见,第三种非常罕见。
我希望能够根据每个变体对该网页进行分类。我尝试分析每个变体的 html 源,但根据 Python 字符串 equals 和 Python difflib,所有变体的 html 完全相同。似乎没有任何信息指定放置谷歌广告或控件的位置。
例如,考虑一张带有两个框的图片,一个红色的(称为框 A)和一个蓝色的(称为框 B)。盒子本身永远不会改变位置,但是占据它们的位置的东西会改变。
现在考虑两种可能的变体,每次加载/打开网页时都会选择其中一种。
变体 1:假设 50% 的时间,谷歌广告位于框 A(红色),因此网站控件位于框 B(蓝色)。
变体 2:假设还有 50% 的时间,谷歌广告位于框 B(蓝色),因此网站控件位于框 A(红色)。
那么,如果我加载网页,如何根据其变化对其进行分类?
【问题讨论】: