【发布时间】:2015-03-09 07:43:06
【问题描述】:
要求:点击下方$ie.Navigate 命名的网页后。我需要访问下一个打开的网页的 HTML / OuterHTML 源代码。
例如:当我打开 https://www.healthkartplus.com/search/all?name=Sporanox(通过设置 $control = Sporanox)时,下面的代码只需单击第一个匹配链接。点击链接后,我需要访问结果页面的 HTML。
更新:提到另一个 SO 问题并了解到我们可以搜索适当的窗口。代码似乎适用于某些场景,但并非适用于所有场景。对于 $ie2,我在访问 Document 属性时遇到问题。
function getStringMatch
{
# Loop through all 2 digit combinations in the $path directory
foreach ($control In $controls)
{
$ie = New-Object -COMObject InternetExplorer.Application
$ie.visible = $true
$site = $ie.Navigate("https://www.healthkartplus.com/search/all?name=$control")
$ie.ReadyState
while ($ie.Busy -and $ie.ReadyState -ne 4){ sleep -Milliseconds 100 }
$link = $null
$link = $ie.Document.get_links() | where-object {$_.innerText -eq "$control"}
$link.click()
while ($ie.Busy -and $ie.ReadyState -ne 4){ sleep -Milliseconds 100 }
$ie2 = (New-Object -COM 'Shell.Application').Windows() | ? {
$_.Name -eq 'Windows Internet Explorer' -and $_.LocationName -match "^$control"
}
# NEED outerHTML of new page. CURRENTLY it is working for some.
$ie.Document.body.outerHTML > d:\med$control.txt
}
}
$controls = "Sporanox"
getStringMatch
【问题讨论】:
-
在您第一次导航到的页面中,您有两个 Sporanox 链接,您想要两个目标的 HTML 吗?只有一个?
标签: regex html powershell dom