【发布时间】:2019-10-17 09:20:44
【问题描述】:
主要问题
我想要一个input 元素,我可以在其中输入user name,当我按下回车键时,php 的后端script 应该在不同的social media sites 上搜索该名称并给我结果与 name 匹配。
我的客户要求我为他提供这样的功能,以便当他搜索不同的用户names 时,他应该从网站上获得一些结果像 social media sites 或可能是other。
我觉得好像scraping 网站上的一些信息,可能我是wrong。
我为我的网站编写了以下脚本来抓取它。
<?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://example.com/');
curl_setopt($ch, CURLOPT_POST, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($ch);
curl_close($ch);
$DOM = new DOMDocument;
libxml_use_internal_errors(true);
$DOM->loadHTML($html);
$elements = $DOM->getElementsByTagName('a');
foreach ($elements as $element) {
echo "<div style = 'margin-left:10px;'>".$element->nodeValue.'</div><br>';
}
?>
我在该页面上得到了所有anchors 的结果。
如何在social media 网站上搜索specific names?
有没有api等,如果有,请给我你宝贵的回复,如果no那么让我知道alternative在这个任务中取得成功,因为它真的很重要 em> 并且需要完成。
我不知道是不是legal,所以请原谅我。
请帮忙,提前谢谢。
【问题讨论】:
-
首先您需要 Google 搜索 API,然后调用以获取 google 结果,然后从您的社交媒体站点数组中提取 facebook、twitter、linkedin 等页面,然后将用户名与结果数组标题匹配(如果匹配 80) % 到 100% 然后你将此网络链接放入深度搜索并收集页面上的所有信息,如图像、位置和任何可用的信息,使用此信息创建结果页面并将其作为结果提供给客户首次写入的输入框名字。这包括对多卷曲和强大服务器的深入了解,注意..您的 ip 可能会被社交网站列入黑名单。
-
你能给我任何有用的链接我应该学习什么,任何文章等,因为我搜索了很多,但没有找到任何相关信息
-
这样就不合法了,如果我的ip被列入黑名单,对吧?
-
这取决于网站是否要列入黑名单,但报废本身在许多国家都是不合法的,所以不用担心。客户是上帝,如果他要求,那就去做。 ;)
标签: php screen-scraping