php search image crawler
1.0.0
这是一段简单的代码,允许您仅使用 PHP 在 Google 和 Bing 等网络搜索引擎上搜索图像
克隆这个项目
将您的内容复制到 Apache 或 Nginx 公共文件夹中,例如/var/www
或类似的内容
打开浏览器
这段代码的魔力发生在文件services/ImageBySearchEngine.php
上,这是一个面向对象的文件,有一个名为search()
方法
<?php$data = [];try{require_once "services/ImageBySearchEngine.php"; $query = "可爱的小猫"; //你要搜索的查询$limit = 10; //要显示的图片数量$search_engine = "google"; // 搜索引擎键。您也可以使用“bing”。$imageBySearchEngine = new ImageBySearchEngine();$images = $imageBySearchEngine->search( $query, $limit, $search_engine ); if(count($images) === 0)抛出新的异常(“无法从给定的查询中找到任何图像”); $数据[“图像”] = $图像; } catch (异常 $e){$data["message"] = $e->getMessage(); }
你将收到一个像这样的数组
数组(10){ [0]=>数组(1) { [“uri”] => 字符串(121)“https://crypted-tbn0.gstatic.com/images?q=tbn:ANd9GcSnFm8xIu_nPgVZ7Xw-w5wClwiBExSJDeMNARLeu8hmy7xLQgXuaY8Yp4tqcc&s”} [1]=>数组(1) { [“uri”]=> 字符串(121)“https://crypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRDIa6b2ZyHQSGpBBVBi3Sf50AEaUhCM-CJyAI4qTm4yvsvvUrHDfw4N9LBCQQ&s”} [2]=>数组(1) { [“uri”]=> 字符串(120)“https://crypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQgYZXBCpD4K5WjwpiK24HcPewCa9WigE08GMcY7Hf1lPpk1ecJwfiVgZRJQA&s”} }
或者,如果您愿意,也可以使用如下 JSON:
{“图像”:[ {“uri”:“https://crypted-tbn0.gstatic.com/images?q=tbn:ANd9GcSnFm8xIu_nPgVZ7Xw-w5wClwiBExSJDeMNANRLeu8hmy7xLQgXuaY8Yp4tqcc&s”}, {“uri”:“https://crypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRDIa6b2ZyHQSGpBBVBi3Sf50AEaUhCM-CJyAI4qTm4yvsvvUrHDfw4N9LBCQQ&s”}, {“uri”:“https://crypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQgYZXBCpD4K5WjwpiK24HcPewCa9WigE08GMcY7Hf1lPpk1ecJwfiVgZRJQA&s”} ] }
你如何使用这个工具不是我的责任。
我为大学作业构建了这个简单的脚本,以展示如何使用 PHP 实现爬虫。
我更喜欢使用 Google Images 和 Bing Images,因为这是我们如何使用 DOM 操作页面上的元素的一个很好的例子。
但是,我们可以使用其他网站,例如 Google 地图、Bing Images、Instagram、Facebook 或任何其他网站。
Google 服务条款和 Microsoft 服务协议可以向您解释有关其政策和条款的更多信息。
做一个有道德的开发商!
请参阅每个项目的风格和贡献指南来提交补丁和添加内容。一般来说,我们遵循“fork-and-pull”Git 工作流程。
在 GitHub 上分叉该存储库
将项目克隆到您自己的机器上
将更改提交到您自己的分支
将你的工作推回到你的叉子上
提交 Pull 请求,以便我们审核您的更改
注意:在发出拉取请求之前,请务必合并来自“上游”的最新内容!