ScrapeBox使用教程 — 实用案例

独立站 杨海雄 3周前 (04-21) 187次浏览 0个评论
文章目录[隐藏]

SB 是一个非常有用的 SEO 工具,适用于各种各样的外贸业务,和不同的跨境推广目标。 小型外贸企业可以使用它来获取竞争对手数据,及其主要关键字的数据。 大型外贸工厂也可以使用它来抓取 hot selling 产品细节,收集研究、汇总数据,例如从 Twitter 等平台收集受众的数据,或者互动指标数等等。

然而,SB 也是一个危险的工具。 Scrapebox 不懂人类规则,你需要告诉它做什么。 如果你指令它做的动作,违反了你正在抓取的网站的条款和条件,很快就悲剧了,发现你的 IP 被屏蔽或你的帐户已被封号。因为对于被你爬取数据的站点,Scrapebox 的行为看起来非常像 DDoS 攻击。所以,你应该使用哪些设置来确保工具的安全使用呢,

1. Scrapebox 的 SEO 工作机制

SB 号称是 SEO 界的“瑞士军刀”,也挺形象,可以把它描述成一把刮刀,用于指向一个网页,并从该页面中用scrape刮取你需要的数据。由于 Scrapebox 是一种自动化工具,因此它在很大程度上依赖于 Web 代理(web proxies)。代理通过大量 IP 地址汇集流量,对于避免 IP bans 和 rate limits 非常有用。例如,如果您想在前 10 个 Google 搜索结果中刮取 1,000 个关键字的列表,Scrapebox 可以非常快速地完成此操作。但是,经过一定数量的快速点击(fast hits)后,Google 的机器会记录这个 IP 地址对其服务器的过多的快速调用(rapid calls),于是会要求输入验证码,将其吊用延时。

ScrapeBox使用教程 -- 实用案例

通过使用 1,000 个不同的 IP 地址 – 或者只有 200 个轮换(IP rotation),Scrapebox 装扮成单机点击,忽悠过谷歌的机器,谷歌不再认为是一个人在十分钟内提出了一千个不同的请求,他们的服务器会认为在 10 分钟的时间内,每 200 人提交 5 个请求。怎么说呢?对于股沟,这是一个非常合理的流量,于是谷歌甚至连眼都不用眨一下。

ScrapeBox使用教程 -- 实用案例

2. Scrapebox 绕过 API 获取数据能力

这就是 Scrapebox 的牛逼之处 -允许你访问大量数据,而你按照常规手段,通常无法快速访问它们,Scrapebox 则是这么干的:

请参考下面举例:
许多站点都提供了可用于提取数据的数据 API。
举例,Facebook 以他们的 Graph API 为数据 Interface。
如果你有一个具有 API 访问权限的 Facebook 应用程序,则可以提取有限类型的数据。
如果没有 FB 官方的 API 访问权限,或者您想要 Facebook API 无法提供的数据,则只能使用 Scrapebox 来获取 FB 的数据…

Scrapebox 成功地规避了 API 限制,可以获取 API 限制提供的数据,同时可以绕过速率限制,并且可以执行自动化的多步骤任务,以获取可能需要使用标准 API 进行多次重复调用,和数据过滤的数据。

![image-20220324195814860](/Users/yanghaixiong/Library/Application Support/typora-user-images/image-20220324195814860.png)

3. Scrapebox 功能亮点

Scrapebox 有许多不同的潜在功能,可用于在不同场景中搜索不同类型的数据。
✓ 针对指定关键词搜索
向 SB 自行 feed 关键字列表,然后 SB 机器访问不同的搜索引擎,以“收割(harvest)”这些关键字的搜索结果。
✓ 关键词衍生能力
可以为 SB 机器指定 1 个关键字或 1 个关键字列表,并使用搜索引擎自动填充功能,或者 spinoff 更多的衍生关键字列表。

![image-20220324195912010](/Users/yanghaixiong/Library/Application Support/typora-user-images/image-20220324195912010.png)

✓ IP Live 状态检查
可以向 SB 机器提供一个代理 IP 地址列表,SB 将遍历(go through)所有的代理 IP 地址,以检查是什么类型的代理,它使用什么协议(protocol),以及它是否仍在使用中(in service)。
✓ 批量博客评论
可以为 SB 机器其提供一个 URL 列表,SB 可以在所有这些 URL 上留下博客评论,可以根据需要添加大量或少量的评论外链。
✓ Backlin Profile Validity 检查
可以给 SB 机器提供一个链接列表,SB 将扫描以查看 HTTP status codes, originating pages, anchor text 等等的有效性。
✓ 批量检查 Alexa 排名
可以给 SB 机器提供一个 URL 列表,「David 锅微信:32661099」,SB 将批量检查提供这些 URL 的 Alexa 实时排名。
✓ 批量scrape article data
为 SB 机器提供一个 URL 列表,SB 将从这些 URL 中提取文章数据。
✓ Broken Links 检测
可以 feed 批量 URL 给 SB 机器,SB 将检测该站点上的链接,并识别任何损坏的链接,或者死链(broken links)。

![image-20220324195938201](/Users/yanghaixiong/Library/Application Support/typora-user-images/image-20220324195938201.png)

✓ 批量 Page Authority 检测
可以给 SB 机器提供一个 URL 列表,SB 将批量拉出这些 Pages 的 page authority。
✓ and more…
Scrapebox 的功能数不胜数,还有大量的基于 Scrapebox 应用程序的插件 add-ons 可供调用,


杨海雄 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:ScrapeBox使用教程 — 实用案例
喜欢 (0)

您必须 登录 才能发表评论!