最新推荐
-
齐鲁银行网银助手3.0.0.5官方版 安全软件 / 3.0M
-
360安全卫士U盘病毒专杀(Autorun.inf专杀)13.0.0.213简体中文绿色免费版 安全软件 / 86.1M
-
360安全卫士U盘病毒专杀工具v13.0.0.213绿色免费版 安全软件 / 86.1M
-
360安全卫士修复工具v13.0.0.213免费版 安全软件 / 86.1M
-
360安全卫士超强查杀V13.0.0.213安装版 安全软件 / 86.1M
精品推荐
-
You123浏览器v5.10.12.116官方版 网络工具 / 57.9M
查看 -
LogViewPlus(日志分析工具)v2.5.51官方版 网络工具 / 31.3M
查看 -
RayLink(远程控制)v6.0.1.7官方版 网络工具 / 18.3M
查看 -
喜马拉雅v4.0.0官方免费版 网络工具 / 65.3M
查看 -
向日葵远程控制v13.2.0.55335官方版 网络工具 / 32.3M
查看
本类排行
详情介绍
关键词URL收集器是一款可以帮助用户批量收集指定关键词的URL的神器。如果您觉得在收集指定关键字的网址时遇到了很多麻烦,请不要犹豫使用这个完全免费的关键字网址收集器。输入指定关键词即可一键采集。
关键词URL收集器是一款可以帮助用户批量收集指定关键词的URL的神器。如果您觉得在收集指定关键字的网址时遇到了很多麻烦,请不要犹豫使用这个完全免费的关键字网址收集器。输入指定关键词即可一键采集。
基本介绍
输入关键字可收集各搜索引擎的网址、域名、标题、描述等信息,支持百度、搜狗、Google、Bing、雅虎、360等。每个关键字有600至800条。收集示例。关键词可以附带搜索引擎参数,就像在网页上输入关键词搜索一样。例如,在百度搜索结果URL中必须包含关键字bbs,则输入“keyword inurl”:bbs。
参考数据
#URL#:采集的原始URL
#title#:URL对应的网页标题
#域名#:原始URL的域名部分,如“http://test.shuimiao.net/123.htm”中的“test.shuimiao.net”
#顶级域名#:取原始URL的顶级域名部分,如“http://test.shuimiao.net/123.htm”中的“shuimiao.net”
#Description#:网页标题下方的描述性文字
常见问题
1、为什么采集一段时间后采集不到数据?
有可能收集了太多数据并受到搜索引擎的限制。重新启动软件即可继续采集。如果不更改,只能等搜索引擎解封后才能继续采集。百度的屏蔽时间一般是半小时到几个小时。
不过,现在即使验证码被屏蔽,软件也会弹出需要手动输入的验证码(百度、谷歌)
2、为什么不同批次的关键词采集结果中有些URL会重叠?
尤其是只引用#域名#或#顶级域名#后,出现部分URL重复的情况较多。这也很正常,因为每个网站的内部页面可能包含很多主题,并且从网站的不同内部页面可能收集到不同的关键词。当域名被引用时,同一网站的不同内部页面的域名结果自然会是相同的。
另外,软件中的自动去重,就是对本次采集的结果进行去重。之前收集的结果不在本次去重范围内。如果两次采集的结果中存在一些重复的URL,可以将它们合并在一起,并使用软件去重(水淼文本去重加扰码器)。
3. 为什么采集到的URL主题和关键词不匹配?
这是因为在#domainname#或#topleveldomain#被引用之后,域名部分被取走。域名打开网站首页,采集到的原始URL可能不是首页,而是网站文章的内页。内页包含关键词主题,因此被搜索引擎收录,可以被软件采集。但获取域名后,您打开的域名首页不一定包含该关键字。
为了比较采集是否正确,可以在保存的模板中输入:a href='#url#' target='_blank'#title#/a,保存为htm文件,采集完成后,你可以自己打开文件查看对比。
变更日志
1.转型支持OEM代理商
2.添加Bing和Yahoo收藏;多次改变
3、将Bing、Yahoo、Google改为https请求,避免某些情况下采集失败。
4.增加百度新闻采集。
5.一些更新。
6.添加关键词分割线选项。
7.修复无法采集百度最新变化的问题。
8.修复Bing变更收集失败的问题;修复部分电脑无法使用xmlhttps的问题(涉及Google、Bing、Yahoo)。