Google hack语法

intext:关键字,把网页正文中某个关键字做为搜索条件,然后搜索全世界网页正文中含有这些关键字的网页。

allintext:关键字。与intext功能相同 。

intitle:关键字,把网页标题中某个关键字做为搜索条件,然后搜索全世界网页标题中含有这些关键字的网页。

allintitle:关键字,功能相同。

cache:关键字。搜索含有关键字内容的 cache。比如搜索北京大学网站服务器中缓存的内容,cache:pku.edu.cn。

define:关键字。
搜索关键字的定义。比如查找 html 的定义

filetype:文件名.后缀名。
搜索特定的文件。比如我要搜索信息安全方面的论文,我们输入“信息安全论文
filetype:doc”就可以找到了。

info:关键字。
这个语法用于搜索指定站点的一些基本信息。比如搜索北京大学网站的一些信息。

inurl:关键字。
搜索含有关键字的 URL 地址。这个语法非常的重要,使用的也是最为频繁,我们还可以使用 allinurl 来更加精确的定位 URL 地址。比如搜索含有 movie 的 URL 地址,输入“inurl:movie”即可,那么找出来的大部分是电影网站。

link:关键字。查找与关键字做了链接的 URL 地址,利用它我们可能搜索到一些敏感信息。

site:域名。返回域名中所有的 URL 地址,它可以探测网站的拓扑结构进行,也是非常的重要,使用非常频繁。比如搜索北京大学所有学院的 URL 地址,我们输入“学院 site:pku.edu.cn”就可以搜索到它所有的学院

related:URL
搜索与指定 URL 相关的页面。比如搜索与北京大学相关的网页,我们输入关键字
“related:pku.edu.cn”即可看到。

stocks:搜索有关一家公司的股票市场信息
insubject:搜索 Google 组的标题行
msgid:搜索识别新闻组帖子的 Google 组信息标识符和字符串
group:搜索 Google 组搜索词汇帖子的题目
author:搜索新闻组帖子的作者
bphonebook:仅搜索商业电话号码簿
rphonebook:仅搜索住宅电话号码簿
phonebook:搜索商业或者住宅电话号码簿
daterange:搜索某个日期范围内 Google 做索引的网页
inanchor:搜索一个 HTML 标记中的一个链接的文本表现形式。

不过需要注意以下几点:(大概和正则匹配表达式无太大差别)
google 搜索多个关键字时之间用间隔。空格表示逻辑与操作。
google 中-表示逻辑非操作。如 A-C 表示搜索有 A 但没 C 的网页。
google 中 OR 表示逻辑或。如 AORB 表示搜索含有 A 的网页 B 的网页 和同时含 A 和 B 的网页。
google 中精确搜索用双引号,比如我们搜索脚本黑客和"脚本黑客",两者之间的差别就是一个双引号,显示了他们搜索结果的差别。

google 中的通配符。*表示一连串字符,?代表单个字符。含有通配符的关键字要用引号。
google 对英文关键字的大小写不敏感。
google 对出现频率极高的英文单词做忽略处理。如 . com i www http 等。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的”+”号。
google 大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
还有一点就是,可能大家都知道 BAIDU 的网页快照,其实 Google 也有这个功能
的,他的 URL 地址是 http://www.googlesyndicatedsearch.com/u/berkeley,比如我们要快照北京大学,那么输入北京大学(pku.edu.cn)的网址就可以了。

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注