有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

软件和网站开发以及相关技术探讨
回复
头像
lotutu
帖子: 730
注册时间: 2010-12-23 16:29
来自: 北京
送出感谢: 8 次
接收感谢: 8 次

有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#1

帖子 lotutu » 2011-01-20 9:36

我们搜索东西的时候,都会出现搜索结果, 给出好多去某些网站的链接. 我想知道这个结果页的地址是怎么生成的,有谁研究过这个吗?
头像
lotutu
帖子: 730
注册时间: 2010-12-23 16:29
来自: 北京
送出感谢: 8 次
接收感谢: 8 次

Re: 有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#2

帖子 lotutu » 2011-01-20 10:22

比如谷歌搜索Ubuntu得到 http://www.google.com.hk/search?hl=zh-C ... =&aql=&oq=
搜索Linux得到
http://www.google.com.hk/search?hl=zh-C ... =&aql=&oq=
搜索Linux ubuntu得到
http://www.google.com.hk/search?hl=zh-C ... =&aql=&oq=

初步看起来这三个url都是由&符号分开的模块构成, 差别在于q=这一部分. 前面一些模块比较容易理解,可是
btnG那一部分的好多%符号就不明白是什么意思了

另外最后四个aq aqi aql op也不明白是什么意思
头像
lotutu
帖子: 730
注册时间: 2010-12-23 16:29
来自: 北京
送出感谢: 8 次
接收感谢: 8 次

Re: 有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#3

帖子 lotutu » 2011-01-20 10:33

百度的看起来就比较简单一点,我先搜索Ubuntu, 然后在其结果页的搜索框中再搜索Linux,得到

http://www.baidu.com/s?bs=Ubuntu&f=8&wd=Linux
头像
lotutu
帖子: 730
注册时间: 2010-12-23 16:29
来自: 北京
送出感谢: 8 次
接收感谢: 8 次

Re: 有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#4

帖子 lotutu » 2011-01-20 10:45

刚才我试了试,用百度的规则的确比较简单,如
http://www.baidu.com/s?wd=Linux
是搜索Linux的结果, 把linux改为别的词,就是搜索那个词的结果页.
只是中文比较麻烦, 好像都是%%的符号, 不知道该怎么由中文得到对应的符号
头像
lotutu
帖子: 730
注册时间: 2010-12-23 16:29
来自: 北京
送出感谢: 8 次
接收感谢: 8 次

Re: 有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#5

帖子 lotutu » 2011-01-20 11:45

刚刚试了试百度搜索 "Linux" ,url中部分为
wd=%22Linux%22, 双引号转换为了%22. 而在字符表中, 双引号对应的恰为 0x22.
是不是说明那些乱码符号都是从汉字符号等转化来的utf8或者unicode字符. 这样说来就简单好多
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙
送出感谢: 4 次
接收感谢: 256 次

Re: 有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#6

帖子 eexpress » 2011-01-20 14:33

很多网站都有post的功能啊。
搜索post get的区别。
这些用户感谢了作者 eexpress 于这个帖子:
lotutu (2011-10-29 7:55)
评价: 3.7%
● 鸣学
头像
lotutu
帖子: 730
注册时间: 2010-12-23 16:29
来自: 北京
送出感谢: 8 次
接收感谢: 8 次

Re: 有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#7

帖子 lotutu » 2011-01-20 16:56

Get post看得一头雾水
头像
sizeof
帖子: 7
注册时间: 2010-11-17 6:06
送出感谢: 0
接收感谢: 0

Re: 有谁研究过搜索引擎搜索结果页的Url生成规则了吗?

#8

帖子 sizeof » 2011-05-14 1:53

this question is very not has horizontal
回复

回到 “软件/网站开发”