前段时间为了查找自己的老王python的关键词排名怎么样,特意用python写了一个查找网页关键词排名的程序,感觉效果还不错。特别是查找关键词排名靠后的网页来说非常的方便,不用自己手动的去一个个的翻页,废话不说了,赶快上代码。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#@author:wl
#@qq:280026798@qq.com
#@description:检测给定的关键字在百度上的排名

import sys
import urllib ,urllib2
import re

def baidu(w,pn):
    '''返回当前页的内容'''
    url= "http://www.baidu.com/s?"
    values = {
    "w":w.encode('gbk','ignore'),
    "pn":pn
    }
    data = urllib.urlencode(values)
    newurl = url + data
    response = urllib2.urlopen(newurl)
    the_page = response.read()
    return the_page

def ana(data,mysite,pn):
    '''检测关键字的位置'''
    o = re.compile(r'href="(.+?)"')
    f = o.findall(data)
    line = pn
    for ff in f:
        ff = ff.strip() 
        if not re.search("^s\?",ff) and re.search("^http:\/\/",ff) and not re.search('baidu.com',ff):
            if re.search(mysite,ff):
                print "* " ,line ,ff
                return True
            else:
                print line,ff
                line = line + 1
                continue
        
   
if __name__ == "__main__":
    mysite = sys.argv[2]
    pn = 1
    while True:
        keyword = sys.argv[1].decode('gbk')
        data = baidu(keyword,pn)
        checkflag = ana(data,mysite,pn)
        if not checkflag:
            pn = pn + 10
            print "page %s" % str(int(pn)/10)
        else:
            print 'found:%s' % (mysite)
            break
    else:
        print 'not found:%s' % (mysite)
 
用法:
 
先保存成python文件,然后要运行的话,可以按照下面的步骤。
 
python xxx.py 关键词 网址
 
就可以查出关键词在百度搜索列表的具体位置了。
 

python视频教程

评论列表

  • quote 8.随便起的称呼 post at 2012/3/8 17:32:31 回复该留言
  • 对了,还有,把
    keyword = sys.argv[1].decode('gbk')
    data = baidu(keyword,pn)
    checkflag = ana(data,mysite,pn)
    这三句放到while外面,效率更高
  • quote 6.cary929 post at 2011/9/17 16:46:43 回复该留言
  • 设置每页显示100条,效率更高
    laowang 于 2011-9-25 10:17:02 回复
    百度默认只能显示10页
  • quote 5.会唱歌的企鹅 post at 2011/5/30 13:43:07 回复该留言
  • 今天在百度上搜到你的博客,留个脚印,你的技术非常好啊。
    laowang 于 2011-6-7 21:46:08 回复
    呵呵,希望多多交流
  • quote 4.lang7 post at 2011/5/19 19:12:02 回复该留言
  • 接收 怎么不用getopt 呢·~ 感觉这样有提示的更好点..

    laowang 于 2011-6-7 21:45:53 回复
    你可以根据自己的需要来改下代码就OK了
  • quote 3.lang7 post at 2011/5/19 17:48:59 回复该留言
  • 。。。。。。。。。。。。。。 额·· 这事和我是不是新手没啥关系了·

    - -! IE 设置了代理··我用别的浏览器了·· 别的浏览器没使用代理..

    - -!!!!

    谢谢 无私的···奉献·~~
  • quote 2.lang7 post at 2011/5/19 17:34:43 回复该留言
  • 用起来是各种失败啊...我新手. 不会调试..


    http://www.baidu.com/s?pn=1&w=Crack
    连接能打开.但是各种提示 拒绝连接

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。