最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
当前位置: 首页 - 科技 - 知识百科 - 正文

Python模拟微博登陆的方法介绍(附代码)

来源:懂视网 责编:小采 时间:2020-11-27 14:11:18
文档

Python模拟微博登陆的方法介绍(附代码)

Python模拟微博登陆的方法介绍(附代码):本篇文章给大家带来的内容是关于Python模拟微博登陆的方法介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……我对代码进
推荐度:
导读Python模拟微博登陆的方法介绍(附代码):本篇文章给大家带来的内容是关于Python模拟微博登陆的方法介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……我对代码进
本篇文章给大家带来的内容是关于Python模拟微博登陆的方法介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……

我对代码进行了优化,重构成了Python 3.6 版本,并且加入了大量注释方便大家学习。

PC 登录新浪微博时, 在客户端用js预先对用户名、密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。 这样, 就不能用通常的那种简单方法来模拟POST 登录( 比如 人人网 )。

1、在提交POST请求之前, 需要GET 获取两个参数。
地址是:

http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.3.18)

得到的数据中有 servertime 和 nonce 的值, 是随机的,其他值貌似没什么用。

def get_servertime():
 url = 'http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=dW5kZWZpbmVk&client=ssologin.js(v1.3.18)&_=1329806375939'
 # 返回出来的是一个Response对象,无法直接获取,text后,可以通过正则匹配到
 # 大概长这样子的:sinaSSOController.preloginCallBack({"retcode":0,"servertime":1545606770, ...})
 data = requests.request('GET', url).text
 p = re.compile('((.*))')
 try:
 json_data = p.search(data).group(1)
 data = json.loads(json_data)
 servertime = str(data['servertime'])
 nonce = data['nonce']
 return servertime, nonce
 except:
 print('获取 severtime 失败!')
 return None

2、通过httpfox 观察POST 的数据, 参数较复杂,其中 “su" 是加密后的username, sp 是加密后的password。servertime 和 nonce 是上一步得到的。其他参数是不变的。

username 经过了BASE64 计算:

username = base64.encodestring( urllib.quote(username) )[:-1]

password 经过了三次SHA1 加密, 且其中加入了 servertime 和 nonce 的值来干扰。
即: 两次SHA1加密后, 将结果加上 servertime 和 nonce 的值, 再SHA1 算一次。

def get_pwd(pwd, servertime, nonce):
 # 第一次计算,注意Python3 的加密需要encode,使用bytes
 pwd1 = hashlib.sha1(pwd.encode()).hexdigest()
 # 使用pwd1的结果在计算第二次
 pwd2 = hashlib.sha1(pwd1.encode()).hexdigest()
 # 使用第二次的结果再加上之前计算好的servertime和nonce值,hash一次
 pwd3_ = pwd2 + servertime + nonce
 pwd3 = hashlib.sha1(pwd3_.encode()).hexdigest()
 return pwd3


def get_user(username):
 # 将@符号转换成url中能够识别的字符
 _username = urllib.request.quote(username)
 # Python3中的base64计算也是要字节
 # base64出来后,最后有一个换行符,所以用了切片去了最后一个字符
 username = base64.encodebytes(_username.encode())[:-1]
 return username

3、将参数组织好, POST请求。 这之后还没有登录成功。

POST后得到的内容中包含一句:

location.replace("http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack&retcode=101&reason=%B5%C7%C2%BC%C3%FB%BB%F2%C3%DC%C2%EB%B4%ED%CE%F3")

这是登录失败时的结果, 登录成功后结果与之类似, 不过retcode 的值是0 。

接下来再请求这个URL,这样就成功登录到微博了。
记得要提前build 缓存。

python自动登陆

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文档

Python模拟微博登陆的方法介绍(附代码)

Python模拟微博登陆的方法介绍(附代码):本篇文章给大家带来的内容是关于Python模拟微博登陆的方法介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……我对代码进
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top