分类 Python 下的文章 - Lan小站-嗯，不错！

登录 / 注册

Lan

累计撰写 616 篇文章
累计收到 629 条评论

搜索到 143 篇与的结果

2020-04-24
论坛自动签到教程为了方便且于是自己搭建了一个论坛，bbs.lanol.cn其他论坛也都是一个原理方法很简单大致流程：1，抓取签到的那个包，这一步直接使用浏览器操作即可。2，用python模拟发包，达到签到的效果第一步，抓取签到的包打开目标网站进入签到页面右键，点击检查或者按F12右侧选择Network抓取之前清空一下，方便等下识别哪个包是签到的在签到这里随便选择，填写一下然后点击开始签到就会发现右侧多了一个一个plugin。。。的东西这应该就是那个发送签到的请求了，点开看一下往下翻，可以看到我们刚刚签到时填写的内容。至此，抓包已经完成了第二步，用python帮我签到。一开始直接导入resquestsimport requestsurl就是下图中的request urlrequest method在图中也可以看到是post请求headers 我们就只要把cookie和ua取下来就行了，cookie当作密码，ua用来伪装爬虫data就是最下面的最终的代码是这样的import requests url = 'https://bbs.lanol.cn/plugin.php?id=dsu_paulsign:sign&operation=qiandao&infloat=1&inajax=1' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36', 'cookie': 'UM_distinctid=1714a0bf24892-0609c53ff921e-5313f6f-144000-1714a0bf24924c; y97u_2132_saltkey=lKA5yQLQ; ' 'y97u_2132_lastvisit=1586420041; ' 'y97u_2132_ulastactivity=1c93SeUmVdFPkdPiyF%2BNzzXzMIGaLIyIpVgy8vrn3MYENm%2FYy6uH; ' 'y97u_2132_nofavfid=1; y97u_2132_sid=fMB8NH; y97u_2132_onlineusernum=1; y97u_2132_sendmail=1; ' 'y97u_2132_seccode=21.68cbf3245b60f72363; ' 'y97u_2132_auth=9f7aUZbzGYauXDKXfFuNw4qQQanEpDQJD6gDDeaH884krZJs3z%2FYvkC%2FinizPg4pFjXAgFsr6NrLuT7' '%2FKqI2; y97u_2132_lastcheckfeed=6%7C1586424079; y97u_2132_checkfollow=1; y97u_2132_checkpm=1; ' 'y97u_2132_lastact=1586424083%09plugin.php%09', } data = { 'formhash': 'f0f241b5', 'qdxq': 'nu', 'qdmode': '2', 'todaysay': '', 'fastreply': '0', } html = requests.post(url=url, headers=headers, data=data).text print(html)测试结果：能看到这里说明你已经很不错了，这是隐藏的第三步，每天自动签到腾讯云函数可以帮你每天定时运行python代码，而且还有一定的免费额度，平时签到啥的够用了腾讯云函数地址：https://console.cloud.tencent.com/scf/index?rid=1教程开始：然后把代码全部粘贴到这里就行了点击完成新建触发方式这里就可以根据自己需求填写了有时候虽然会提示调用失败，但是其实已经签到成功了
- 2020年04月24日
- 5,510 阅读
- 0 评论
- 0 点赞
2020-04-22
自动生成和安装requirements.txt依赖生成requirements.txt文件pip freeze > requirements.txt安装requirements.txt依赖pip install -r requirements.txt
- 2020年04月22日
- 848 阅读
- 0 评论
- 0 点赞
2020-04-21
用python获取易班文章评论信息 import requests url = 'https://www.yiban.cn/forum/reply/listAjax' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36', } data = { 'channel_id': '289081', 'puid': '13088902', 'article_id': '121116137', 'page': '1', 'size': '200', 'order': '1', } html = requests.post(headers=headers, data=data, url=url).json() data = html['data']['list'] content = [] floor = [] createTime = [] name = [] nameid = [] nick = [] counts = len(data) for i in range(counts - 1): commen = data[str(i)] con = commen['content'] content.append(str(con).replace(' ', '')) floor.append(commen['floor']) createTime.append(commen['createTime']) name.append(commen['user']['name']) nameid.append(commen['user']['id']) nick.append(commen['user']['nick']) with open('result.csv', 'a+',encoding='utf-') as f: f.write('姓名}用户id}昵称}楼层}评论时间}评论内容') for i in range(len(name)): f.write( name[i] + "}" + nameid[i] + "}" + nick[i] + "}" + floor[i] + "}" + createTime[i] + "}" + content[i] + " ")
- 2020年04月21日
- 1,152 阅读
- 0 评论
- 0 点赞
2020-04-18
python代理IP池爬取 import parsel import requests url = '' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36', } html = requests.get(url=url, headers=headers).text html = parsel.Selector(html) Ip = html.xpath('//td[@data-title="IP"]/text()').extract() Port = html.xpath('//td[@data-title="PORT"]/text()').extract() LeiXing = html.xpath('//td[@data-title="类型"]/text()').extract() result = [] for i in range(len(Ip)): a = (LeiXing[i] + '://' + Ip[i] + ':' + Port[i]) pro = {LeiXing[i]: a} result.append(pro) for i in result: try: ssss = requests.get(url='http://www.baidu.com', headers=headers, proxies=i, timeout=1).status_code if ssss == 200: print(i) except: print('不合格')
- 2020年04月18日
- 879 阅读
- 0 评论
- 1 点赞
2020-04-12
Python 3 速查卡 PDF下载地址：点击进入GitHub地址：https://perso.limsi.fr/pointal/python:memento
- 2020年04月12日
- 962 阅读
- 0 评论
- 0 点赞
2020-04-12
pycharm连接GitHub出现Connection reset 开启自动代理就好了
- 2020年04月12日
- 1,319 阅读
- 0 评论
- 0 点赞
2020-04-10
python爬虫头部文件自动加引号脚本 import re headers_str = ''' formhash: f0f241b5 qdxq: nu qdmode: 2 todaysay: fastreply: 0 ''' pattern = '^(.*?): (.*)$' for line in headers_str.splitlines(): print(re.sub(pattern, '\'\\1\': \'\\2\',', line))
- 2020年04月10日
- 831 阅读
- 0 评论
- 0 点赞