回享预备班:[6]分享杂志的发布步骤,加入回享计划成了签约作者后,除了写分享之外我们还可以采编杂志。杂志跟系列分享的功能相差不多,在我看来要比系列分享更具优点。杂志可以看作更简单直接明了的系列分享。我......
2023-03-19 349 百度经验
百度悬赏经验有钱赚,但是要想找到自己感兴趣的悬赏经验还真不是一个“高兴”的事情,如何让自己高兴起来,简单快速找到自己感兴趣的助学经验呢?本文将介绍如何通过Python编写程序来完成此任务。
百度悬赏经验有钱赚,但是要想找到自己感兴趣的悬赏经验还真不是一个“高兴”的事情,本文将介绍如何通过Python编写程序来查找兴趣悬赏经验的方法。
用Python获取网页数据通常用urllib和Beautiful Soup模块
其中urllib为Python自有模块,不需要安装。
Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式。Beautiful Soup会帮你节省数小时甚至数天的工作时间。
为Python安装BeautifulSoup模块,其命令为:
pipinstallbeautifulsoup4
打开百度经验悬赏令可见:
1、访问地址为:https://jingyan.baidu.com/patch?cid=0&pn=0
其中cid参数表示全部,pn表示记录偏移量,pn值/15 1即为页数
2、每页显示了15条记录,见图红色框选部分
右击悬赏列表,选择“检查”(我使用的是谷歌浏览器,不同浏览器可能不同),查看原代码。
通过查看网页原代码可见,悬赏列表均在CSS类为“query-content”所在的div标签内
新建一个Python文件,并输入初始代码,导入urllib和Beautiful Soup模块。
设置搜索列表,书写自己感兴趣的关键字
设置查找结束记录值、每页记录数及访问地址
获取页面悬赏记录并查找兴趣悬赏经验
运行程序查看结果,如果找到则可根据所显示的page值,定位到相关页面领取,即:
https://jingyan.baidu.com/patch?cid=0&pn= page值
( 号不必写入)
如:
page=0675 python 高效编程技巧实战
则打开页面:
https://jingyan.baidu.com/patch?cid=0&pn=675
#!/usr/bin/env python3
# encoding: utf-8
'''
Created on 2018年8月29日
@author: 王佳辉
'''
from urllib.request import urlopen
from bs4 import BeautifulSoup
searchList = ['word', 'excel', 'ppt',
'php', 'python', 'vb',
'window',
'js', 'html', 'css',
'计算机']
searchEnd = 1000
recordPerPage = 15
url = "https://jingyan.baidu.com/patch?cid=0&pn="
# 遍历查找第0条记录到指定结束记录(不包含指定记录)
for page in range(0, searchEnd, recordPerPage):
# 获取网页原代码
html = urlopen(url str(page))
# BeautifulSoup解析原代码
bsObj = BeautifulSoup(html.read(), 'html.parser')
# 遍历悬赏列表div标签中的所有链接
for link in bsObj.find('div', {'class':'query-content'}).find_all('a'):
# 将链接文本转换为小写字母
linkText = link.get_text().lower()
# 查找是否有自己感兴趣的关键字
for sear in searchList:
# 找到则显示
if linkText.find(sear) != -1:
print('page=d %s' % (page, link.get_text()))
print('运行结束')
以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!
相关文章
回享预备班:[6]分享杂志的发布步骤,加入回享计划成了签约作者后,除了写分享之外我们还可以采编杂志。杂志跟系列分享的功能相差不多,在我看来要比系列分享更具优点。杂志可以看作更简单直接明了的系列分享。我......
2023-03-19 349 百度经验