Python爬取网易云音乐所有歌手的名称和链接


一、需求

Python爬取网易云音乐所有歌手的名称链接

二、代码实现

import requests
from lxml import etree
from urllib import request
import time

class WangYiYun:
def __init__(self, base_url):
# 初始化tree
self.html = self.request_url(base_url)
self.parse_html()

def request_url(self, base_url):
# 请求访问 生成树结构
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}
self.html = requests.get(url=base_url, headers=headers).content.decode('utf-8')
self.tree = etree.HTML(self.html)
return self.tree

def parse_html(self):
# 解析各类歌手url
group_list = self.html.xpath('//div[@class = "blk"]')

for group in group_list:
# 连接分类
href_list = group.xpath('.//a/@href')
# 歌手分类
group_name_list = group.xpath('.//a/text()')
# print(group_name_list)
for href, group_name in zip(href_list, group_name_list):
full_href = request.urljoin('https://music.163.com', href)
# print(full_href,group_name)
html1 = requests.get(full_href).content.decode('utf-8')
tree1 = etree.HTML(html1)
# print(tree1)
# 歌手分类对应的歌手列表页链接
url_list = tree1.xpath('//ul[@class="n-ltlst f-cb"]/li[position()>1]/a/@href')
# print(url_list)
# 歌手列表页链接遍历
for url in url_list:
full_url = request.urljoin('https://music.163.com', url)
single_letter = requests.get(full_url).content.decode('utf-8')
#
single_letter_tree = etree.HTML(single_letter)
# 歌手列表页获取歌手信息
li_list = single_letter_tree.xpath('//ul[@class="m-cvrlst m-cvrlst-5 f-cb"]/li')
for li in li_list:
# 从歌手列表页中遍历获取名字列表及对应的链接列表
name_list = li.xpath('//a[@class="nm nm-icn f-thide s-fc0"]/text()')
link_list = li.xpath('//a[@class="nm nm-icn f-thide s-fc0"]/@href')
for name, link in zip(name_list, link_list):
full_link = 'https://music.163.com' + link
print(name, full_link)
time.sleep(0.5)

if __name__ == '__main__':
base_url = 'https://music.163.com/discover/artist'
WangYiYun(base_url)

三、程序运行结果

Python爬取网易云音乐所有歌手的名称和链接

原创:https://www.panoramacn.com
源码网提供WordPress源码,帝国CMS源码discuz源码,微信小程序,小说源码,杰奇源码,thinkphp源码,ecshop模板源码,微擎模板源码,dede源码,织梦源码等。

专业搭建小说网站,小说程序,杰奇系列,微信小说系列,app系列小说

Python爬取网易云音乐所有歌手的名称和链接

免责声明,若由于商用引起版权纠纷,一切责任均由使用者承担。

您必须遵守我们的协议,如果您下载了该资源行为将被视为对《免责声明》全部内容的认可-> 联系客服 投诉资源
www.panoramacn.com资源全部来自互联网收集,仅供用于学习和交流,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。 敬请谅解! 侵权删帖/违法举报/投稿等事物联系邮箱:2640602276@qq.com
未经允许不得转载:书荒源码源码网每日更新网站源码模板! » Python爬取网易云音乐所有歌手的名称和链接
关注我们小说电影免费看
关注我们,获取更多的全网素材资源,有趣有料!
120000+人已关注
分享到:
赞(0) 打赏

评论抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

您的打赏就是我分享的动力!

支付宝扫一扫打赏

微信扫一扫打赏