快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫

快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
想拿一下粉丝数 关注数 描述等
发现字体是加密的 elements是这样的
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
源代码里是这样的
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
找了找js 原来是用



这些玩意 去
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
这个ttf里一一对应 然后用 js + css画出来的
找到问题所在,就fuck掉它
把js扣出来?用execjs去执行?太LOW了
既然做python 那就用python去重写
首先用re去拿这个ttf的url (因为每次都变)
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
先给这玩意下载下来 把这个ttf文件扔fonteditor里 然后去
http://fontstore.baidu.com/static/editor/index.html
瞅瞅
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
这个时候就发现了东西
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
不就是这玩意吗,找到对应关系了 那就ok了
TTF文件没办法直接搞啊 ?怎么办
保存成xml !
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫然后就成了这玩意 ok对应关系也有了 python也能搞了

去写一下 整逻辑就是
先去拿 ttf文件 url 请求url 保存 然后转xml
然后 拿加密前的特殊字符

# 就是这玩意


然后去切割 对应 OK完事
对应关系的代码
根据看到的 id : 0啥也不说
从1~15 就是这些东西
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
上代码

# 对应关系 

def kuaishou_un_font(soup, font_size):
# soup 就是传的 ttf转码成xml的
font_dict = {}
for font_m in soup.glyphorder.children:
if font_m != '\n' and 'humans' not in font_m:
id = font_m.get('id')
name = font_m.get('name')
if id != '0' and int(id) < 11:
font_dict[name] = str(int(id)-1)
elif id == '11':
font_dict[name] = '.'
elif id == '12':
font_dict[name] = 'w'
elif id == '13':
font_dict[name] = 'k'
elif id == '14':
font_dict[name] = 'm'
elif id == '15':
font_dict[name] = '+'

size_dict = {}
for font_k in soup.cmap_format_4.children:
if 'map' in str(font_k):
code = font_k.get('code')[-4:]
name = font_k.get('name')
size_dict[code] = name
return font_dict[size_dict[font_size]]

然后是拿TTF 文件然后转成xml

# TTF转XML
font = TTFont('font_size.ttf')
font.saveXML('font_size.xml')

和split后list去一一解密

# font_url 自己去动态拿 每次都变动
font_url = ''
font_res = requests.get(font_url)

with open('font_size.ttf', 'wb+') as f:
f.write(font_res.content)

font = TTFont('font_size.ttf')
font.saveXML('font_size.xml')
soup = BeautifulSoup(open('font_size.xml'), 'lxml')
try:
fan = user_data_json['obfuseData']['fan'][40:-8].split(';&#x')
fans = ''
for f in fan:
fans += kuaishou_un_font(soup, f)
except:
fans = ''

最后
快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
OK~ 解码完成 全部代码没放 因为是根据需求写的 懒得改成大家都能用的了 主要是给个思路 思路有了就很简单 需要的找我

原创:https://www.panoramacn.com
源码网提供WordPress源码,帝国CMS源码discuz源码,微信小程序,小说源码,杰奇源码,thinkphp源码,ecshop模板源码,微擎模板源码,dede源码,织梦源码等。

专业搭建小说网站,小说程序,杰奇系列,微信小说系列,app系列小说

快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫

免责声明,若由于商用引起版权纠纷,一切责任均由使用者承担。

您必须遵守我们的协议,如果您下载了该资源行为将被视为对《免责声明》全部内容的认可-> 联系客服 投诉资源
www.panoramacn.com资源全部来自互联网收集,仅供用于学习和交流,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。 敬请谅解! 侵权删帖/违法举报/投稿等事物联系邮箱:2640602276@qq.com
未经允许不得转载:书荒源码源码网每日更新网站源码模板! » 快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
关注我们小说电影免费看
关注我们,获取更多的全网素材资源,有趣有料!
120000+人已关注
分享到:
赞(0) 打赏

评论抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

您的打赏就是我分享的动力!

支付宝扫一扫打赏

微信扫一扫打赏