搜索

查看: 3363|回复: 11

[Python] 9某视频爬虫批量下载,你懂的

[复制链接]
发表于 2022-6-25 23:01:01 | 显示全部楼层 |阅读模式
小老虎 2022-6-25 23:01:01 3363 11 看全部
链接地址:aHR0cDovL2YxMDIwLndvcmthcmVhNS5saXZlL3YucGhwP2NhdGVnb3J5PWhvdCZ2aWV3dHlwZT1iYXNpYyZwYWdlPQ==
测试过,可以批量下载!!需要挂Dai_Li
ffmpeg下载链接和M3U8下载器说明:https://github.com/hecoter/m3u8download_hecoter



  1. """
  2.         ************************************
  3.           Description: 好东西,放在这里
  4.           Author: @
  5.           Github: [url=https://github.com/jianala]https://github.com/jianala[/url]
  6.           Date: 2022-06-02 13:57:24
  7.           FilePath:on_download.py
  8.           LastEditors: @
  9.           LastEditTime: 2022-06-02 15:17:53
  10.           善始者实繁,克终者盖寡。

  11.         ************************************
  12. """

  13. from lxml import etree
  14. import re
  15. import requests
  16. import os
  17. import urllib3
  18. from m3u8download_hecoter import m3u8download
  19. import base64

  20. urllib3.disable_warnings()


  21. #
  22. # 是否配置代{过}{滤}理,国内访问速度较慢
  23. def proxy_set():
  24.     proxy_set = input('Do you want to use proxy?[y/n]')
  25.     if proxy_set == 'y':
  26.         global my_proxies
  27.         proxies_set = input('input your proxy config ep:"127.0.0.1:7890"')
  28.         my_proxies = {"http": "http://127.0.0.1:7890", "https": "https://127.0.0.1:7890"}
  29.         if proxies_set != '':
  30.             my_proxies['http'] = 'http://'+proxies_set
  31.             my_proxies['https'] = 'https://'+proxies_set

  32.     elif proxy_set == 'n':
  33.         my_proxies = ''
  34.     else:
  35.         proxy_set()

  36. def get_well(response):
  37.     '''
  38.     获取m3u8下载号码
  39.     '''
  40.     try:
  41.         et = etree.HTML(response.text)
  42.         well_list = et.xpath('//div[@class="thumb-overlay"]/@id')[:-1]
  43.         well_title = et.xpath('//div[@class="thumb-overlay"]/../span/text()')[:-1]
  44.     except:
  45.         print('缺少参数')
  46.     finally:   
  47.         m3u8_list = [{'m3u8url':'https://la.killcovid2021.com/m3u8/{num}/{num}.m3u8'.format(num=re.findall('\d+',well_list)[0]),'title':well_title} for well_title,well_list in zip(well_title,well_list)]

  48.     return m3u8_list

  49. # 爬虫主体,flag为页码
  50. def spider(flag):
  51.     # 如果连接访问不了,在这里把base_url替换成你知道的标准地址
  52.     page_url = b'aHR0cDovL2YxMDIwLndvcmthcmVhNS5saXZlL3YucGhwP2NhdGVnb3J5PWhvdCZ2aWV3dHlwZT1iYXNpYyZwYWdlPQ=='
  53.     page_url = base64.b64decode(page_url).decode('utf-8')
  54.     page_url = page_url+ str(flag)
  55.     headers = {
  56.         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36Name',
  57.         'Referer': 'http://91porn.com',
  58.         'Accept-Language': 'zh-CN,zh;q=0.9'}
  59.     get_page=requests.get(url=page_url, headers=headers)
  60.     m3u8_list = get_well(get_page)
  61.     dir_download = os.path.join(os.path.dirname(__file__),'_download')
  62.     for m3u8 in m3u8_list:
  63.         m3u8download(m3u8url=m3u8['m3u8url'],title = m3u8['title'],enable_del=True,proxies=my_proxies,work_dir=dir_download)


  64. if __name__ == '__main__':
  65.     proxy_set()
  66.     for i in range(1,4):
  67.         spider(i)
复制代码



特别注意的点有2个,第一个是m3u8download 源码没挂代{过}{滤}理,需要手动改一下,第二个urllib3的版本必须是urllib3==1.25.11



123.jpg
回复

使用道具 举报

发表于 2023-6-29 16:49:35 | 显示全部楼层
向往草原403 2023-6-29 16:49:35 看全部
我看不错噢 谢谢楼主!知鸟论坛越来越好!
回复

使用道具 举报

发表于 2023-6-30 01:50:06 | 显示全部楼层
落败的青春阳落s 2023-6-30 01:50:06 看全部
楼主太厉害了!楼主,I*老*虎*U!我觉得知鸟论坛真是个好地方!
回复

使用道具 举报

发表于 2023-6-30 03:56:56 | 显示全部楼层
dxf17 2023-6-30 03:56:56 看全部
我看不错噢 谢谢楼主!知鸟论坛越来越好!
回复

使用道具 举报

发表于 2023-6-30 09:57:19 | 显示全部楼层
我是的十八簿 2023-6-30 09:57:19 看全部
这东西我收了!谢谢楼主!知鸟论坛真好!
回复

使用道具 举报

发表于 2023-6-30 10:13:04 | 显示全部楼层
123456823 2023-6-30 10:13:04 看全部
既然你诚信诚意的推荐了,那我就勉为其难的看看吧!知鸟论坛不走平凡路。
回复

使用道具 举报

发表于 2023-6-30 17:23:46 | 显示全部楼层
麻辣鸡翅 2023-6-30 17:23:46 看全部
论坛不能没有像楼主这样的人才啊!我会一直支持知鸟论坛
回复

使用道具 举报

发表于 2023-7-4 14:47:34 | 显示全部楼层
ffycxyw2274436 2023-7-4 14:47:34 看全部
感谢楼主的无私分享!要想知鸟论坛好 就靠你我他
回复

使用道具 举报

发表于 2023-7-5 02:07:05 | 显示全部楼层
惜颜705 2023-7-5 02:07:05 看全部
既然你诚信诚意的推荐了,那我就勉为其难的看看吧!知鸟论坛不走平凡路。
回复

使用道具 举报

发表于 2023-7-5 21:56:41 | 显示全部楼层
462710480 2023-7-5 21:56:41 看全部
楼主,大恩不言谢了!知鸟论坛是最棒的!
回复

使用道具 举报

  • 您可能感兴趣
点击右侧快捷回复 【请勿灌水】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 返回列表

RSS订阅| SiteMap| 小黑屋| 知鸟论坛
联系邮箱E-mail:zniao@foxmail.com
快速回复 返回顶部 返回列表