9某视频爬虫批量下载，你懂的

小老虎 · 发表于 2022-6-25 23:01:01

链接地址：aHR0cDovL2YxMDIwLndvcmthcmVhNS5saXZlL3YucGhwP2NhdGVnb3J5PWhvdCZ2aWV3dHlwZT1iYXNpYyZwYWdlPQ==
测试过，可以批量下载！！需要挂Dai_Li
ffmpeg下载链接和M3U8下载器说明：https://github.com/hecoter/m3u8download_hecoter

"""
************************************
Description: 好东西，放在这里
Author: @
Github: [url=https://github.com/jianala]https://github.com/jianala[/url]
Date: 2022-06-02 13:57:24
FilePath:on_download.py
LastEditors: @
LastEditTime: 2022-06-02 15:17:53
善始者实繁，克终者盖寡。
************************************
"""
from lxml import etree
import re
import requests
import os
import urllib3
from m3u8download_hecoter import m3u8download
import base64
urllib3.disable_warnings()
#
# 是否配置代{过}{滤}理，国内访问速度较慢
def proxy_set():
proxy_set = input('Do you want to use proxy?[y/n]')
if proxy_set == 'y':
global my_proxies
proxies_set = input('input your proxy config ep:"127.0.0.1:7890"')
my_proxies = {"http": "http://127.0.0.1:7890", "https": "https://127.0.0.1:7890"}
if proxies_set != '':
my_proxies['http'] = 'http://'+proxies_set
my_proxies['https'] = 'https://'+proxies_set
elif proxy_set == 'n':
my_proxies = ''
else:
proxy_set()
def get_well(response):
'''
获取m3u8下载号码
'''
try:
et = etree.HTML(response.text)
well_list = et.xpath('//div[@class="thumb-overlay"]/@id')[:-1]
well_title = et.xpath('//div[@class="thumb-overlay"]/../span/text()')[:-1]
except:
print('缺少参数')
finally:
m3u8_list = [{'m3u8url':'https://la.killcovid2021.com/m3u8/{num}/{num}.m3u8'.format(num=re.findall('\d+',well_list)[0]),'title':well_title} for well_title,well_list in zip(well_title,well_list)]
return m3u8_list
# 爬虫主体，flag为页码
def spider(flag):
# 如果连接访问不了，在这里把base_url替换成你知道的标准地址
page_url = b'aHR0cDovL2YxMDIwLndvcmthcmVhNS5saXZlL3YucGhwP2NhdGVnb3J5PWhvdCZ2aWV3dHlwZT1iYXNpYyZwYWdlPQ=='
page_url = base64.b64decode(page_url).decode('utf-8')
page_url = page_url+ str(flag)
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36Name',
'Referer': 'http://91porn.com',
'Accept-Language': 'zh-CN,zh;q=0.9'}
get_page=requests.get(url=page_url, headers=headers)
m3u8_list = get_well(get_page)
dir_download = os.path.join(os.path.dirname(__file__),'_download')
for m3u8 in m3u8_list:
m3u8download(m3u8url=m3u8['m3u8url'],title = m3u8['title'],enable_del=True,proxies=my_proxies,work_dir=dir_download)
if __name__ == '__main__':
proxy_set()
for i in range(1,4):
spider(i)

复制代码

特别注意的点有2个，第一个是m3u8download 源码没挂代{过}{滤}理，需要手动改一下，第二个urllib3的版本必须是urllib3==1.25.11

向往草原403 · 发表于 2023-6-29 16:49:35

我看不错噢谢谢楼主！知鸟论坛越来越好！

落败的青春阳落s · 发表于 2023-6-30 01:50:06

楼主太厉害了！楼主，I*老*虎*U！我觉得知鸟论坛真是个好地方！

dxf17 · 发表于 2023-6-30 03:56:56

我看不错噢谢谢楼主！知鸟论坛越来越好！

我是的十八簿 · 发表于 2023-6-30 09:57:19

这东西我收了！谢谢楼主！知鸟论坛真好！

123456823 · 发表于 2023-6-30 10:13:04

既然你诚信诚意的推荐了，那我就勉为其难的看看吧！知鸟论坛不走平凡路。

麻辣鸡翅 · 发表于 2023-6-30 17:23:46

论坛不能没有像楼主这样的人才啊！我会一直支持知鸟论坛。

ffycxyw2274436 · 发表于 2023-7-4 14:47:34

感谢楼主的无私分享！要想知鸟论坛好就靠你我他

惜颜705 · 发表于 2023-7-5 02:07:05

既然你诚信诚意的推荐了，那我就勉为其难的看看吧！知鸟论坛不走平凡路。

462710480 · 发表于 2023-7-5 21:56:41

楼主，大恩不言谢了！知鸟论坛是最棒的！

[Python] 9某视频爬虫批量下载，你懂的