#!/usr/bin/python3

# coding=utf8

import requests

from bs4 import BeautifulSoup

import pymysql

import time

'''

需求:某视频网站,没有搜索功能,我弄个python爬虫爬取网站视频名称和磁力链接,全部爬取下来放到mysql数据库中,就可以按自己喜好搜索关键字获得影片下载地址进行下载了

作者:xiaoxiaohui

时间:2019-10-03

其他:mysql数据库创建数据库和数据表

mysql -uroot -pxxh123

create database 4hucom;

use 4hucom;

数据库id自增长

CREATE TABLE  `4hu_shoujixiaoshipin` (`id` INT(11) not null auto_increment,`biaoti` VARCHAR(380), `fabutime` VARCHAR(380), `lianjie` VARCHAR(380),primary key(id) );

其他2:因为是通过之前一些爬虫代码快速改进,所以关于(1)关于方法名称get_house_info都是沿用之前爬取租房网站的名称啦(2)info字典里面这个'播放地址':fabutime,其实'播放地址'改为bofangdizhi比较好

'''

def get_links(url):

response = requests.get(url)

soup = BeautifulSoup(response.text,'html.parser')

links_div = soup.find_all('li',class_="col-md-2 col-sm-3 col-xs-4")

links = ['http://www.网站名马赛克.com'+div.a.get('href') for div in links_div]

#print(links)

return links

def get_house_info(item_url):

response = requests.get(item_url)

response.encoding = 'utf-8'

soup = BeautifulSoup(response.text,'html.parser')

links_div = soup.find_all('ul',class_="playul")

lianjie_temp = 'http://www.网站名马赛克.com'+links_div[1].li.a.get('href')#爬下载链接  这里注意playul有2个 第一个playul links_div[0]是播放的  第二个playul links_div[1]是下载的

lianjie=get_cililianjie(lianjie_temp)

print(lianjie)

links_div2 = soup.find_all('div',class_="detail-title fn-clear")

biaoti = links_div2[0].text[:].strip() #爬影片名字  我加了.strip()  去空格

#print(biaoti)

links_div3 = soup.find_all('ul',class_="playul")

fabutime = 'http://www.网站名马赛克.com'+links_div[0].li.a.get('href') #爬影片播放地址

#print(fabutime)

info = {

'id':id,

'影片名字':biaoti,

'播放地址':fabutime,

'下载链接':lianjie

}

return info

def get_cililianjie(url):

response = requests.get(url)

response.encoding = 'utf-8'

soup = BeautifulSoup(response.text,'html.parser')

#print(soup)

links_div = soup.find_all('div',class_="download")

#print(links_div)

lianjie = links_div[0].a.get('href')  #磁力链接

return lianjie

def get_db(setting):

return pymysql.connect(**setting)

def insert(db,house):

values_ = "'{}',"*2 + "'{}'"

sql_values = values_.format(house['影片名字'],house['播放地址'],house['下载链接'])

sql ='insert into 4hu_shoujixiaoshipin (biaoti,fabutime,lianjie) values({})'.format(sql_values)

cursor = db.cursor()

cursor.execute(sql)

db.commit()

DATABASE = {

'host':'127.0.0.1',

'database':'4hucom',

'user':'root',

'password':'xxh123',

'charset':'utf8'   #之前代码是utf8mb4之后我用navicat.exe查看一直是乱码 改成utf8 发现navicat.exe查是正常中文了

}

db = get_db(DATABASE)  #连接数据库

#循环所有页例子

for yema in range(1,44):

if yema == 1:

url = 'https://www.网站名马赛克.com/vod/html7/index.html'

else:

url = 'https://www.网站名马赛克.com/vod/html7/index_'+str(yema)+'.html'

links = get_links(url)

for item_url in links:

time.sleep(1.0)

house = get_house_info(item_url)

print('获取一条成功:{}'.format(house['影片名字']))

insert(db,house)  #插入爬取到的数据输入进数据库

mysql教学磁力链_【python小项目】网页爬虫+mysql数据库储存,爬虫xx视频网站视频磁力链接...相关推荐

  1. python小项目-python 小项目

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 事先录制好一段音频,客户接通电话后,自动播放https:blog.csd ...

  2. Python 小项目 猜数字小游戏

    欢迎来到<Python 小项目>专栏,这个专栏会不定时更新Python的小项目,大家可以订阅关注哦! 这次,我们要编写一个非常简单的猜数字小游戏! 先看看运行效果: 代码详细教学: 导入模 ...

  3. Python 小项目 密码生成器

    欢迎来到<Python 小项目>专栏,这个专栏会不定时更新Python的小项目,大家可以订阅关注哦! 这次,我们要编写一个密码生成器,先看效果: 密码长度:10 密码:pEIMX_JUbR ...

  4. python小项目实例流程-Python小项目:快速开发出一个简单的学生管理系统

    原标题:Python小项目:快速开发出一个简单的学生管理系统 本文根据实际项目中的一部分api 设计抽象出来,实例化成一个简单小例子,暂且叫作「学生管理系统」. 这个系统主要完成下面增删改查的功能: ...

  5. python小项目案例-Python小项目:快速开发出一个简单的学生管理系统

    本文根据实际项目中的一部分api 设计抽象出来,实例化成一个简单小例子,暂且叫作「学生管理系统」. 这个系统主要完成下面增删改查的功能: 包括: 学校信息的管理 教师信息的管理 学生信息的管理 根据A ...

  6. 五十一、结合百度API接口打造 Python小项目

    @Author: Runsen 本项目围绕图像识别,通过调用百度 API 接口,可以实现很多人性化的功能,比如手势识别.比对.人像分割以及颜值打分等功能. 本次Gitchat付费文章,但是因为订阅太少 ...

  7. python项目开发实例-Python小项目:快速开发出一个简单的学生管理系统

    本文根据实际项目中的一部分api 设计抽象出来,实例化成一个简单小例子,暂且叫作「学生管理系统」. 这个系统主要完成下面增删改查的功能: 包括: 学校信息的管理 教师信息的管理 学生信息的管理 根据A ...

  8. part1:推荐一些适合练手、课程设计、毕业设计的python小项目源码,无任何下载门槛

    人生苦短,我用python,随着python这些年的流行,很多人开始使用python来实现各种功能.下面推荐一些适合用来练手.大学生课程设计作业.大学生毕业设计的python小项目,尤其适合新手,源码 ...

  9. Python小项目——生成个性二维码

    Python小项目--生成个性二维码 现代社交离不开微信,QQ,那么今天就教你用 Python 生成自己的个性二维码

  10. python小项目,检查生日是否出现在圆周率里面

    python小项目,检查生日是否出现在圆周率里面 file_path_pi = '/home/yecj/works/python/file/0至1000000位圆周率.txt'with open(fi ...

最新文章

  1. Spring Boot 动态数据源(多数据源自己主动切换)
  2. SQL优化(二) 快速计算Distinct Count
  3. Java和PHP在Web开发方面的比较
  4. vue.js实现价格格式化
  5. c语言中函数可以有几个参数,C中子函数最多有几个形参
  6. 用live555和ffplay搭建流媒体环境
  7. 数组:三种初始化及内存分析
  8. python爬虫播放mp3
  9. 重启物理机后kvm无法启动虚拟机
  10. 一、公安备案与经营性备案
  11. 触摸按键设计参考与问题总结
  12. 实用好看的个人主页官方源码
  13. linux wakeup,linux内核3.4基于wakeup
  14. 从你的全世界路过(张嘉佳)
  15. [老码团队]Swift中的协议 - 用协议来实现委托模式
  16. 夜晚图像的目标检测-matlab
  17. 常用激活函数--小白角度 TensorFlow 机器学习 神经网络 选取
  18. 安全管家安卓_安卓手机自带的管家好,还是另外获取的管家好呢?这4点你要知道...
  19. 二、TIPTOP命名原则和目录配置—TIPTOP GP ERP二次开发新手教程
  20. 苹果手机中病毒显示无服务器,苹果手机中毒五大特征!一般认为这是正常现象,你的iPhone中了吗...

热门文章

  1. 新媒体运营教程:活动运营的活动预算与执行推广!
  2. CAD2020版本设置为经典模式
  3. 怎么学java软件工程师_如何学习java软件工程师面试
  4. 如何使用git上传本地代码到码云上(超详细的呦)
  5. 计算机体系结构——流水线技术(Pipelining)
  6. 电动汽车概述:电动汽车软件
  7. CloudBase CMS的开发注意事项
  8. 破解入门(四)-----实战单步跟踪法脱壳
  9. eclipse java neon,Eclipse Jee Neon 64位
  10. vbscript+asp编写接口