分享117个HTML个性简实模板,总有一款适合您
分享117个HTML个性简实模板,总有一款适合您
分享117个HTML个性简实模板,总有一款适合您
117个HTML个性简实模板下载链接:https://pan.baidu.com/s/1e3QoxM5RAqbg1lz7qD6WLQ?pwd=wfis
提取码:wfis
Python采集代码下载链接:采集代码.zip - 蓝奏云
大气单页html5模版
大气单页html5模版是一款投资组合类的html5单页模版下载。
html5单页模版notebook
html5单页模版notebook是一款商务书写打字html5网站模板。
扁平大气HTML5模版Eracle
扁平大气HTML5模版Eracle是一款专业的扁平风格HTML5响应式模版Eracle。
bootstrap3单页模版
bootstrap3单页模版是一款基于bootstrap开发的单页设计的网页模板。
import os
import shutil
import time
from time import sleep
from docx import Document
from docx.shared import Inches
from framework.base.BaseFrame import BaseFrame
from sprider.business.DownLoad import DownLoad
from sprider.business.SeleniumTools import SeleniumTools
from sprider.business.SpriderTools import SpriderTools
from selenium import webdriver
from selenium.webdriver.common.by import By
from sprider.model.SpriderEntity import SpriderEntity
from sprider.access.SpriderAccess import SpriderAccess
title_name = "社会教育"
class ChinaZJsSelenium:
base_url = "https://sc.chinaz.com/" # 采集的网址
save_path = "D:\\Freedom\\Sprider\\ChinaZ\\"
sprider_count = 88 # 116+66+20
sprider_start_count = 0
word_content_list = []
folder_name = ""
page_end_number = 0
max_pager = 24 # 每页的数量
haved_sprider_count = 0 # 已经采集的数量
page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312"
filter_down_file = []
word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量
sprider_detail_index = 0 # 明细方法采集的数量 累加
sprider_top_level = "HTML"
HTML5响应式模版Sparrow
html5单页模版kreative
红色瀑布流图片站模板
HTML5免费模版paradiso
html5橘红色网页模版jetro
HTML5响应式模版Mocha
HTML5单页模版resume
html5单页设计模版roran
红灰配色线条HTML5博客模板
Crystal Clear响应式HTML模版
素材设计HTML5模板
个人名片HTML5模板
域名销售HTML5模板
工作办公CSS网页模板
响应创意CSS3模板
日常生活CSS网页模板
个人博客CSS网页模板
独特设计HTML5网页模板
个性博客CSS3网页模板
典型博客CSS3网页模板
学生博客CSS网页模板
简洁设计HTML5网页模板
动画图片HTML5网页模板
动画艺术HTML5网页模板
简洁设计CSS3模板
艺术设计CSS网页模板
现代简洁CSS3模板
简约风格HTML5模板
个性名片HTML5模板
t恤CSS网页模板
反恐精英CSS网页模板
简单栅格主题CSS模板
蓝色亮布局CSS网页模板
国外个性涂鸦CSS网页模板
简单橙色CSS网页模板
杂志主题CSS网页模板
古代博客主题CSS网页模板
红色个性博客CSS网页模板
def sprider(self, title_name):
"""
采集
医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html
电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html
电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html
婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html
电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html
旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html
体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html
娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html
艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html
建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html
动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html
人物家庭 https://sc.chinaz.com/moban/RenWuJiaTing.html
社会教育 https://sc.chinaz.com/moban/SheHuiJiaoYu.html
公司企业 https://sc.chinaz.com/moban/GongSiQiYe.html
:return:
"""
if title_name == "医疗保健":
self.first_column_name = "moban"
self.folder_name = "HTML医疗保健模板"
self.second_column_name = "YiLiaoBaoJian"
elif title_name == "公司企业":
self.first_column_name = "moban"
self.folder_name = "HTML公司企业模板"
self.second_column_name = "GongSiQiYe"
elif title_name == "社会教育":
self.first_column_name = "moban"
self.folder_name = "HTML社会教育模板"
self.second_column_name = "SheHuiJiaoYu"
elif title_name == "动植食物":
self.first_column_name = "moban"
self.folder_name = "HTML动植食物模板"
self.second_column_name = "DongZhiShiWu"
elif title_name == "人物家庭":
self.first_column_name = "moban"
self.folder_name = "HTML人物家庭模板"
self.second_column_name = "RenWuJiaTing"
elif title_name == "建筑风光":
self.first_column_name = "moban"
self.folder_name = "HTML建筑风光模板"
self.second_column_name = "JianZhuFengGuang"
elif title_name == "艺术时尚":
self.first_column_name = "moban"
self.folder_name = "HTML艺术时尚模板"
self.second_column_name = "YiShuShiShang"
elif title_name == "娱乐休闲":
self.first_column_name = "moban"
self.folder_name = "HTML娱乐休闲模板"
self.second_column_name = "YuLeXiuXian"
elif title_name == "体育竞技":
self.first_column_name = "moban"
self.folder_name = "HTML体育竞技模板"
self.second_column_name = "TiYuJingJi"
elif title_name == "旅游交通":
self.first_column_name = "moban"
self.folder_name = "HTML旅游交通模板"
self.second_column_name = "LvYouJiaoTong"
elif title_name == "电脑主机":
self.first_column_name = "moban"
self.folder_name = "HTML电脑主机模板"
self.second_column_name = "DianNaoZhuJi"
elif title_name == "电子产品":
self.first_column_name = "moban"
self.folder_name = "HTML电子产品模板"
self.second_column_name = "DianZiChanPin"
elif title_name == "电子商务":
self.first_column_name = "moban"
self.folder_name = "HTML电子商务模板"
self.second_column_name = "DianZiShangWu"
BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "")
BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "")
BaseFrame().right("本次采集参数:title_name=" + title_name + "")
BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "")
# self.folder_name = "JS表单验证"
self.sprider_category = title_name # 一级目录self.folder_name
second_folder_name = str(self.sprider_count) + "个" + self.folder_name # 二级目录
self.sprider_type = second_folder_name
self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集
# 原始路径+一级目录+二级目录
self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name
self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name
BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...")
sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name))
down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\"
if os.path.exists(down_path) is True:
shutil.rmtree(down_path)
if os.path.exists(down_path) is False:
os.makedirs(down_path)
if os.path.exists(self.save_path) is True:
shutil.rmtree(self.save_path)
if os.path.exists(self.save_path) is False:
os.makedirs(self.save_path)
chrome_options = webdriver.ChromeOptions()
diy_prefs = {'profile.default_content_settings.popups': 0,
'download.default_directory': '{0}'.format(down_path)}
# 添加路径到selenium配置中
chrome_options.add_experimental_option('prefs', diy_prefs)
chrome_options.add_argument('--headless') # 隐藏浏览器
# 实例化chrome浏览器时,关联忽略证书错误
driver = webdriver.Chrome(options=chrome_options)
driver.set_window_size(1280, 800) # 分辨率 1280*800
#
BaseFrame().debug("开始采集" + sprider_url)
driver.get(sprider_url)
# content = driver.page_source
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick
# element_list = div_elem.find_elements(By.CLASS_NAME, 'item')
# print(element_list.get_attribute('innerHTML'))
laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye")
laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a')
laster_pager_url = laster_pager_a[len(laster_pager_a) - 2]
page_end_number = int(laster_pager_url.text)
self.page_count = self.merchant
while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
else:
if self.haved_sprider_count == self.sprider_count:
BaseFrame().debug("采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
self.builder_word(self.folder_name, self.word_content_list)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
# (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count))
# http://soft.onlinedown.net/sort/177/2/
# https://sc.chinaz.com//jianli/xiaochengchu_2.html
next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count,
self.first_column_name)
driver.get(next_url)
element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容
self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)
pass
# print(self.page_count)
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
print("sprider()执行过程出现错误:" + str(e))
sleep(1)
网上商店CSS网页模板
紫色幻彩CSS网页模板
欧美风商业CSS网页模板
乡村部落CSS网页模板
欧美简实模板下载
欧美个性网站模板
欧美炫彩个性模板
个性FLASH模板
TemplateMonster 个性模板
欧美个性模板下载
欧美个性FLASH模板
图片个性网站模板
个性设计FLASH模板
欧美公司FLASH模板
韩国背景PSD模板
绵羊个性FLASH模板
非主流个性模板
欧洲个性网站模板
韩国简实模板
韩国个性PSD模板
财政个性网站模板
俱乐部个性模板
下午茶个性网站模板
a1webtemplates 简实模板
韩国个性模板
微生物个性网站模板
DreamTemplate 个性模板
欧美个性设计FLASH模板
欧美城市个性模板
TM 简实模板FLASH
家具个性FLASH模板
欧美简实模板
美国政府个性网站模板
欧美卡通个性FLASH模板
动物个性网站模板
复古个性FLASH模板
商务简实FLASH模板
TemplateMonster 简实模板
商务简实网站模板
灵感个性模板
韩国公司模板
山水画个性FLASH模板
欧美简实FLASH模板
设计个性FLASH模板
设计简实FLASH模板
import os
import shutil
def void_folder(path):
# 访问path路径下的文件或文件夹
lst = os.listdir(path)
# 打印每一层的文件或文件夹
for name in lst:
# 拼接名称,得到绝对路径,判断该文件是否符合是文件夹
real_path = os.path.join(path, name)
# 如果是文件夹,则打空格表示,并且递归访问下一层
if os.path.isdir(real_path):
# print(name)
files = os.listdir(real_path)
if len(files) == 0:
print("void_folder():"+name)
shutil.rmtree(real_path)
endindex = len(real_path) - len(name)
real_path = real_path[0:endindex]
void_folder(real_path)
else:
void_folder(real_path)
# 如果不是文件夹,直接打印,不再递归访问下一层
else:
#print(name)
pass
def void_file(dirPath):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for file in dirs:
file_full_name = dirPath + '/' + file
file_ext = os.path.splitext(file_full_name)[-1]
if file_ext is None or file_ext=="":
continue
if "rar" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "zip" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "gz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
if "tgz" == str(file_ext.split(".")[1]):
os.remove(file_full_name)
# 查找指定文件夹下所有相同名称的文件
def search_file(dirPath, fileName):
dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表
for currentFile in dirs: # 遍历列表
absPath = dirPath + '/' + currentFile
if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件
search_file(absPath, fileName)
elif currentFile == fileName:
#print(absPath) # 文件存在,则打印该文件的绝对路径
os.remove(absPath)
欧洲简实FLASH模板
披萨食品简实FLASH模板
放射个性FLASH模板
DJ舞池简实FLASH模板
能力站个性模板
安全性简实FLASH模板
设计标签个性FLASH模板
潜水俱乐部个性FLASH模板
快乐男孩个性模板
我的主页个性模板
乐队个性模板
Boxedart 简实模板
Boxedart 个性模板
简实模板PSD
韩国房地产模板
韩国建筑模板
Templatesdd 简实模板
韩国房屋模板
ASA 公司模板
ASA 个性模板
GETFILE 简实模板
BIZ 简实模板
ThemeGallery 个性模板
ThemeGallery 简实模板
E网情深模板HTML
TemplateMonster简实模板
综合娱乐模板HTML
NEOBIZ 简实模板
GETFILE 个性模板
VIZ 个性模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。
更多推荐
所有评论(0)