python 并行化介绍,ThreadPool对象map函数的使用

ThreadPool

A simple C++11 Thread Pool implementation

项目地址：https://gitcode.com/gh_mirrors/th/ThreadPool

免费下载资源

烟雨江南行

15585人浏览 · 2020-07-02 14:05:55

烟雨江南行 · 2020-07-02 14:05:55 发布

前面的例子为大家介绍爬虫技术，我们发现都是单线程例子，获取的时间相对较慢。那么有没有一种更快速的处理办法呢？这里为大家介绍ThreadPool中map方法

导入核心import包

from multiprocessing.dummy import Pool as ThreadPool

封装请求方法

def getSource(url):
    return requests.request(method='GET', url=url, headers=headers, timeout=10, proxies={'http': '123.55.106.175:9999'})

将需要爬的url方到数组中

urls = []
for div in _divs:
    # 文章地址
    href = div.xpath('h4/a/@href')
    urls.append(href[0])

初始化线程数

pool = ThreadPool(4)
pool.map(getSource, urls)
pool.close()
pool.join()

GitHub 加速计划 / th / ThreadPool

下载

A simple C++11 Thread Pool implementation

最近提交(Master分支：1 个月前 )

9a42ec13 - 10 年前

fcc91415 - 10 年前

GitCode 开源社区

新一代开源开发者平台 GitCode，通过集成代码托管服务、代码仓库以及可信赖的开源组件库，让开发者可以在云端进行代码托管和开发。旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

GitCode 9 月：小程序新增三大模型专属频道；百大开源项目结果公布；GitCodeAI 社区战略升级全景发布会圆满召开

GitCode 开源社区

混元世界模型 1.1 在 GitCode 开源！秒级生成 3D 世界，开发者速来体验！

GitCode 开源社区

华为盘古 Ultra-MoE-718B-V1.1 正式开放下载！

👉Int8量化版本也同步开源：https://gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1-Int8还记得9月底刷屏的「华为盘古718B」吗？当时凭借的训练哲学，在 SuperCLUE 榜单中一举冲至开源模型第三，成为业界焦点。openPangu-Ultra-MoE-718B-V1.1 是基于昇腾 NPU 训练的大规模混合专家（Mo