小白也能懂的代理IP池搭建指南：原理+代码实战

tang77789

228人浏览 · 2026-06-11 10:50:30

tang77789 · 2026-06-11 10:50:30 发布

在网络爬虫、跨境访问、接口压力测试、多账号运营等场景中，单一代理IP极易被目标网站封禁、限流，导致任务中断。而代理IP池可以理解为一个动态更新、自动筛选、随时取用的优质IP资源库，能持续提供可用代理IP，规避IP封禁问题，保障业务稳定运行。

很多新手觉得搭建IP池门槛高、代码复杂，且市面上主流境外开源IP池项目存在无法访问、部署报错、接口失效等问题。其实无需依赖任何开源框架，零基础也能从零手写搭建稳定可用的代理IP池。本文避开晦涩理论、摒弃境外开源项目，用通俗语言拆解原理、手把手讲解纯原生搭建流程，附带实操代码和避坑技巧，人人都能落地。

先搞懂：代理IP池到底是什么？

通俗来说，代理IP池就是一个批量收集、自动校验、动态维护、统一调用的代理IP仓库。它解决了手动找IP、换IP效率低、无效IP多的痛点，核心价值只有三点：

1. 海量备用：储备成百上千个代理IP，避免单一IP频繁请求被封禁；

2. 自动过滤：自动剔除失效、延迟高的IP，只留存可用资源；

3. 随取随用：通过本地接口一键获取随机优质IP，适配各类程序调用。

代理IP池核心工作流程（4步闭环）

整个IP池的运行逻辑非常简单，全程自动化循环执行，无需任何第三方框架支撑：

采集IP（找水源）→ 校验IP（滤杂质）→ 存储IP（建仓库）→ 对外提供调用（供使用），同时定时清理失效IP、补充新IP，实现永久动态更新。

搭建前准备：必备环境与工具（纯国内可访问）

本次搭建方案完全摒弃境外开源项目，采用原生Python手写+本地数据库方案，无外部依赖、无访问报错，普通电脑、轻量云服务器均可运行，仅需基础环境：

1. Python环境：3.7及以上版本，核心运行环境，国内可直接下载安装；

2. 内置数据库SQLite：Python自带，无需安装、无需配置，零成本存储IP数据；

3. 基础依赖库：requests、flask，用于IP采集、校验和搭建本地接口，国内镜像可一键安装；

4. 国内免费代理数据源：选用国内可正常访问的免费代理站点，稳定无访问限制。

手把手实战：从零手写搭建专属代理IP池

本文采用纯原生手写代码方案，不克隆任何境外项目、不依赖第三方框架，全程复制代码即可运行，彻底解决项目无法访问、接口报错等问题。

步骤1：安装基础依赖库

打开电脑终端，使用国内镜像源一键安装所需依赖，避免网络超时：

pip install requests flask -i https://pypi.tuna.tsinghua.edu.cn/simple

安装完成无报错，即为环境配置成功，所有依赖均为国内可正常访问资源。

步骤2：创建本地IP池核心文件

新建一个空文件夹，新建两个文本文件，分别修改后缀名，全程本地操作、无需联网克隆：

1. db.py：数据库管理文件，负责IP存储、查询、删除、清理失效IP；

2. run.py：主运行文件，负责IP采集、校验、接口服务搭建。

步骤3：编写数据库核心代码（db.py）

复制以下纯原生代码，写入db.py文件，实现IP数据本地化管理，自动去重、清理失效IP：

import sqlite3
import time

# 初始化本地数据库
class IpDB:
    def __init__(self):
        self.conn = sqlite3.connect("proxy_ip.db", check_same_thread=False)
        self.cursor = self.conn.cursor()
        self.create_table()

    # 创建IP存储数据表
    def create_table(self):
        self.cursor.execute('''
        CREATE TABLE IF NOT EXISTS proxy_ip (
            ip TEXT PRIMARY KEY,
            port TEXT,
            speed REAL,
            update_time INTEGER
        )
        ''')
        self.conn.commit()

    # 插入可用IP
    def insert_ip(self, ip, port, speed):
        try:
            self.cursor.execute("INSERT OR IGNORE INTO proxy_ip (ip,port,speed,update_time) VALUES (?,?,?,?)",
                                (ip, port, speed, int(time.time())))
            self.conn.commit()
        except:
            pass

    # 随机获取单个IP
    def get_random_ip(self):
        self.cursor.execute("SELECT ip,port FROM proxy_ip ORDER BY RANDOM() LIMIT 1")
        res = self.cursor.fetchone()
        return res if res else None

    # 获取全部可用IP
    def get_all_ip(self):
        self.cursor.execute("SELECT ip,port FROM proxy_ip")
        return self.cursor.fetchall()

    # 统计IP数量
    def get_count(self):
        self.cursor.execute("SELECT count(*) FROM proxy_ip")
        return self.cursor.fetchone()[0]

    # 删除失效IP
    def delete_ip(self, ip):
        self.cursor.execute("DELETE FROM proxy_ip WHERE ip=?", (ip,))
        self.conn.commit()

步骤4：编写采集、校验、接口核心代码（run.py）

复制以下完整可运行代码，写入run.py文件，内置国内可用代理数据源、自动校验机制和本地接口：

import requests
import time
import random
from flask import Flask
from db import IpDB

app = Flask(__name__)
db = IpDB()
# 国内可正常访问的免费代理数据源（无境外地址、无访问限制）
SOURCE_URLS = [
    "https://www.66daili.com/",
]

# 校验IP是否可用、检测延迟
def check_ip(ip, port):
    proxies = {
        "http": f"http://{ip}:{port}",
        "https": f"https://{ip}:{port}"
    }
    try:
        start = time.time()
        # 以百度为校验目标，适配国内绝大多数业务场景
        res = requests.get("https://www.baidu.com", proxies=proxies, timeout=3)
        if res.status_code == 200:
            speed = round(time.time() - start, 2)
            return True, speed
    except:
        pass
    return False, 0

# 批量采集代理IP
def crawl_ip():
    print("开始采集国内代理IP...")
    for url in SOURCE_URLS:
        try:
            res = requests.get(url, timeout=5)
            res.encoding = "utf-8"
            # 简单解析IP和端口
            lines = res.text.strip().split("\n")
            for line in lines:
                if ":" in line:
                    ip, port = line.split(":")[:2]
                    # 校验IP可用性
                    is_ok, speed = check_ip(ip, port)
                    if is_ok and speed < 0.3:
                        db.insert_ip(ip, port, speed)
                        print(f"成功留存优质IP：{ip}:{port} 延迟：{speed}s")
        except Exception as e:
            continue
    print("本轮IP采集校验完成")

# 定时循环更新IP池
def run_task():
    while True:
        crawl_ip()
        # 每30分钟更新一次IP池
        time.sleep(1800)

# 本地API接口（修复原接口报错问题，本地100%可访问）
@app.route("/get", methods=["GET"])
def get_one_ip():
    ip_info = db.get_random_ip()
    if ip_info:
        return f"{ip_info[0]}:{ip_info[1]}"
    return "暂无可用代理IP"

@app.route("/get_all", methods=["GET"])
def get_all_ip():
    data = db.get_all_ip()
    return str(data)

@app.route("/count", methods=["GET"])
def get_ip_count():
    return f"当前可用IP数量：{db.get_count()} 个"

if __name__ == "__main__":
    # 后台启动IP采集更新任务
    import threading
    threading.Thread(target=run_task).start()
    # 启动本地接口服务
    app.run(host="127.0.0.1", port=5010, debug=False)