C++ 关联式容器map 与 set 的原理与实践操作

m0_74824865

154人浏览 · 2026-05-25 03:25:56

m0_74824865 · 2026-05-25 03:25:56 发布

在 C++ 中，容器是存放数据的重要数据结构，分为序列式容器和关联式容器。序列式容器（如 vector、list、deque）按线性顺序存储元素，元素的位置与值无关；而关联式容器则通过键（key）建立元素间的关联，实现高效的查找、插入和删除操作。本文将详细介绍关联式容器中最常用的 map 和 set，包括它们的底层实现、核心特性、使用方法及实际应用。

一、关联式容器的核心概念

1. 容器分类与特点

关联式容器的核心是 “关联关系”，即通过键（key）快速定位元素，而无需像序列式容器那样遍历整个容器。其特点如下：

元素按特定规则排序（有序容器）或无序存储（无序容器）；
插入位置由元素的键决定，而非用户指定；
查找效率极高，平均时间复杂度为 O(logN)（有序容器）或 O(1)（无序容器）。

2. 底层实现

有序容器（set、map 等）的底层通常采用 平衡二叉搜索树（红黑树） 实现，其特性为：

左子树所有节点的值 < 根节点的值；
右子树所有节点的值 > 根节点的值；
树的高度保持平衡，确保查找、插入、删除操作的时间复杂度为 O(logN)。

无序容器（unordered_set、unordered_map 等）的底层采用 哈希表 实现，通过哈希函数将键映射到存储位置，平均时间复杂度为 O(1)，但最坏情况下可能退化为 O(N)。

3. 搜索模型

关联式容器分为两种搜索模型：

K 模型：仅存储键（key），如 set，核心功能是判断元素是否存在；
KV 模型：存储键值对（key-value），如 map，核心功能是通过键查找对应的值。

二、set 的原理与使用

1. set 的核心特性

set 是 有序、不重复 的 K 模型容器，底层为红黑树。其核心特性：

自动排序：插入元素后，容器会按键的升序（默认）排列；
自动去重：插入重复元素时，操作会失败，容器中仅保留一个实例；
不可修改元素：set 中的元素是 const 类型，修改元素会破坏红黑树的结构，需通过 “删除旧元素 + 插入新元素” 实现。

2. set 的常用操作

（1）插入操作

set 不支持 push_back/push_front，需使用 insert() 插入元素：

#include <set>

using namespace std;

set<int> s;

s.insert(3);

s.insert(1);

s.insert(3); // 重复插入，操作失败

插入后，set 中的元素会自动排序为 {1, 3}。

（2）遍历操作

set 支持迭代器遍历和范围 for 遍历：

void test(){

set<int> s;

s.insert(3);

s.insert(4);

s.insert(1);

s.insert(2);

s.insert(3);

s.insert(7);

//排序＋去重

set<int>::iterator it = s.begin();

while (it != s.end())

{

cout << *it << " ";

it++;

}

cout << endl;

for (auto e : s)

{

cout << e << " ";

}

cout << endl;

}

（3）删除操作

set 支持两种删除方式：

通过迭代器删除（需先通过 find() 查找元素）；
直接通过值删除。

// 方式 1：通过迭代器删除

set<int>::iterator pos = s.find(7); //log(N)

//set<int>::iterator pos = find(s.begin(), s.end(), 4); //OP(N)

if (pos != s.end())

{

s.erase(pos);

}

// 方式 2：直接通过值删除

s.erase(1); // 删除元素 1，若不存在则无操作

（4）查找操作

set 的查找功能是其核心，提供两种方式：

成员函数 find()：利用红黑树特性，时间复杂度 O(logN)；
算法 std::find()：线性遍历，时间复杂度 O(N)。

示例对比：

#include <algorithm> // 包含 std::find

// 成员函数 find()

set<int>::iterator pos1 = s.find(3); // 高效查找

// 算法 find()

set<int>::iterator pos2 = find(s.begin(), s.end(), 3); // 低效遍历

使用建议：优先使用 set 的成员函数 find() 以获得最佳性能。

3. set 的实际应用

set 的核心优势是 快速存在性检查 和 高效去重排序，适用于以下场景：

存储学号、身份证号等唯一标识，快速验证是否存在；
对输入数据去重并排序，如统计考试成绩的不重复分数；
实现集合运算（交集、并集、差集）。

示例：验证学号是否存在

student_ids.insert("001");

student_ids.insert("002");

student_ids.insert("003");

string id = "002";

if (student_ids.find(id) != student_ids.end()) {

cout << "学号 " << id << " 存在" << endl;

} else {

cout << "学号 " << id << " 不存在" << endl;

}

三、map 的原理与使用

1. map 的核心特性

map 是 有序、键唯一 的 KV 模型容器，底层为红黑树。其核心特性：

存储键值对（key-value），键（key）唯一，值（value）可重复；
按键自动排序（默认升序）；
通过键快速查找对应的值，时间复杂度 O(logN)；
支持通过键修改值，但键不可修改（否则会破坏红黑树结构）。

2. map 的常用操作

（1）pair 类型介绍

map 中的元素是 pair<const key_type, value_type> 类型，pair 是一个模板结构体，包含两个成员：

first：键（key），不可修改；
second：值（value），可修改。

创建 pair 的方式：

// 方式 1：显式指定模板参数

pair<int, string> p1(1, "张三");

// 方式 2：使用 make_pair（自动推导类型）

pair<int, string> p2 = make_pair(2, "李四");

（2）插入操作

map 通过 insert() 插入 pair 类型元素：

#include <map>

using namespace std;

map<int, string> student_info;

// 方式 1：插入 pair 对象

student_info.insert(pair<int, string>(1, "张三"));

// 方式 2：使用 make_pair（推荐，更简洁）

student_info.insert(make_pair(2, "李四"));

// 方式 3：C++11 统一初始化

student_info.insert({3, "王五"});

复制讲解

插入后，map 会按键的升序排列：{1:张三, 2:李四, 3:王五}。

（3）遍历操作

map 支持迭代器遍历和范围 for 遍历，通过 it->first 访问键，it->second 访问值：

// 迭代器遍历

map<int, string>::iterator it = student_info.begin();

while (it != student_info.end()) {

cout << "学号：" << it->first << "，姓名：" << it->second << endl;

++it;

}

// 范围 for 遍历

for (auto e : student_info) {

cout << "学号：" << e.first << "，姓名：" << e.second << endl;

}

（4）查找与修改操作

通过键查找值有两种方式：

成员函数 find()：返回指向该键值对的迭代器；
下标运算符 []：直接通过键访问值（若键不存在，会自动插入一个默认构造的键值对）。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

VSCode 保姆级安装配置｜汉化 + Codex AI 插件 + GitHub 学生免费Copilot Pro

《VSCode新手一站式配置指南：汉化、插件与Copilot学生认证攻略》摘要：针对VSCode新手常见痛点，本文提供全流程解决方案。从国内镜像高速下载、微软官方语言包一键汉化，到Python/C++必备插件配置；重点讲解AI编程工具：Codex插件通过API密钥快速接入，GitHub学生认证详细步骤（含2FA双重验证、学信网材料提交技巧），实现Copilot Pro免费申领。涵盖Windows

AtomGit开源社区

营养对比分析 - 碳水与蛋白质吸收度研究鸿蒙PC Electron框架技术实现详解

AtomGit开源社区

为多Agent系统设计统一Harness层

在LLM（大语言模型）应用的第三次革命浪潮中，多Agent协作系统（Multi-Agent System, MAS）已成为解决复杂问题的“黄金范式”——从Autogen/GPT-4V Agent这类单用户演示级框架，到LangChain Agents/CrewAI这类轻量级本地框架，再到Kubernetes编排的分布式企业级Agent集群，各类方案层出不穷。但随之而来的工程化混乱编排层碎片化。