[C++]set和map的介绍及使用

    关于set和map的接口函数部分，只重点介绍一些相较于别的容器有特殊地方的接口，set和map的接口可以触类旁通。

一、概念

（一）、关联式容器

    **关联式容器****存储的元素是一个个的****键值对<key,value>**。**通过键（key）可以快速索引到其对应的value值。**关联容器可以快速查找、读取或者删除所存储的元素，同时该类型的容器插入元素的效率比序列容器（如vector）高。

（二）、键值对

    **键值对用来表示具有一一对应关系的一种结构，该结构中只包含两个成员变量key和value，key代表键值，value表示与key对应的信息，可以通过键值key快速索引到其对应的信息value**。比如说英汉词典，查询单词的中文释义就需要通过英文单词快速索引到中文释义，**这里的键key是英文单词，key的类型为string，key对应的信息value是中文释义，value的类型也为string，这样，英文单词和中文释义就构成了一个<string,string>的键值对。**

    键值对可以用**pair类**来表示，pair是C++的STL提供的一个类。pair - C++ Reference (cplusplus.com)https://legacy.cplusplus.com/reference/utility/pair/        **pair存储了公有的两个成员变量，一个叫做first，一个叫做second，可以在外部访问，这两个成员变量的类型通过用户指定。**我们可以用**pair的first存储键key，用second存储key对应的信息value。**

（三）、关联式容器的结构

    根据应用场景的不同，STL总共实现了两种不同结构的关联式容器：**树型结构与哈希结构。树型结构的关联式容器主要有四种：map、set、multimap、multiset。**这四种容器的共同点是：**使用平衡二叉搜索树(红黑树)作为其底层结果，容器中的元素是一个有序的序列，迭代器遍历得到的是一个有序的序列。**

二、set和multiset

（一）set

set - C++ Reference (cplusplus.com)https://legacy.cplusplus.com/reference/set/set/

set的简介

模板类型

**template < **

** class T, // set::key_type/value_type**

** class Compare = less<T>, // set::key_compare/value_compare**

** class Alloc = allocator<T> // set::allocator_type**

** >**

T：set存储的元素类型。

Compare：仿函数，用于提供元素之间的比较方法。

Alloc：空间配置器

1、set是按照特定次序存储的没有重复元素的容器。

2、在set中，一个元素value就对应其本身的值(value本身就是键key，类型为T)，并且每个元素在set中必须是不能重复的。set中元素的值在容器中不能被再次修改(元素的类型总是const类型)，但是可以从容器中插入或删除。

3、在内部，set中的元素总是按照其内部比较对象(类型为Compare)所指示的特定严格弱排序标准进行排序。

4、set容器在通过key访问单个元素时通常比unordered_set容器慢，但set迭代到的序列是有序的。

5、set通常以平衡二叉搜索树的形式实现。

set的接口

1、插入insert

    对于set的insert，**第一个（single element）和第三个（range）版本的插入最常用**，而中间的第二个（with hint）版本不是很常用，这个接口并不是在指定位置插入，而是在插入时提供一个接近最终插入的位置的迭代器，对插入元素时的效率进行优化，但这种优化效果并不总是显著的，因为用户提示不好，则会忽略用户的提示从头开始搜索插入位置进行插入，且红黑树的平衡性会影响搜索提示时的效率。

    注意到第一个（single element）版本的insert的返回值不是指向新插入位置的迭代器，而是**pair<iterator,bool>**类型。因为set中的元素都是唯一的，set不允许插入已经存在的元素，若插入的元素存在时，则插入失败，将返回一个**pair<iterator,bool>**的对象，**其first成员为指向set中现有元素位置的迭代器，second成员bool值为false表示插入失败**；**若插入的元素不存在，其first成员为指向新插入元素位置的迭代器，second成员bool值为true，表示插入成功。**

代码例子：

#include <iostream>
#include <set>
using namespace std;

int main()
{
    set<int> s;

    int arr[] = { 2,3,5,6,7,1,2,0,5};

    //将arr的元素依次插入到s中
    for (auto e : arr)
    {
        auto ret = s.insert(e);
        if (ret.second == false)//插入失败
        {
            cout << *(ret.first) << "已存在，插入失败。" << endl;
        }
    }

    //打印s的元素
    for (auto e : s)
    {
        cout << e << " ";
    }
    
    return 0;
}

**运行结果： **

2已存在，插入失败。
5已存在，插入失败。
0 1 2 3 5 6 7

2、查找并计数count

** 这个函数的功能是在容器中搜索与val相等的元素，并返回匹配次数。因为每个元素在set中都是唯一的，所以返回值只能为0和1。**如果只想查找某个元素在不在set容器内，可以考虑不使用find函数而使用count函数，如果返回值为1，那么存在，为0则不存在。

代码例子：

int main()
{
    set<int> s;

    int arr[] = {1,2,3,4,5,6,7,8,9,10};
    
    for (auto e : arr)
    {
        s.insert(e);
    }

    //查找某个值在不在s中
    int x;
 
    //方法1：使用find函数
    cin >> x;
    auto it = s.find(x);
    if (it != s.end())
        cout << *it << "存在!" << endl;
    else
        cout << x << "不存在" << endl;

    cout << endl;

    //方法2，使用count函数
    cin >> x;
    if (s.count(x))
        cout << x << "存在" << endl;
    else
        cout << x << "不存在" << endl;

    return 0;
}

3、lower_bound和upper_bound

lower_bound：得到下界

** 指定一个值x，返回一个迭代器，该迭代器指向容器中的第一个满足条件的元素，条件是该元素大于或等于x。**如果使用默认比较类型（less）实例化 set 类，则该函数将返回一个迭代器，该迭代器指向的值不小于x。

upper_bound：得到上界

** 指定一个值y，返回一个迭代器，该迭代器指向容器中的第一个满足条件的元素，条件是该元素大于y。**如果使用默认比较类型（less）实例化 set 类，则该函数将返回一个迭代器，该迭代器指向的值大于y。

    通过上面两个函数可以获得到两个迭代器，当x < y 时，这两个迭代器维护一个区间，**区间范围是[x,y)，左闭右开，可以用于删除指定范围的子序列。**

代码例子：

int main()
{
    std::set<int> myset;
    std::set<int>::iterator itlow, itup;

    for (int i = 1; i < 10; i++) myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90

    //删除区间位于 [25,65) 的元素 
    itlow = myset.lower_bound(25);     //找到第一个大于等于25的元素，这里是30
    itup = myset.upper_bound(65);      //找到第一个大于65的元素，这里是70 

    //删除对应迭代器区间的元素[itlow,itup)
    myset.erase(itlow, itup);                     // 10 20 70 80 90

    std::cout << "myset contains:";
    for (std::set<int>::iterator it = myset.begin(); it != myset.end(); ++it)
        std::cout << ' ' << *it;
    std::cout << '\n';

    return 0;
}

运行结果：

myset contains: 10 20 70 80 90

4、equal_range

** 功能：指定一个值val，返回一对迭代器，该迭代器维护着一段区间，该区间内的元素的值都为相同，为val。由于set的元素是唯一的，所以该区间内最多只能有一个元素。若val值不存在，两个迭代器都指向位于val之后的第一个元素。**

代码例子：

int main()
{
    std::set<int> myset;

    for (int i = 1; i <= 5; i++) myset.insert(i * 10);   // myset: 10 20 30 40 50

    std::pair<std::set<int>::const_iterator, std::set<int>::const_iterator> ret;
    ret = myset.equal_range(30);

    std::cout << "the lower bound points to: " << *ret.first << '\n';
    std::cout << "the upper bound points to: " << *ret.second << '\n';

    return 0;
}

**运行结果： **

the lower bound points to: 30
the upper bound points to: 40

（二）multiset

multiset - C++ Reference (cplusplus.com)https://legacy.cplusplus.com/reference/set/multiset/** multiset功能和set相似，但是multiset允许元素有冗余，可以存储多个相同的元素，而set里的每个元素都是唯一的。这里直接介绍multiset和set使用上的不同。**

1、insert

** 因为multise允许有重复的数据，所以用insert插入数据时不会存在插入失败的情况，其返回值不是pair<iterator,bool>类型，而直接就是iterator类型。**

2、erase

    **如果通过erase删除值为value的元素，那么在容器中所有与value相等的元素都会被删除。**

代码例子：

int main()
{
    multiset<int> myMultiset;

    int arr[] = { 10,10,20,20,20,30,40,50,60 };

    for (auto e : arr)
    {
        myMultiset.insert(e);
    }

    for (auto e : myMultiset)
    {
        cout << e << " ";
    }

    cout << endl;
    cout << "删除20" << endl;
    myMultiset.erase(20);

    for (auto e : myMultiset)
    {
        cout << e << " ";
    }
    return 0;
}

**运行结果： **

10 10 20 20 20 30 40 50 60
删除20
10 10 30 40 50 60

3、count

    由于元素在multise中不再唯一，count的返回值是大于等于0的。

int main()
{
    multiset<int> myMultiset;

    int arr[] = { 10,10,20,20,20,30,40,50,60 };

    for (auto e : arr)
    {
        myMultiset.insert(e);
    }

    for (auto e : myMultiset)
    {
        cout << e << " ";
    }

    cout << endl;

    cout << "20出现了" << myMultiset.count(20) << "次" << endl;
    return 0;
}

**运行结果： **

10 10 20 20 20 30 40 50 60
20出现了3次

4、lower_bound和upper_bound

** 功能和上面介绍的set的lower_bound和upper_bound一样，不过lower_bound和upper_bound在multiset用得更多一些。**

代码例子：

int main()
{
    multiset<int> myMultiset;

    int arr[] = { 10,10,20,20,20,30,40,50,60,60,60,70,80,90,100};

    //插入数据
    for (auto e : arr)
    {
        myMultiset.insert(e);
    }

    //打印
    for (auto e : myMultiset)
    {
        cout << e << " ";
    }
    cout << endl;

    //删除区间位于 [25,65) 的元素 
    auto itlow = myMultiset.lower_bound(25);     //找到第一个大于等于25的元素，这里是30
    auto itup = myMultiset.upper_bound(65);      //找到第一个大于65的元素，这里是70 

    myMultiset.erase(itlow, itup);

    for (auto e : myMultiset)
    {
        cout << e << " ";
    }

    return 0;
}

运行结果：

10 10 20 20 20 30 40 50 60 60 60 70 80 90 100
10 10 20 20 20 70 80 90 100

5、equal_range

** 功能和上面介绍的set的equal_range一样，不过equal_range在multiset用得更多一些，可以得到一个迭代器区间，该区间内的元素都和指定key相同。**

代码例子：

int main()
{
    multiset<int> myMultiset;

    int arr[] = { 10,10,20,20,20,30,40,50,60,60,60,70,80,90,100 };

    //插入数据
    for (auto e : arr)
    {
        myMultiset.insert(e);
    }

    //打印
    for (auto e : myMultiset)
    {
        cout << e << " ";
    }
    cout << endl;

    //得到重复元素60的迭代器区间
    pair<multiset<int>::iterator, multiset<int>::iterator> ret = myMultiset.equal_range(60);

    //删除
    myMultiset.erase(ret.first, ret.second);

    //打印
    for (auto e : myMultiset)
    {
        cout << e << " ";
    }
    cout << endl;
    return 0;
}

运行结果：

10 10 20 20 20 30 40 50 60 60 60 70 80 90 100
10 10 20 20 20 30 40 50 70 80 90 100

三、map和multimap

（一）map

map - C++ Reference (cplusplus.com)https://legacy.cplusplus.com/reference/map/map/

map的简介

模板类型

template <
       class Key,                                     // map::key_type

       class T,                                       // map::mapped_type

       class Compare = less<Key>,                     // map::key_compare

       class Alloc = allocator<pair<const Key,T> >    // map::allocator_type

       >
key：键key的类型。

T：映射值value的类型。

Compare: 比较器的类型，map中的元素是按照key来比较的，缺省情况下按照小于来比较，一般情况下(内置类型元素)该参数不需要传递，如果无法比较时(自定义类型)，需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)

Alloc：空间配置器

1、map是一种关联容器，用于存储由键key和映射值value组合而成的元素,按照特定顺序存储。

2、在map中，键值通常用于对元素进行排序和唯一标识，而映射值存储与此键相关的内容。键和映射值的类型可以不同，键和映射值在成员中用一个value_type类型的变量组合在一起，value_type是将两者组合在一起的pair类型:typedef pair<const Key, T> value_type;

3、在内部，映射中的元素总是按照其内部比较对象(类型为Compare)所指示的特定严格弱排序标准的键进行排序。

4、map容器在通过键key访问单个元素时通常比unordered_map容器慢，但map迭代到的序列是有序的。

5、map中的映射值value可以使用括号操作符((operator[])通过对应的键key直接访问到。

6、map通常以二叉搜索树的形式实现。

map的接口

1、插入insert

    **map存储的元素类型是pair<K,V>类型，插入元素时需要传入pair<K,V>类型的对象进行插入。**

插入例子：

void test1()
{
    //英汉词典
    map<string, string> dict;

    //插入方法1:实例化pair对象插入
    pair<string, string> kv1("abandon", "v.放弃");
    dict.insert(kv1);

    //插入方法2:构造函数生成匿名对象
    dict.insert(pair<string, string>("ability", "n. 能力； 才能"));

    //插入方法3：使用make_pair函数返回pair类型变量
    dict.insert(make_pair("able", "a. 能够；有能力的"));

    //插入方法4：多参数构造函数的类型转换
    pair<string, string> kv2 = { "abnormal"," a. 不正常的" };
    dict.insert(kv2);
    dict.insert({ "abnormal"," a. 不正常的" });

    //插入方法5: 初始化列表initializer_list + 多参数构造函数的类型转换
    initializer_list<pair<const string, string>> l = { {"aboard","ad.在船、飞机上"} ,{"abolish","v.废除"},{"about","ad. 大约；到处；四处"} };
    dict.insert(l);
    dict.insert({ {"aboard","ad.在船、飞机上"} ,{"abolish","v.废除"},{"about","ad. 大约；到处；四处"} });

    //打印词库
    for (auto& e : dict)
    {
        cout << e.first << " -> " << e.second << endl;
    }
}

void test2()
{
    //插入方法5: 初始化列表initializer_list + 多参数构造函数的类型转换
    //一步到位
    //英汉词典
    map<string, string> dict = { {"abandon", "v.放弃"},
        {"ability", "n. 能力； 才能"},
        {"abnormal"," a. 不正常的"},
        {"aboard","ad.在船、飞机上"},
        {"abolish","v.废除"},
        {"about","ad. 大约；到处；四处"}
    };

    //打印词库
    for (auto& e : dict)
    {
        cout << e.first << " -> " << e.second << endl;
    }
}

int main()
{
    test1();
    cout << endl;
    test2();
    
    return 0;
}

运行结果：

abandon -> v.放弃
ability -> n. 能力；才能
able -> a. 能够；有能力的
abnormal -> a. 不正常的
aboard -> ad.在船、飞机上
abolish -> v.废除
about -> ad. 大约；到处；四处

abandon -> v.放弃
ability -> n. 能力；才能
abnormal -> a. 不正常的
aboard -> ad.在船、飞机上
abolish -> v.废除
about -> ad. 大约；到处；四处

2、下标访问operator[]和at

    **功能：使map可以像数组通过下标访问到数据一样，通过对应的键key访问到其对应映射的值value。**

    如果key与容器中元素的键匹配，则该函数将返回对其映射值的引用。
     如果key与容器中任何元素的键不匹配，则该函数将插入一个该键的新元素，并返回对其映射值的引用。请注意， 本操作会让容器大小增加 1，即使没有为该元素分配映射值来初始化（该新元素会在构造时使用映射值类型的默认构造进行初始化），

功能：和operator[]功能类似，通过键key访问其映射值，返回key对应的映射值的引用。**但是，如果键key不存在，则会抛异常。 **

代码例子：

int main()
{
    //统计选民的投票次数
    string arr[] = { "张三","李四","张三","李四","王某","王某","李四","李四","王某" };

    //键：名字 映射值：投票次数
    map<string, int> count;

    //计数
    for (auto& e : arr)
    {
        //通过名字索引对应的投票次数并加一，代表投票次数加一
        //如果该名字不在count里，则用该名字作为key新插入一个元素，其映射值使用的是int内置类型的默认构造，其值为0
        count[e]++; 
    }

    //打印选民和对应的投票次数
    for (auto e : count)
    {
        cout << e.first << " -> " << e.second << endl;
    }

    return 0;
}

运行结果：

李四 -> 4
王某 -> 3
张三 -> 2

3、其他接口

    map的count、lower_bound、upper_bound以及equal_range的功能和set的是一样的，其功能在set部分已经着重介绍过了，这里不再赘述。

（二）、multimap

    multimap和map功能类似，这里也不再赘述。**需要注意的是multimap允许元素冗余，容器中可以存在多个相同key的元素，并且multimap中没有重载operator[]和at操作**，因为multimap中可以有多个相同的key对应不同的映射值，使用operator[]的话返回值的类型应该是一个引用映射值的数组，这样的话会使内存更加复杂化，如果需要得到所有相同key的元素，可以通过equal_range得到这个集合的迭代器区间，这样更加简洁。

标签： c++ 开发语言 map

本文转载自: https://blog.csdn.net/SUICIDEKILL/article/details/141423020
版权归原作者 ️南城丶北离 所有，如有侵权，请联系我们删除。

[C++]set和map的介绍及使用

一、概念

（一）、关联式容器

（二）、键值对

（三）、关联式容器的结构

二、set和multiset

（一）set

set的简介

set的接口

1、插入insert

2、查找并计数count

3、lower_bound和upper_bound

4、equal_range

（二）multiset

1、insert

2、erase

3、count

4、lower_bound和upper_bound

5、equal_range

三、map和multimap

（一）map

map的简介

map的接口

1、插入insert

2、下标访问operator[]和at

3、其他接口

（二）、multimap

发表评论