25

【论坛android源码】【pion源码】【rcode源码】stl源码剖析

时间：2025-01-19 20:23:54 来源：米酷系统源码分类：综合

1.【STL源码剖析】总结笔记（2）：容器（containers）概览
2.剖析std::sort函数设计，码剖避免coredump
3.STL源码剖析总结笔记（3）：vector初识
4.STL源码剖析9-set、码剖multiset
5.STL 源码剖析：sort

stl源码剖析

【STL源码剖析】总结笔记（2）：容器（containers）概览

容器作为STL的码剖重要组成部分，其使用极大地提升了解决问题的码剖效率。深入研究容器内部结构与实现方式，码剖对提升编程技能至关重要。码剖论坛android源码本文将对容器进行概览，码剖分为序列式容器、码剖关联式容器与无序容器三大类。码剖

容器大致分为序列式容器、码剖关联式容器和无序容器。码剖其中序列式容器侧重于顺序存储，码剖关联式容器则强调元素间的码剖键值关系，而无序容器可以看作关联式容器的码剖一种。

容器之间的码剖关系可以归纳为：序列式容器为基层，关联式容器则在基层基础上构建了更复杂的数据结构。例如，heap和priority容器以vector作为底层支持，而set和map则采用红黑树作为基础数据结构。此外，还存在一些非标准容器，如slist和以hash开头的容器。在C++ 中，slist更名为了forward-list，而hash开头的容器改名为了unordered开头。

在容器的实现中，sizeof()函数可能揭示容器的内部大小对比。需要注意的是，尽管在GNU 4.9版本中，一些容器的设计变得复杂，采用了较多的继承结构，但实际上，pion源码这些设计在功能上并未带来太大差异。

熟悉容器的结构后，我们可以从vector入手，探索其内部实现细节。其他容器同样蕴含丰富的学习内容，如在list中，迭代器（iterators）的设计体现了编程的精妙之处；而在set和map中，红黑树的实现展现了数据结构的高效管理。

本文对容器进行了概览，旨在提供一个全面的视角，后续将对vector、list、set、map等容器进行详细分析，揭示其背后的实现机制与设计原理。

剖析std::sort函数设计，避免coredump

剖析STL中的std::sort函数设计，避免coredump

在STL中，std::sort函数基于Musser在年提出的内省排序（Introspective sort）算法实现。该算法结合了插入排序、堆排序和快速排序的优点。本文将从源码角度深入分析std::sort函数的实现过程。

std::sort函数在内部调用std::__sort函数。std::__sort主体分为两个部分：快排和堆排。快排通过递归调用__introsort_loop函数实现，堆排则在快排深度达到限制时触发。__introsort_loop函数存在两个限制条件，即快排的最大深度和元素个数的阈值。

__introsort_loop函数通过while循环执行快排，每次循环寻找分割点后进入右分支递归。在递归回后，rcode源码进入左分支。该实现避免了调用开销，且减少递归深度过深的情况。当不满足限制条件时，递归返回，留下小于阈值的元素进行后续处理。

在快排部分，__unguarded_partition_pivot函数负责寻找分割点。它先计算中值，并将其移至数组首部，然后通过while循环调整数组元素，确保左侧元素不比中值大，右侧元素不比中值小。

__unguarded_partition函数执行快排的分区操作，通过不断调整元素位置，最终实现数组的有序性。为避免越界错误，STL确保中值一定不是最大值，因此分区操作不会越界。

如果比较器算法不符合严格弱序关系（即当比较器对象comp传入两个相等对象时返回值必须是false），则可能导致coredump。在数据分布为连续相等值时，如果比较器不符合要求，快排过程中可能会导致last指针越界。

当快排深度达到限制时，STL使用堆排完成排序。__partial_sort函数实现堆排，取出数组中前部分元素并排序。__final_insertion_sort函数则通过插入排序处理局部无序的情况，优化排序速度。

插入排序在数据主体有序时表现出高效性，tclapp源码STL利用这一点进一步优化排序过程。__insertion_sort函数执行插入排序，通过__unguarded_linear_insert函数寻找合适位置插入元素，实现高效排序。

在编写自定义比较器算法时，确保其符合严格弱序关系，即当比较器对象comp传入两个相等对象时返回值为false，以避免核心崩溃（coredump）等问题，确保代码移植性。

至此，我们对std::sort函数的实现流程有了深入理解，避免了由于错误使用导致的coredump问题，实现了更正确的程序设计。

STL源码剖析总结笔记（3）：vector初识

vector是c++中常用且重要的容器之一。相较于固定大小的array，vector拥有动态分配内存的特性，允许它在使用过程中随着元素的增删而自行调整大小。这种动态性使得vector在处理不可预知数据量时更为便捷。

内部结构上，vector使用了数组作为存储基础，并通过start, finish和end of storage三个迭代器进行访问和管理空间。其中，start和finish分别指向可用空间的首端和尾端，end of storage则指向内存块的末尾。在vector大小为字节（位系统下，一个指针占4字节）的情况下，其大小为3。因此，vector可以灵活地通过迭代器定位数据的大小与位置。

内存管理机制是vector的精华之一。当空间耗尽时，alve源码vector会自动扩展为二倍的内存容量，以容纳新增元素。此过程涉及创建新空间，复制原有数据，然后释放旧空间，确保资源的有效利用。

vector提供了丰富的迭代器，遵循随机访问的行为，允许直接获取和修改数据，增强操作的效率。这些迭代器简化了对数据结构的遍历与修改操作。

在添加与删除数据时，vector提供了pop_back(), erase, insert等高效方法。例如，pop_back()简单地删除尾部元素，erase允许清除一个范围内的数据，并通过复制来维持数据的连续性。insert操作根据具体需求进行数据的插入与调整，确保结构的完整性与数据的正确性。

综上，vector以其灵活的内存管理和高效的数据操作，成为学习STL和掌握容器结构的理想选择。其清晰的内部机制和丰富的功能特性，为程序设计提供了强大的支持。

STL源码剖析9-set、multiset

STL源码剖析-set、multiset

在深入探讨STL源码时，set与multiset是关键组件，它们皆基于红黑树实现。这些数据结构设计旨在高效处理有序集合。set类及其内部rb tree模板参数identity，定义在stl_function.h文件中，是仿函数的一种实现。这表明set类能够灵活地根据用户自定义的比较规则来组织数据，从而提供强大的灵活性。

具体而言，stl_set.h文件中定义了set类，它封装了红黑树结构，用于存储无重复元素的集合。借助rb tree的特性，set能够保证插入、删除、查找等操作的时间复杂度为O(log n)。而identity参数的选择，使得用户能基于不同的比较逻辑自定义元素间的相对顺序，适应多种应用场景。

多集类multiset则是在set的基础上扩展而来的，它允许集合中元素重复出现。这种设计使得multiset在需要存储有重复元素的有序集合时更为适用。与set类似，multiset同样基于红黑树实现，但其模板参数identity的用法与set相同，依然定义在stl_function.h中，以便实现自定义的比较逻辑。

在stl_multiset.h文件中，可找到multiset类的定义。它继承自set，并通过增加对重复元素的支持，为用户提供了一个更灵活的数据结构选择。通过灵活运用multiset，开发人员能够轻松实现需要频繁插入、删除重复元素的有序集合，同时保持高效的操作性能。

总结而言，set与multiset作为STL中的重要组件，分别针对无重复元素与允许重复元素的有序集合提供高效实现。通过自定义比较逻辑与红黑树结构的结合，它们不仅保证了数据的有序性，还提供了高效的操作性能，成为众多应用程序中不可或缺的数据结构。

STL 源码剖析：sort

我大抵是太闲了。

更好的阅读体验。

sort 作为最常用的 STL 之一，大多数人对于其了解仅限于快速排序。

听说其内部实现还包括插入排序和堆排序，于是很好奇，决定通过源代码一探究竟。

个人习惯使用 DEV-C++，不知道其他的编译器会不会有所不同，现阶段也不是很关心。

这个文章并不是析完之后的总结，而是边剖边写。不免有个人的猜测。而且由于本人英语极其差劲，大抵会犯一些憨憨错误。

源码部分sort

首先，在 Dev 中输入以下代码：

然后按住 ctrl，鼠标左键sort，就可以跳转到头文件 stl_algo.h，并可以看到这个：

注释、模板和函数参数不再解释，我们需要关注的是函数体。

但是，中间那一段没看懂……

点进去，是一堆看不懂的#define。

查了一下，感觉这东西不是我这个菜鸡能掌握的。

有兴趣的戳这里。

那么接下来，就应该去到函数__sort 来一探究竟了。

__sort

通过同样的方法，继续在stl_algo.h 里找到 __sort 的源代码。

同样，只看函数体部分。

一般来说，sort(a,a+n) 是对于区间 [公式] 进行排序，所以排序的前提是 __first != __last。

如果能排序，那么通过两种方式：

一部分一部分的看。

__introsort_loop

最上边注释的翻译：这是排序例程的帮助程序函数。

在传参时，除了首尾迭代器和排序方式，还传了一个std::__lg(__last - __first) * 2，对应 __depth_limit。

while 表示，当区间长度太小时，不进行排序。

_S_threshold 是一个由 enum 定义的数，好像是叫枚举类型。

当__depth_limit 为 [公式] 时，也就是迭代次数较多时，不使用 __introsort_loop，而是使用 __partial_sort（部分排序）。

然后通过__unguarded_partition_pivot，得到一个奇怪的位置（这个函数的翻译是无防护分区枢轴）。

然后递归处理这个奇怪的位置到末位置，再更新末位置，继续循环。

鉴于本人比较好奇无防护分区枢轴是什么，于是先看的__unguarded_partition_pivot。

__unguarded_partition_pivot

首先，找到了中间点。

然后__move_median_to_first（把中间的数移到第一位）。

最后返回__unguarded_partition。

__move_median_to_first

这里的中间数，并不是数列的中间数，而是三个迭代器的中间值。

这三个迭代器分别指向：第二个数，中间的数，最后一个数。

至于为什么取中间的数，暂时还不是很清楚。

`__unguarded_partition`

传参传来的序列第二位到最后。

看着看着，我好像悟了。

这里应该就是实现快速排序的部分。

上边的__move_median_to_first 是为了防止特殊数据卡 [公式] 。经过移动的话，第一个位置就不会是最小值，放在左半序列的数也就不会为 [公式] 。

这样的话，__unguarded_partition 就是快排的主体。

那么，接下来该去看部分排序了。

__partial_sort

这里浅显的理解为堆排序，至于具体实现，在stl_heap.h 里，不属于我们的讨论范围。

（绝对不是因为我懒。）

这样的话，__introsort_loop 就结束了。下一步就要回到 __sort。

__final_insertion_sort

其中某常量为enum { _S_threshold = };。

其中实现的函数有两个：

__insertion_sort

其中的__comp 依然按照默认排序方式 < 来理解。

_GLIBCXX_MOVE_BACKWARD3

进入到_GLIBCXX_MOVE_BACKWARD3，是一个神奇的 #define：

其上就是move_backward：

上边的注释翻译为：

__unguarded_linear_insert

翻译为“无防护线性插入”，应该是指直接插入吧。

当__last 的值比前边元素的值小的时候，就一直进行交换，最后把 __last 放到对应的位置。

__unguarded_insertion_sort

就是直接对区间的每个元素进行插入。

总结

到这里，sort 的源代码就剖完了（除了堆的那部分）。

虽然没怎么看懂，但也理解了，sort 的源码是在快排的基础上，通过堆排序和插入排序来维护时间复杂度的稳定，不至于退化为 [公式] 。

鬼知道我写这么多是为了干嘛……

上一条：全国首个婚姻类职业本科，学些什么？
下一条：福州出台企业经营异常名录管理办法

一周热点

精彩推荐

43隻猴子從美國一研究實驗機構逃跑　警方籲民眾關好門窗

張忠謀是「台灣科技教父」黃仁勳：沒有台積電就沒有輝達

諾貝爾經濟學得主史迪格里茲：通膨不會是長期的｜天下雜誌

《棉花、絲綢、牛仔褲》：裴洛西肩上的肯特布——「泛非主義的制服」和非洲離散的自尊標誌