最近看了boost::any类源码,其实现主要依赖typeid操作符。很好奇这样实现的时间和空间开销有多大,决定探一下究竟。
VS2008附带的type_info类只有头文件,没有源文件,声明如下:
class type_info { public: virtual ~type_info(); _CRTIMP_PURE bool __CLR_OR_THIS_CALL operator==(const type_info& rhs) const; _CRTIMP_PURE bool __CLR_OR_THIS_CALL operator!=(const type_info& rhs) const; _CRTIMP_PURE int __CLR_OR_THIS_CALL before(const type_info& rhs) const; _CRTIMP_PURE const char* __CLR_OR_THIS_CALL name(__type_info_node* __ptype_info_node = &__type_info_root_node) const; _CRTIMP_PURE const char* __CLR_OR_THIS_CALL raw_name() const; private: void *_m_data; char _m_d_name[1]; __CLR_OR_THIS_CALL type_info(const type_info& rhs); type_info& __CLR_OR_THIS_CALL operator=(const type_info& rhs); _CRTIMP_PURE static const char *__CLRCALL_OR_CDECL _Name_base(const type_info *,__type_info_node* __ptype_info_node); _CRTIMP_PURE static void __CLRCALL_OR_CDECL _Type_info_dtor(type_info *); };
测试代码:
#include <iostream> using namespace std; class Object { }; int main() { Object obj; cout << "type name:" << typeid(obj).name() << endl; cout << "type raw name:" << typeid(obj).raw_name() << endl; if(typeid(obj) == typeid(Object)) { cout << "type is equal" << endl; } else { cout << "type is not equal" << endl; } return 0; }
输出:
type name:class Object
type raw name:.?AVObject@@
type is equal
在解释每个函数的实现原理前先开看type_info类的存储方式。
typeid返回的是type_info的引用,这个类不能拷贝,也不能自己构造,所以每个类最多只有一个type_info的数据,这个数据存放在哪里的呢?
用UltraEdit打开exe文件,搜索“Object”,能找到这个字符串。再用PE工具打开这个exe,发现这个字符串属于data节(这是可读可写的全局数据段)。再把有typeid的代码都注释,PE文件中没有了这个字符串。得出一个结论:
编译器会为每一种typeid操作的类型生成一份保存在数据段的type_info数据。
这份数据有多大呢?看下面这段代码:
#include <iostream> using namespace std; class Object { }; int main() { const type_info* p = &typeid(Object); cout << p << endl; return 0; }
在cout那一行下断点,查看到p的值为:
再看下这个类的声明,析构函数为virtual类型的,所以p的头四字节为虚函数表。p+4为_m_data,void*类型,四个字节,调试时发现都是0,还不清楚其表示什么。
p+8为_m_d_name,char类型数组,存储的是raw_name,每种类型的raw_name大小不定长,所以数组长度为1。现在type_info的存储结构已经一目了然:
每种类型的type_info数据长度依赖于类型名称,至少9个字节。
现在假设一个复杂的工程里面有50个类型用了typeid操作符,平均每个type_info长度为24,这些数据增加的PE大小为1200B,就1K左右。而现在的PE动辄几十M,所以这点空间开销根本不算什么。
再看看这些函数调用的开销:
- raw_name函数直接返回_m_d_name的地址,非常快;
- name函数将_m_d_name存储的字符串解码成实际的名称,也是很快;
- ==操作符是比较raw_name是否相等,也是很快。
读者可能会有两点疑惑:
- 存储的时候为什么不直接存储成name呢?我想最大的原因是节省空间,比如double的raw_name为".N",name为"double"多了四字节。
- ==操作符为什么不直接比较两个type_info引用的地址是否相等呢?我也很疑惑,我看汇编码发现它是比较raw_name。
备注:C++并没有规定typeid实现标准,各个编译器可能会不一样,上述分析过程基于VS2008自带的编译器。
总结:typeid带来的时间和空间开销是非常小的,不过使用的时候尽量不要违背开放封闭原则。
到此这篇关于C++中typeid实现原理的文章就介绍到这了,更多相关C++ typeid实现原理内容请搜索自由互联以前的文章或继续浏览下面的相关文章希望大家以后多多支持自由互联!