多态及其实现原理
- 一、多态的概念
-
- 概念
- 构成条件
- 二、虚函数的重写
-
- 重写的定义
- 重写的特殊情况
- override和final关键字
- 区分重写、重载、重定义
- 抽象类的概念
- 三、多态的实现原理
-
- 父类对象模型
- 补充:生成默认构造方法的场景
- 子类对象模型
- 多态的调用原理
- 多继承的虚函数表
- 四、继承与多态中的常见问题
注:编译环境为vs 2022,指针大小为4字节
概念
多态,指完成某个行为,不同的对象去完成时会产生出不同的状态。如:定一个一animal类,类中包含动物的叫声这种方法,分别定义dog和cat类继承自动物类,那么dog和cat类中也会包含叫声这种方法,但是他们具体实现是不同的,因为每种动物的声音都不相同,这便是一种多态。
多态的分类
- 静态多态,也称为静态绑定或者早绑定,是指函数在编译期间就已经确定了函数的行为。函数重载、函数模板等都属于静态多态。
- 动态多态,即动态绑定或者晚绑定,指程序在运行时才可以确定函数的行为。本文主要分析的是动态多态。
构成条件
- 在继承体系下,父类中包含虚函数
- 子类中对父类的虚函数进行重写
- 通过父类的指针或者引用调用虚函数
多态的体现:不同的类对象调用同一函数,会产生不同的行为。
重写的定义
虚函数:virtual关键字修饰的函数
子类中有一个跟父类完全相同的虚函数,即返回值类型、函数名、形参列表都完全相同,则可以说子类重写了父类的虚函数。
student类中重写了buyticket方法:
注意:只要父类中函数用virtual修饰即可,子类可以不加,且虚函数的重写与权限无关。
重写的特殊情况
- 协变——返回值类型不同
父类的虚函数返回父类对象的指针或者引用,子类虚函数返回子类对象的指针或者引用。
- 析构函数重写——父类与子类析构函数名字不同
如果父类的析构函数为虚函数,子类的析构函数只要定义了,都能与父类的析构函数构成重写。可以理解为编译器对析构函数的名字做了特殊处理,编译后析构函数的名字统一处理成destructor。
override和final关键字
这两个关键字的主要作用都是帮助用户检测是否构成重写。
- final
修饰虚函数,表示虚函数不可被重写;另外final也可以修饰类,表示该类不能被继承
- override
修饰虚函数,检查子类虚函数是否重写了父类的虚函数,如果没有构成重写则会报错
区分重写、重载、重定义
抽象类的概念
在虚函数的后面写上=0,则这个函数为纯虚函数。包含纯虚函数的类叫做抽象类(也称接口类),抽象类不能实例化对象。抽象类被集成以后如果没有对虚函数进行重写,则继承的类也是抽象类。一般情况下,抽象类必须被继承,且必须对虚函数进行重写,否则定义为抽象类则没有实际意义。
shape类:
class shape
{
public:
// 纯虚函数
virtual double getarea() = 0;
virtual double getcircumference() = 0;
};
父类对象模型
给出一个base类,一个derived类继承base类
class base
{
public:
virtual void func1()
{
cout << "base::fun1c()" << endl;
}
virtual void func2()
{
cout << "base::func2()" << endl;
}
virtual void func3()
{
cout << "base::func3()" << endl;
}
public:
int _a;
};
class derived:public base
{
public:
int _b;
};
父类对象模型:
总结:
- 类中定义了虚函数以后,定义对象时,编译器会为对象创建一张虚表,并将一个指向这张虚表的指针保存在对象的前四个字节,无论定义几个虚函数,对象都只比多四个字节大小。这个指针称为函数虚表指针。
- 虚表地址是在构造对象时进行填充的,构造函数如果显式实现,编译器会对用户实现的函数进行修改,增加给对象前四个字节存放虚表地址的语句。
- 虚表本质就是一个函数指针数组,按照声明顺序依次存放虚函数的地址
补充:生成默认构造方法的场景
在学习类与对象时我们知道构造函数是是类的默认成员函数,如果用户没有显式定义,编译器会默认生成,但是实际上并不是在所有情况下编译器都会生成默认的构造函数,编译器只会在需要的时候生成构造函数。
四种生成默认构造方法的场景
-
b类中包含有a类的对象,b类没有显式定义构造函数,a类定义了无参或者全缺省的构造方法,则编译器会给b类生成默认的构造方法。
分析:因为a类有无参或者全缺省的构造方法,需要在b类中调用a类的构造方法对a类成员进行初始化,所以需要生成b类的构造方法,在其初始化列表中调用a类构造方法。
如果a类没有显式定义构造函数,则不会生成b类构造方法,默认赋随机值;如果a类定义的构造方法不是无参或者全缺省的,则需要在初始化列表中对a类对象初始化:
-
继承中,b继承a,a中定义了无参或者全缺省的构造方法,b未显式定义,则编译器会给b类生成默认的构造方法。将b中继承自a的部分初始化。
-
虚拟继承中,b类虚拟继承子a类,b类未显式定义构造方法,编译器会给b类生成默认的构造方法,目的是:给b类对象的前4个字节填充虚基表地址
-
类中包含虚函数,未显示定义构造方法,则编译器会自动生成构造方法,为对象的前4个字节填充虚表地址
子类对象模型
子类虚表构建规则
- 将父类虚表内容拷贝一份放到子类虚表中,注意父类和子类用的不是同一张虚表,仍以上面的base和derived类为例
可以看出,两个虚表指针的地址不同,但虚表中保存的虚函数的地址都相同。 - 如果子类中将父类的虚函数进行了重写,则用子类的虚函数地址替换虚函数表中相同偏移量的虚函数的地址。
- 子类中增加的虚函数按照其在类当中的声明次序放在虚表的最后
子类中增加了两个虚函数:
但是由于vs监视窗口中无法显式新增加的子类,而内存窗口只能显式虚函数的地址,无法确认是哪个函数,所以这里通过打印的方式进行验证。
通过上图中程序的方式打印出了子类对象中虚函数的分布情况,在这里vfp是一个函数指针类型,前面加typedef表示为函数指针类型,如果不加,则是函数指针变量。
所以是用vfp*接收指向第一个虚函数指针的指针,p与*p的类型:
所以最终的结论是:子类新增的虚函数按照其在类中的声明次序放在虚函数表的最后。
子类对象的构造过程
构造子类对象时,在初始化列表中先调用父类的构造函数,此时对象的前4个字节保存的虚表指针指向父类的虚表,之后构造子类自己的虚表,虚表再指针指向子类的虚表。
总结
- 虚表的本质是函数指针数组,在编译时生成
- 虚函数的重写也叫覆盖,指的是虚表中虚函数的覆盖,重写是语法层的叫法,覆盖是原理层的叫法
- 对象中保存的是虚表指针,虚表中保存的是虚函数指针,虚函数和普通函数一样保存在代码段,在vs中虚表也保存在代码区
- 同一个类的对象共用同一张虚表,父类和子类各自拥有各自的虚表。
多态的调用原理
父类对象,函数调用时的汇编代码:
普通函数调用时直接传递函数的地址,这个地址在编译期间就确定了,虚函数则要经过虚表指针寻址等步骤。从上面的汇编代码也可以看出动态多态的晚绑定的特点,在编译期间普通函数的调用已经确定了要调用的具体函数,虚函数则无法确定,只有等程序运行起来,形参b是具体哪个对象确定了以后,才能确定要调用的函数的地址。
上面是传递父类对象时的调用情况,子类对象调用时的汇编代码与父类对象相同,区别就是子类对象有自己的虚表,最终调用的是子类需表中的函数。
总结多态的原理:
创建对象时,编译器会给包含虚函数的类对象创建一张虚表,并将虚表地址填充在对象的前4个字节,子类对象会拷贝父类对象的虚表,然后再对自己重写的虚函数进行替换,并在虚表中添加子类新增的虚函数;函数调用时,编译器会先从对象的前4个字节获取该对象虚表的地址,然后在虚表中获取虚函数地址进行函数调用;由于每个类对象都有属于该类的一张虚表,且虚函数一般都进行了重写,即函数名与父类相同,但函数执行的内容不同,最终产生的结果就是,不同类的对象调用同一函数产生不同的结果,由此形成了多态。
多继承的虚函数表
给出两个父类base1和base2,derived子类继承自两个父类
通多监视窗口查看子类对象的模型:
多态中多继承的子类对象模型与多继承的模型原理相同,但是vs的监视窗口无法查看子类新增的虚函数在需表中的位置,按照之前但继承中打印虚表中函数的原理进行打印:
最终得到的结果:
可以看出,子类中增加的虚函数保存在上面的虚表中。
多继承子类对象模型及对象虚表:
-
析构函数可以设置为虚函数吗?
可以,在继承体系中,最好将父类的析构函数设置为虚函数;如果子类中涉及到资源管理,则必须将父类的析构函数设置为虚函数,这样父类和子类中的析构函数便会构成重写(重写的特殊情况),形成多态,通过父类指针指向子类对象时,delete父类对象的指针也会调用子类的析构函数。
子类中涉及资源管理,调用父类析构函数析构子类对象,则会有内存泄漏,如图:
-
构造函数可以设置为虚函数吗?
不能,虚函数是放在虚表中的,虚表指针是在构造方法的初始化列表中进行填充的,通过虚表指针才能找到虚函数,但是不调用构造方法就没有虚表指针,二者矛盾。即如果构造方法是虚函数,那么调用构造方法就要通过虚表指针,但是虚表指针是要通过调用构造方法才能填充的。拷贝构造与构造函数原理相同。
-
赋值运算符重载函数可以设置为虚函数吗?
可以,但是没有意义,因为赋值运算符重载函数参数和返回值都是本类类型对象的引用,设置程序函数无法进行重写,无法构成多态。 -
静态函数可以设置为虚函数吗 ?
虚函数必须在创建对象后,通过对象的前4个字节的虚表指针调用。而静态成员函数可以通过 类名::成员函数 的方式进行调用,不用通过象,这样就无法找到虚表,也无法访问虚函数。
-
内联函数可以是虚函数吗?
可以设置,但是没有意义,因为虚函数关键字virtual和inline是矛盾的,inline属性会被忽略,函数不会展开,而是放到虚函数表中。 -
友元函数可以是虚函数吗?
不可以,因为virtual只能修饰类的成员函数。
7.为什么多态必须通过指针或者引用实现?
因为当我们用一个父类指针或者引用指向子类对象时,会发生内存切割,用子类中属于父类的部分给父类赋值:
animal& animal1 = dog;
animal* animal2 = new dog();
而下面的语句则不会产生内存切割:
ainmal animal3 = dog;
为什么会这样呢?
“一个pointer或一个reference之所以支持多态,是因为它们并不引发内存任何“与类型有关的内存委托操作; 会受到改变的。只有它们所指向内存的大小和解释方式 而已”。 ——《深度探索c 对象模型》
▲此处仍有需要探索的地方,可以参考《深度探索c 对象模型》一书了解更多深层次的原理。