摘要:本文章用演化博弈理论建立了学校管理者和教师之间的决策博弈模型,在参数设定时结合实际情况考虑到现实因素,依据现实设定了成本,同时通过探讨成本系数的变化,得到四种不同的稳定状态,分析了该博弈模型自发演化的模式,并且对四种结果进行参数分析,得到了我们所想要的稳定状态,该结果为学校建设提供了良好的参考依据。
关键词:博弈论;演化博弈;复制动态方程;演化稳定策略;混合博弈
管理是一门艺术,如果学校管理者和教师之间能够主动配合,积极工作,那么学校的教学科研就会取得更好成绩,反之就会造成不配合抵触局面,学校教研水平就相应的下降。为此,我们建立学校管理者与教师之间的演化博弈模型来分析各自策略的演化过程。
1.演化模型建立
我们假设表示学校管理者的策略空间,有严格管理()和宽松管理()两种策略,即={严格管理,宽松管理};表示教师策略空间,有积极配合()和消极怠工()两种策略,即={积极配合,消极怠工},AB是博弈方的策略空间,={,};这个博弈模型为={、、}。其中,是博弈的参与人集合,即学校管理者和教师;是博弈双方的收益。
学校管理者和教师各自的收益不仅仅取决于其自身选择的态度策略,同时也受到双方采取不同策略搭配以及其他多重因素的混合影响,表示完成工作时双方的奖励,、表示工作未完成时相应人员所要受到的惩罚,只有学校管理者宽松管理而教师消极怠工才不能完成工作,其它情况下都可以完成工作。由于博弈双方的工作作风不同,工作成本也有差异,其各自独立工作的固定成本为常数、。当双方配合工作时,双方选择不同态度都对各自的工作成本造成一定影响,用成本变化系数、(、)表示。其中学校管理者严格管理()与教师积极配合()视为主动态度,学校管理者宽松管理()与教师消极怠工()都视为被动态度,表示博弈双方一方采取主动态度,采取被动态度的一方的成本变化系数;表示双方都采取主动态度时,双方都付出所带来的成本变化系数,与的大小则需要讨论。学校管理者与教师的收益矩阵如表1所示。
表1 博弈模型的收益矩阵
假设
、分别代表t时刻选择学校管理者中选择策略或者教师中选择策略的个体数,x与y表示该时刻
与与所属人群总数比例,即
,。经过一段时间双方就会发现收益差距,并且收益较差的策略将被淘汰,这意味着x和y并不是固定不变的,而是随着时间变化的,根据复制者动态方程理论,即策略的增长率等于它的相对适应度,只要采取这个策略的人收益不断增加,并且该策略适应度比群体平均适应度高,那么这个策略的增长率就会增高,x与y的值就会相应的增大,由此我们可以得出它的纯策略的个体平均适应度、群体的平均适应度和复制动态方程。
1、个体策略平均适应度
策略的个体平均适应度:
策略的个体平均适应度:
2、群体策略平均适应度
学校管理者种群的平均适应度:
教师种群的平均适应度:
3、复制者动态方程:
学校管理者策略选择复制者动态方程:
教师策略选择复制者动态方程:
其中:为学校管理者选择策略的个体的平均适应度, 表示学校管理者群体策略平均适应度,为教师选择策略的个体的平均适应度,表示教师群体策略平均适应度。
2.演化稳定性分析
1)情况1.
为求取系统的均衡点,我们令,可以得到可能的稳定状态有:
当时
,对于所有的
即所有的都是稳定状态;当
是演化稳定策略;当
是演化稳定策略。
令,得到可能的稳定状态:
当
时,对所有的
也就是说所有的都是稳定状态;当
故是演化稳定策略;当
,则
是演化稳定策略。对于学校管理者和教师的群体演化用
两个参数方程式来描述。
这个情况下,该系统的复制动态方程可以求出5个均衡点,分别为
但是动态过程中的趋向性取决于博弈双方采取策略比例的初始状态和动态微分方程在相应区间的正负情况。我们可以根据Hartman-Grobman定理,在非线性系统中,均衡点的稳定性可以由雅可比矩阵的局部稳定性得知,所以列出该系统雅可比矩阵为:
则Jacobi矩阵的行列式为:
Jacobi矩阵的迹为:
则为不稳定点。
表2 情况1的局部稳定性分析结果
图a
由表2可知,该系统的五个均衡点中
为不稳定点
,
,为稳定点,为
鞍点。可以看出
为学校管理者和教师进行博弈的演化稳定策略,图a描述了学校管理者和教师完成工作时采用策略比例的动态演化过程。当初始位置位于区和区时,系统收敛于点(0,1),对应学校管理者宽松管理,教师积极配合。当初始位置位于区和区时,系统收敛于(1,0)点,对应学校管理者严格管理,教师消极怠工。
2)情况2
同理可得表3和图b:
表3 情况2的局部稳定性分析结果
图b
由表3可知,该系统的五个均衡点中
为不稳定点,
为稳定点,
为鞍点。可以看出
为学校管理者和教师进行博弈的演化稳定策略,图b描述了学校管理者和教师完成工作时采用策略比例的动态演化过程。当初始位置位于整个区域内时,系统收敛于点(1,0),对应于学校管理者严格管理,教师消极怠工。
3)情况3
同理可得表4和图c:
表4 情况3的局部稳定性分析结果
图c
由表4可知,该系统的五个均衡点中
为不稳定点,
为稳定点,
为鞍点。可以看出
为学校管理者和教师进行博弈的演化稳定策略,图c描述了学校管理者和教师完成工作时采用策略比例的动态演化过程。当初始位置位于整个区域内时,系统收敛于点(0,1),对应于学校管理者宽松管理,教师积极配合。
4)情况4
同理可得表5和图d:
表5 情况4的局部稳定性分析结果
图d
由表5可知,该系统的五个均衡点中
为不稳定点,
为稳定点,
为鞍点。可以看出
为学校管理者和教师进行博弈的演化稳定策略,图d描述了学校管理者和教师完成工作时采用策略比例的动态演化过程。当初始位置位于整个区域内时,系统收敛于点(1,1),对应于学校管理者严格管理,教师积极配合。
3.小结
所以综上所述我们不难发现,四种情况所对应的的稳定状态有所不同,除了情况四的稳定状态能够使学校管理者与教师的收益同时达到最大以外,其他几种情况稳定时,只能单方面使博弈一方收益最大,而另一方收益有所损失,身为教师,为人师表,积极配合工作是首要条件,学校管理者严格管理也是基本职责。最后总结出学校管理者严格管理,教师积极配合是我们所追求的局面,为了达到这种局面,我们就要通过调整学校管理者的成本系数、
和教师的成本系数
使得,
。
参考文献
[1]谢识予.经济博弈论[M].上海:复旦大学出版社,2007.
[2]冯祥锦.“激励悖论”与高校学风、教风建设的博弈分析[J].福建论坛:社会科学版,2011.
[3]方勇,颜佳佳. “双一流”建设导向的人才流动博弈分析[J]. 科技管理研究 ,2018.
[4]杨进,张健.职业教育校企双主体合作的问题、博弈与整合对策[J].中国高教研究. 2017.
[5]Toshinori Nemoto. Experiment on co-operative parcel pick-up system using the Internet in the central business district in Tokyo[J].City Logistics,2003.
[6]基于博弈论的托管医院理事会治理机制探讨[J].张彬,2012中南大学医院管理研究所成立大会暨首届医院管理“湘雅论坛”.
[7]有限理性条件下的进化博弈理论[J].《上海财经大学学报》.被北京大学《中文核心期刊要目总览》收录PKU.被南京大学《核心期刊目录》收录CSSCI.2001年5期.谢识予.
[8]博弈论框架下认知小蜂窝网络的动态资源分配算法[J].《电子学报》.被中信所《中国科技期刊引证报告》收录ISTIC.被EI收录EI.被北京大学《中文核心期刊要目总览》收录PKU.2015年10期.贾亚男.岳殿武.