大师兄为什么还没找到心仪的博导? ——博士申请市场中的双边筛选与养鱼行为研

不知情的导师1,Δ^{1,\Delta},快毕业的大师兄1,,Δ^{1,*,\Delta},提供建议的小师弟1^{1},摸鱼的小师妹1^{1},大师兄非要加上的女朋友2^{2},不认识但是出版面费的老师3^{3}

1^{1} 强大导师和一堆混子学生的师门,银河系,地球,201701
2^{2} 不知道大师兄从哪拐来的人,银河系,地球,201200
3^{3} 没参与工作但是很有钱的组,M78星云,未知,000000
^{*} nihao20000512@sina.com(通讯邮箱)
Δ^{\Delta} 同等贡献

阅读 PDF 全文

摘要

博士申请过程是一种典型的信息不完全双边匹配问题,但现有研究较少从微观互动视角系统刻画其动态机制。本文构建一个可复现的模拟框架,对博士申请过程中学生与导师之间的策略互动进行建模与分析。

在模拟环境中,学生与导师分别根据多维特征形成决策函数,并在离散时间阶段中通过申请、筛选与再选择形成动态匹配关系。模型引入学生投递成本、导师候选池暂存机制以及假招生行为等现实情境,从而刻画申请过程中频繁出现的“养鱼”现象。模拟结果表明,随着申请时间推进,临时匹配关系逐渐增加,但学生更换导师与导师替换候选人的行为在中后期显著增加,反映出匹配市场中持续的策略调整过程。同时,部分未明确招生名额的导师维持候选学生池,会显著增加学生的投递成本并延长匹配周期。最终结果显示,在信息不透明与双边筛选并存的条件下,稳定匹配比例仍然相对有限,表明当前博士申请机制在信息组织与匹配效率方面存在改进空间。

基于模拟结果,本文提出探索建立统一信息发布平台,使导师能够公开招生计划与基本筛选标准,从而降低学生的信息搜寻成本并提高整体匹配效率。

关键词:大师兄找博导;双非背景博士申请;计量经济;复杂网络;信息不完全;双边匹配


1 引言

在人际互动与社会决策情境中,个体往往需要在信息不完全与偏好表达模糊的条件下进行多轮互动与选择。既有研究表明,现实中的互动决策通常并非一次性完成,而是通过持续试探与反馈逐渐形成稳定结果。例如,有研究指出,在信息有限的情境中,参与者往往通过反复沟通逐步识别对方真实意图,从而形成循环式的信息交换结构(原神导师, 2037)。进一步研究发现,在存在多种潜在选择时,参与者往往会保持一定程度的策略性模糊,以保留未来调整空间,这种行为会显著延长互动过程并提高决策成本(原神导师 & 大师兄, 2030)。

在这一研究脉络中,部分学者开始关注序列互动与信息反馈对决策过程的影响。研究表明,在多轮互动过程中,参与者会根据新的信息不断调整策略,使得决策过程呈现明显的动态演化特征(大师兄 & 小师妹, 2033)。与此同时,当参与者只能获得有限反馈信息时,往往需要通过间接信号推断对方偏好,从而导致重复沟通与额外试探成本的产生(小师弟, 2031)。此外,当双方均希望保留选择空间时,互动过程往往演化为多轮试探与持续调整的结构,并形成较长的协商周期(小师妹 & 大师兄, 2029)。

尽管上述研究揭示了模糊表达、信息不完全与互动反馈对决策过程的重要影响,但对于某些现实中具有高度代表性的双边匹配情境,相关研究仍然相对有限。其中,博士申请过程便是一种典型的动态匹配问题:学生需要在有限时间内寻找导师,而导师则在多名候选学生之间进行筛选与比较。在信息不透明与名额不确定的条件下,双方往往通过多轮试探与策略调整逐渐形成匹配关系,但这一过程的结构特征与成本机制仍缺乏系统刻画。

基于此,本文构建一个可复现的模拟框架,对博士申请过程中学生与导师之间的动态匹配行为进行系统分析。通过生成学生能力分布、导师特征结构以及互动规则,本文刻画申请过程中学生更换导师、导师替换候选人以及信息暂存等行为模式,并进一步分析这些行为对匹配效率与申请成本的影响,从而以一种略带现实讽刺意味但方法上相对严谨的方式,对博士申请这一广泛存在却缺乏系统研究的社会现象进行结构化刻画。


2 研究方法

2.1 数据生成

由于现实博士申请过程中缺乏系统化的微观行为数据,本文采用可复现的模拟数据生成方法构建实验环境。模拟系统包含两类主体:学生(students)与导师(advisors)。在基准实验中,学生数量设定为 Ns=1300N_s = 1300,导师数量设定为 Na=153N_a = 153。所有随机变量均在固定随机种子条件下生成,以确保实验结果具有完全可复现性。

学生个体特征由多维能力指标构成,包括科研能力、代码能力、写作能力、AI辅助写作能力以及论文经验等变量。这些变量均通过截断正态分布生成,并限制在合理区间内以避免极端值。此外,学生还具有幽默度、风险厌恶程度以及初始绝望值等行为参数,用于刻画个体在申请过程中的策略差异。学生的教育背景被划分为三类:985、211与双非,并根据背景类别赋予不同的背景得分,以模拟现实申请环境中教育背景所带来的信号差异。

在此基础上,本文构建学生简历信号(CV signal)作为导师评估学生的重要指标。该信号由学生多维能力指标的加权组合构成,并叠加随机扰动项,其生成方式如下:

CVi= 0.35Bi+0.20Ri+0.15Ci+ 0.15Wi+0.15Pi+ϵi\begin{aligned} CV_i = &\ 0.35B_i + 0.20R_i + 0.15C_i + \\ &\ 0.15W_i + 0.15P_i + \epsilon_i \end{aligned}

其中 CViCV_i 表示学生 ii 的简历信号强度,BiB_i 为背景得分,RiR_i 为科研能力,CiC_i 为代码能力,WiW_i 为写作能力,PiP_i 为论文经验,ϵi\epsilon_i 为随机扰动项。该信号用于模拟导师在实际申请过程中通过简历信息对学生能力进行初步判断的情形。

导师群体同样具有多维特征结构,包括学术声望、友善度、科研经费水平、学术头衔以及潜在压榨风险等变量。这些变量通过截断正态分布生成,以反映导师群体在学术生态中的异质性。此外,每位导师还被赋予一个养鱼倾向参数,用于描述其维持候选学生池的潜在行为倾向。导师在每一年度可能处于两种状态:真实招生或非真实招生。真实招生导师拥有一定数量的招生名额,而非真实招生导师仅具有有限的暂存容量,用于模拟现实中导师尚未明确招生计划但仍保持潜在沟通关系的情形。

2.2 交互过程

在数据生成完成后,本文构建一个离散时间动态匹配模型以模拟博士申请过程。整个模拟周期被划分为 T=12T = 12 个时间阶段,对应距离毕业的剩余月份。在每一时间阶段中,学生与导师通过申请—筛选—再选择的方式进行互动。

首先,学生根据自身特征与导师信息计算对每位导师的效用值,并选择效用最高的若干导师进行申请。学生对导师 jj 的效用函数定义如下:

Uij= α1Pj+α2Tj+α3Fj+α4Kj+α5Siα6Rjα7Ci+α8Di+ϵij\begin{aligned} U_{ij} = &\ \alpha_1P_j + \alpha_2T_j + \alpha_3F_j + \alpha_4K_j + \alpha_5S_i \\ &- \alpha_6R_j - \alpha_7C_i + \alpha_8D_i + \epsilon_{ij} \end{aligned}

其中 PjP_j 表示导师学术声望,TjT_j 表示导师学术头衔得分,FjF_j 为科研经费水平,KjK_j 为导师友善度,RjR_j 表示潜在压榨风险,CiC_i 为学生累计投递成本,DiD_i 为学生绝望程度,ϵij\epsilon_{ij} 为随机扰动项。变量 SiS_i 表示学生综合能力指数,其计算方式为:

Si=0.35Ri+0.25Ci+0.25Wi+0.15PiS_i = 0.35R_i + 0.25C_i + 0.25W_i + 0.15P_i

其中 RiR_iCiC_iWiW_iPiP_i 分别表示学生科研能力、代码能力、写作能力与论文经验。该指数作为学生整体学术能力的代理变量进入双方决策函数。

在学生提交申请后,导师对收到的候选学生进行评价与排序。导师对学生 ii 的评价函数定义为:

Vij= β1Ri+β2Ci+β3Wi+β4CVi+β5Pi+β6Bi+β7Aj+ηij\begin{aligned} V_{ij} = &\ \beta_1R_i + \beta_2C_i + \beta_3W_i + \beta_4CV_i + \beta_5P_i \\ &+ \beta_6B_i + \beta_7A_j + \eta_{ij} \end{aligned}

其中 CViCV_i 为学生简历信号,BiB_i 为背景得分,AjA_j 表示导师焦虑程度,ηij\eta_{ij} 为随机扰动项。导师根据该评价函数对候选学生进行排序,并保留一定数量的学生进入临时候选池。对于真实招生导师,候选池规模由实际招生名额与固定的额外暂存容量共同决定;对于非真实招生导师,候选池容量则由预设的暂存容量决定,从而模拟现实中部分导师在尚未确定招生名额时仍维持候选学生池的行为。

由于学生与导师在互动过程中均可能获得新的信息,模型允许双方在每一阶段重新调整选择,学生在获得多个导师回应时会重新评估效用并选择新的导师对象,而导师在接收到更优候选学生时也可能替换原有候选人。上述机制使得匹配关系在不同阶段不断调整,从而形成动态筛选过程。

在模拟周期结束时,真实招生导师根据其名额数量从当前候选学生池中确认最终录取学生,从而形成稳定匹配关系。通过记录每一阶段的临时匹配规模、学生更换导师数量、导师放弃学生数量以及假招生暂存人数等指标,模型能够系统刻画博士申请过程中在信息不完全与双边选择机制下形成的动态匹配结构。


3 结果与讨论

由图1可以看到,随着毕业时间逐渐临近,临时匹配规模总体呈现持续上升态势:在距离毕业12个月时,仅有约170名学生进入临时匹配状态,而在毕业前1个月,该数量已接近300人。该趋势表明在博士申请市场中,匹配关系并非一次性形成,而是随着信息逐步积累与多轮互动不断扩展。学生通过持续投递逐渐识别潜在导师,导师则在不断比较与筛选中调整其候选池,从而推动临时匹配数量逐步增加。与此同时,曲线在中期阶段出现的小幅波动也反映出部分匹配关系被替换或终止,体现出导师在候选学生之间进行动态比较与“养鱼式”筛选的行为特征。整体而言匹配关系虽然随时间不断增加,但大量学生仍长期停留在临时匹配阶段,这揭示了博士申请市场在信息不完全与双边选择机制下所呈现出的持续不确定性,也正是本文试图刻画的核心困境。

图1 模拟过程中临时匹配随月份变化

图2中学生综合能力整体呈现近似正态分布,大多数学生集中在60-70分区间,少量学生分布于40分以下或80分以上的两端区间,说明样本群体整体能力处于中等水平且存在一定差异,反映现实博士申请市场中的典型特征,即多数申请者处于能力相近的“竞争密集区间”,真正具备显著优势的高能力学生占比有限,从而使得大量学生在申请过程中难以通过能力优势迅速脱颖而出。导师群体的生态结构可以观察到,导师在两个维度上的分布较为分散,并不存在明显的线性关系,即高声望导师并不必然具有更高的友善度,部分低声望导师反而表现出较高的合作倾向,意味着学生在择师过程中不仅面临能力竞争,还需要在声望与可接近性之间进行权衡,从而增加了匹配决策的不确定性。在学生能力高度集中而导师生态多维异质的情形下,申请过程往往演化为一个信息不断试探与反复调整的过程,这也进一步加剧了博士申请市场中广泛存在的选择困境。


图2 学生与导师的基本分布情况

从图3可以看到,两条曲线均在毕业前数月达到相对高位,表明随着时间推进,匹配关系呈现出明显的动态调整特征。在早期阶段(距离毕业约12-10个月),学生换导师与导师放弃学生的数量均较少,此时双方主要处于初步接触和信息收集阶段,匹配关系相对稳定。进入中期阶段后,学生更换导师的数量逐渐增加,说明部分学生在获得新的导师信息或比较不同机会后开始调整投递策略;与此同时,导师放弃学生的行为也明显增多,表明导师在不断接收新的候选人信息后,会对已有候选池进行筛选与替换。到毕业前4-3个月附近,两类行为均达到阶段性高点,显示出市场竞争进入最为活跃的调整期。学生端的“换导师”与导师端的“放弃学生”构成了一种相互作用的动态筛选机制,其本质类似于双边市场中的持续优化与再匹配过程。在现实博士申请情境中,这种现象往往表现为导师持续保留多名潜在学生以保持选择空间,而学生也不断尝试更优的导师机会,最终形成一种被广泛调侃为“互相养鱼”的申请生态。

图3 养鱼带来的导师学生模拟情况

从图4进一步刻画了信息不完全条件下学生投递行为所产生的成本结构,包括当年并未获得实际招生名额但仍维持沟通或表达意向的导师所导致的暂存学生数量变化。从时间趋势来看,在申请早期阶段该现象较为有限,但随着毕业时间逐渐临近,暂存学生数量明显上升,表明部分导师在尚未明确招生计划或真实名额的情况下仍维持潜在候选人池,从而使学生在较长时间内处于不确定状态。与此同时,学生累计投递成本呈现出较为集中的分布结构,大多数学生的投递成本集中在约66-69的区间,说明在反复尝试和信息试探过程中,学生往往需要持续进行多轮联系与申请,从而累积一定程度的时间与精力投入。将两图结合可以看到,信息不透明与导师策略性暂存行为共同构成了学生申请成本的重要来源。


4 结论与政策建议

本研究基于多智能体模拟框架,对博士申请过程中的动态匹配行为进行了系统分析。模拟结果表明,当前博士申请市场存在显著的信息不对称与双边策略性行为,这导致匹配过程漫长、成本高昂且最终稳定匹配比例有限。学生在申请过程中面临较高的信息搜寻成本,而部分导师通过维持候选学生池进行策略性筛选,进一步延长了匹配周期并增加了学生的不确定性。

针对上述问题,本文提出以下政策建议:

  1. 建立统一信息发布平台:允许各高校博士生导师自主发布基础信息,包括研究方向、联系方式、是否计划招收博士生以及对申请者背景或能力的基本期望等内容,从而使学生能够在统一界面下获取较为完整的导师信息。
  2. 设置投稿或信息提交机制:由平台运营者进行基础审核后再进行公开发布,以保证信息的真实性与基本规范。
  3. 形成持续更新的信息库:全国不同高校的博士生导师均可以通过自主填写或投稿的方式逐步补充平台内容,从而形成一个持续更新的信息库。

通过这种方式,可以在一定程度上降低申请阶段的信息搜寻成本,提高导师与学生之间的信息对接效率,并为博士申请市场提供一个更加透明和结构化的信息环境。


数据可获得性(Data Availability)

本文使用的数据由模拟程序生成,所有实验代码与生成数据均可根据论文描述复现,论文代码放在附件了,特地声明作者在写作过程中使用了AI工具。


致谢

作者并不感谢至今为止仍然没有哪个博导给我发出确定的offer,给与了我极大的压力并苦中作乐写出了这篇文章,但是我依旧表示希望命中注定的好博导尽快联系,再不联系我就准备跟着实习的那位一起打工去了。


参考文献

[1] 原神导师. (2037). 博士申请过程中的日常决策循环观察报告. 原神导师的师兄的期刊但是专门拒绝导师, 1(1).

[2] 原神导师, & 大师兄. (2030). 博士申请沟通中的策略性模糊表达机制研究. 导师有门路的期刊写啥都能发, 2(3).

[3] 大师兄, & 小师妹. (2033). 情绪反馈条件下的博士申请序列协商行为分析. 大师兄投不中的期刊, 4(2).

[4] 小师弟. (2031). 信息不完全条件下的导师选择信号识别问题. 小师弟的期刊, 3(1).

[5] 小师妹, & 大师兄. (2029). 博士申请互动协商中的模糊表达与策略调整. 大师兄想要发的期刊, 5(1).

[6] 实习的师姐. (2034). 不完全反馈条件下的博士申请偏好推断机制. 实习的师姐从未发表的期刊, 6(2).

[7] 活在steam上的师姐. (2042). 人际决策动态年度报告:博士申请互动系统分析. 活在steam上的师姐游戏评论, 被和谐的部分.


附录1:大师兄还在找导师

附图1展示了模拟过程中“大师兄”在整个申请周期中的累计投递成本变化情况,可以看到,随着距离毕业时间逐渐缩短,大师兄的投递成本呈现出持续上升的趋势。从最初阶段仅需承担少量信息搜寻与联系成本,到后期需要不断扩展申请范围、重复沟通并维持多个潜在联系对象,其累计投递成本稳步增加,并在模拟结束时达到较高水平。然而,即便在持续投入时间与精力的情况下,大师兄在最终匹配阶段仍未获得稳定导师位置,这在一定程度上反映了当前博士申请市场中信息分散与双边筛选并存所带来的不确定性。

附图1 大师兄投递成本的分析

结合现实设定,大师兄具备较强的科研能力、代码能力与写作能力,同时能够借助AI工具辅助学术写作,并发表了一个导师一作学生二作的SCI论文(计量经济方向),也有一个跟外校老师合作的五作论文(复杂网络-交通网络方向),因此在潜在学生群体中并非缺乏竞争力。遗憾的是,在复杂的申请环境与反复调整的匹配过程中,他仍未能找到合适的导师。基于此,本文也在此郑重呼吁:如果有正在阅读本文且仍在招收博士生的导师,欢迎尽快联系这位能力全面、认真负责且投递成本已经相当可观的大师兄,以避免其累计成本继续上升,并为本研究提供一次真实世界中的成功匹配样本。


附录2:关于申博平台的构思

博士申请过程中大量成本实际上源于信息获取渠道的分散与不透明,学生往往需要逐一检索各高校导师网页、查找零散资料并通过邮件进行试探性联系,而导师方面也缺乏统一渠道发布当年的招生计划与基本要求,从而导致双方在匹配初期投入大量重复性的时间成本。

为缓解这一问题,本文提出构建一个面向博士申请的信息发布平台的初步构想:该平台允许各高校博士生导师自主发布基础信息,包括研究方向、联系方式、是否计划招收博士生以及对申请者背景或能力的基本期望等内容,从而使学生能够在统一界面下获取较为完整的导师信息。

同时,平台也可以设置投稿或信息提交机制,由平台运营者进行基础审核后再进行公开发布,以保证信息的真实性与基本规范。在此框架下,全国不同高校的博士生导师均可以通过自主填写或投稿的方式逐步补充平台内容,从而形成一个持续更新的信息库。通过这种方式,可以在一定程度上降低申请阶段的信息搜寻成本,提高导师与学生之间的信息对接效率,并为博士申请市场提供一个更加透明和结构化的信息环境。

当然,本文作者大师兄表示,如果联系不上博导或者没有合适的学校要他,他就会立即雪藏这个计划,进而达到“我没有你们也别想有”的恶毒后果,为了让人类文明不至于因为他的恶毒计划而停滞,请有兴趣的博导尽快通过招收他来拯救世界。


附录3:本文可复现的模拟代码

(代码详见原文附件)