看看用机器学习来审phd申请材料会怎么样

这是IAAI( Innovation Application of Artificial Intelligence) 2013的一篇文章。讲到UT Austin的CS系发明了一个新系统,用机器学习的方法来审查PhD的申请材料。方法和结论都挺有意思的。

这个系统流程是这样的:首先把收到的申请材料做feature encoding,然后用一个简单的Sparse Logistic Regression来打分,然后按分数高低顺序给commitee的分发材料。然后commitee的人也会给申请材料打分,然后综合得到录取决定。在2012年的录取工作中,他们只是使用这套系统来预测实际录取的结果,并未参与实际录取,但是与实际结果相比得到了84%的正确率。

同时,在测试这个系统的过程中,他们还得到了一些有趣的发现,主要是关于什么因素会对CS系的PhD录取有较大的影响:

  1. 本科GPA,当然是越高越好。有趣的是,在这个模型中,研究生阶段的GPA没有任何影响。

  2. 以前上过的学校,“精英”大学的高GPA学生有极高的可能被录取。

  3. GRE quant分数,这个对天朝同学应该没什么指导意义……

  4. GRE Verbal分数……

  5. 研究领域。模型中发现申请Machine Learning/人工智能/机器人学的学生录取概率低。现在大牛都往AI坑里跳,学渣们声泪俱下。

  6. 推荐信。文中列出了几个有积极意义的关键词”best”,”award”,”research”,”PhD”等。一些会影响录取的关键词有”good”,”class”,”programming”,’technology”等。此外,statement of purpose似乎没有什么影响。

虽然模型预测的结果不一定有道理,我觉得这些对申请来讲还是会有一些指导作用的。

最后附上文章链接

GRADE: Machine Learning Support for Graduate Admissions (IAAI2013)