在本次的博士讲座中,我们与Randy博士进行了深入的对话,了解了统计学领域多样化的研究方向和申请要求。让我们一起回顾这期精彩的讲座,了解更多博士申请相关内容。
S:您现在的工作,用到了博士学习中的哪些知识?
Randy:
如果从统计方面的知识来说,因为我们需要模型很可靠,所以我们不会用很多非常新的东西。
但是我们在做模型的过程中会用到很多在博士阶段用到的 research 的方法。比如说做一些假设检验,比如说做一些 confidence interval,那这些 confidence interval 并不是像我们平时读书的时候做实验那样那么简单,它可能会有各种 edge case,怎么样去挑一个最 reliable 的方法去得到一个最 reliable 的结果是需要用到很多博士时期积累的经验的。所以这方面,具体的方法并没有那么重要,但是这个用这个方法的过程和你的经验,尤其是博士阶段积累的这种对于怎么运用工具的经验是非常重要的。
S:您在博士阶段主要做了一些什么样的研究和学习?
Randy:
统计现在分两块,一块是贝叶斯,一块是传统的统计。我们会假设这串数据服从一个 certain distribution,我们最后的目标是找出那个 underlying distribution。但是在贝叶斯统计里边,我们是先假设这个数据符合某一个特定的distribution,然后我们根据数据去找一些这些 distribution 的一个underlying property。所以有了我们的数据,我们就可以 define 我们的 normal distribution,这样的话我们就可以用很少很少的数据,只要我们的 assumption 是对的,就可以得到很好的模型。
所以这两条线相当于parallel,就是传统的统计学方法和贝叶斯统计学方法,它们两个,如果这个数据是perfect,然后我们有一个 perfect assumption 这两个东西出来结果应该是一样的。所以在我们现在的很多研究里边,如果我们数据不足的情况下,很多时候我们都会考虑用贝叶斯来做,尤其是在很多生物统计里边,很多药的里边,因为它可能一下就能只找到 100 个人做实验,那用贝叶斯的话就会节省很多时间,节省很多精力去得到很 reliable 的结果。
S:统计学还有哪些研究方向呢?
Randy:
刚刚提到的贝叶斯和传统统计学是两个很大很大的分支,然后在这两个分支下面就会有很多小的方向。比如说有的人还会做readability,就比如说一个零配件它到多什么时候会坏掉,什么时候不会坏掉,相当于就是个 banner distribution。然后有的人会做Hypothesis testing,就是我们假设这个人他有没有得癌症?那我们假设有,那我们怎么去证明这个 hypothesis 是对的。有的人呢做得就比较理论,那可能就很偏数学那边一些,但有的人主要是做 confidence interval 这块,所以这些就下面分得很细很细了。
但是主要的方法的区分还是用贝叶斯或者用传统的方法来做,这两个都可以做,有的人他们会两个都做,然后对比结果。
S:统计学博士毕业,有哪些就业方向?
Randy:
我的同学基本上没有人做教职,因为在业界的机会很多,从钱这方面来说也会好非常非常多,然后压力也会小很多,所以我的同学没有几乎没有做教职的。然后做业界的话就基本上要不就生物药学这块,这块的好处是工作比较reliable,不会那么忙,那坏处就是报酬会稍微低一些。然后另外一部分就是做 machine learning engineer 会多一些,就是一些大厂,然后 build model。现在做 AI 的也比较多,因为统计学也是AI模型的基础。另外的就是我们做金融行业的,做金融行业因为对这个 bar 比较高,基本上几乎都要PhD。
S:如果是硕士的背景去应聘您目前的岗位,是有机会的吗?
Randy:
至少我们公司来说的话, MS的机会比较少,除非有比较长的经验,比如说 5 年到最少 3 年的。至少 3 年经验的话,那机会高一些。但如果 master 想要进入这个行业的话,那可能会去一些传统银行的一些稍微偏 modeling 的部门,这样会好一些。一开始前两年可能会需要熬一下那个年限,因为传统行业它会需要年限,然后才能拿promotion,但拿到 promotion 之后你再跳一些量化的一些金融方面的行业就会快很多。
S:申请统计学的博士,您建议同学在本科学习哪些课程?
Randy:
数学的课程当然是很重要,如果你申请统计方向,高阶数学课程会非常加分。数学分析,在美国叫 Calculus 123,这肯定是要得上完的。然后这个分数很重要。另外很重要就是 Linear Algebra 线性代数,而且不能是工科的线性代数,你得把数学那啃下来,大概有两册,这两个的成绩很重要。然后还有一些数学课比较重要的,比如说。Mathematical computation,在中国叫科学计算。
另外就是一些泛函分析、 functional analysis,这些东西就是很偏数学的课是非常重要的,尤其在你申请统计的情况下。很多学校他会看你的成绩单,如果你没有这几门课,基本上就没有戏,因为但凡要做稍微偏理论一点的话,这东西都很重要。计算机的知识就是说你上没上过课,可能它不大care,但是你一定要有,它会默认你有,因为如果你没有,到时候做 research 的话,你会痛苦很长的时间。
S:统计学博士的面试大概是什么样的?
Randy:
这个每个学校也不大一样,有的学校会问得非常technical,意思就是说他会问很多很基础但是非常细的细节。就基础到可能说直接问你 AUC 怎么定义的,就这种很细的、很基础的细节,就是统计里边你只要学过,你一定得会,你一定得懂。它一定不会问你很多很 fancy 的东西。如果你做过research,大概率他一定会问到 research 的细节。问到一些他们觉得有疑问的,或者是很多很关键的点,来看看你这个到底是不是你自己做的,然后你用什么方法解决的。比如说你要做一个生物学实验,那你这个仪器的误差问题怎么解决,就这个很细的、很基础的问题。
然后另外一种就是很 chill 的,他觉得你已经很 OK 了,但他只想确认一下你这个人是不是正常人,那就是说很chill。很可能会有个中国老师来问你,OK,你的学校是哪?你是跟着哪个老师做的?然后 check 一下你写东西符不符合事实,然后看你这个人是不是正常人,就分这两种。
S:目前政策的波动是否有影响您这个行业的就业和招聘?
Randy:
如果是国际生身份的问题的话,主要是现在的很多大公司,比如说我了解下来Google和 Meta 的 Perm 是停掉了,或者搞下来会变得非常麻烦,那这个是一个影响还挺大的事情。那另外工作机会的话肯定是比前两年少很多。就是应届生现在会招得很少,因为现在公司是需要来了就干活。或者说直接就是intern毕业,然后直接就进公司。如果你要想要直接毕业,然后通过面试去公司,对硕士的应届毕业生来说,比之前会难很多,因为整个这个岗位的数量比原来少非常多。
S:怎么样判断自己是否适合读PhD?
Randy:
我觉得第一点还是,你得知道自己想要什么,你想要去业界,然后想去业界做什么专业?做什么方向呢?你想去做药厂,还想做金融,这个你得自己想好,而且也要在读书之前想好。因为你一进去,几乎第一个学期就要开始准备博资考试,然后第二学期就开始准备第二年的 Intern 了,因为没有 Intern 基本上找不到工作,所以这块一定要想好。
想好之后,你才可以去给老师说我是想做这个的,如果你和我的想法不一样,那咱们可以换老师,不用浪费彼此的时间,这样的话会让这个过程变得更 smooth 一些。
然后另外一点,读博这个过程一定是会很让你难受的,一定不是一个很开心的过程,所以 mentally一定要做好这样的一个心理准备,一定要做好身体上会很累的这样一个身体上的准备,这样的话你就不会 burn out,不然这个整个过程的压力会让人很难以接受。尤其是你在很迷茫的情况下,你会很难知道自己下一步该怎么做。