作为世界顶尖的科技公司之一,谷歌拥有多款超过10亿活跃用户的产品。拿搜索举例,根据2019的数据统计,谷歌平均每秒处理超过40,000个搜索查询,相当于每天35亿次的搜索量。应对如此巨大的数据量,谷歌也专门设有数据科学团队,从中挖掘宝贵的信息,为公司提供战略支持

那么,数据科学家在谷歌到底是一个怎样的角色?想要面试谷歌数据科学岗位,要如何做准备?

在Google,数据科学家是什么角色?

在谷歌,和数据相关的岗位有很多,包括数据科学家、机器学习工程师、产品分析师等等。

其中,数据科学家的工作主要以定量分析为主,利用分析、机器学习理论以及统计学概念和方法来确定产品开发方向、改善用户体验

在不同的团队,数据科学家的工作侧重点也有所不同。比如在Search Ads,数据科学家主要负责设计和分析测试实验,以了解系统更改的影响并提供建议。同时与分析师和软件工程师合作研究核心算法,以改善客户体验。

Google数据科学岗位面试流程

谷歌的面试非常标准化,主要由Recruiter电话面试、技术面试和Onsite三部分组成。由于疫情的影响,目前onsite已经改成了虚拟面试(VO)

Recruiter电面(30min左右)

在这轮面试中,recruiter会和你阐述关于该职位的细节。同时,他/她也会进一步了解你的兴趣和目标,与公司文化、价值观的契合程度,以便将你安置在不同团队。

技术面试(45min左右)

技术面试将通过Google Hangouts进行,该轮面试由数据科学家或招聘主管作为面试官主导进行。面试内容包括实验设计,统计、coding等各方面的技术问题。同时,面试官也会针对你过去的研究经验或工作经验进行技术讨论。

问题举例

  • A statistics question (computational stats) or causal inference question
  • Coding question on a shared code editor
  • Describe a past data science based project.
  • What problems did you encounter? What approach would you have used if the data was different?

Virtual Onsite(原onsite)

和传统的onsite一样,谷歌的VO也是分5轮进行,不过VO不再有传统onsite中包含的lunch break环节。

在每轮面试中,你将分别和一位面试官进行1v1的交流,长度也在45min左右。其中既包括技术面试,也涉及BQ方面的问题

  1. 技术面试:

技术面试将由不同的面试官从机器学习、统计概率、产品、编程等不同的维度对求职者进行提问。

问题举例

Machine Learning:

  • What is the difference between K-mean and EM?
  • Why use feature selection? If two predictors are highly correlated, what is the effect on the coefficients in the logistic regression? What are the confidence intervals of the coefficients?

Statistics & Probality:

  • For a sample size of N, the margin of error is 3. How many more samples do we need for the margin of error to hit 0.3?
  • What is the assumption of error in linear regression?
  • How can you tell if a given coin is biased?

Product & Business:

  • How would you detect inappropriate content on Youtube?
  • How do you test if a new feature has increased engagement in Google's ecosystem?
  • If the outcome of an experiment results in one group clicking 5% more than the other, is that a good result?

Programming:

  • Write a function to generate N samples from a normal distribution and plot the histogram.
  1. BQ面试:

BQ问题有可能平均分散在各轮面试中,也有拎出来作为单独的一轮。在准备BQ时,建议大家重点关注谷歌的四个Behavior要点:General cognitive ability, Leadership, Googleyness, Role-related knowledge,面试的时候尽量将自己的符合公司文化的那一面展现出来。

Google数据科学岗位面试Tips

  1. 谷歌DS的很多面试题都是基于自家产品的真实情境。面试前,求职者可以对谷歌的一系列产品做好research,提前设想一下可以如何改进产品或测试产品。

  2. 我们前面提到过,谷歌的数据科学家岗位侧重量化分析,因此在面试考察时也很重视统计&概率方面的问题,大家在面试前要做好充足的准备。

  3. 是的,数据岗位也是要考coding的

  4. 近年来谷歌对于BQ越来越重视,这也是在你技术关达标后,最终是否能拿到offer的关键因素,重要性不容小觑。

来Offer【人工智能与数据科学强化课程】12月2日,免费试听 点击了解课程学详情:https://www.laioffer.com/zh/course/ai-and-data-engineering/