本文作者:杰里米·斯坦利首席数据科学家兼执行副总裁Sailthru在那里,他负责为公司的营销个性化平台构建智能。他的数据科学团队致力于预测、推荐和优化算法。
数据科学家接受过处理不确定性的训练。我们使用的数据,无论它有多“大”,仍然是一个充满潜在偏差的有限样本。我们的模型在太简单而没有意义和太复杂而不可信之间徘徊。有了控制数据噪声的方法,我们可以模拟、测试和验证我们所能做的一切。一个伟大的数据科学家会对他们的数据、方法和结论产生一种健康的怀疑态度。
然后,有一天,一名数据科学家升职了,并面临着一个全新的挑战:评估一名候选人,使其成为他们团队的一员。样本量下降很快,实验似乎不切实际,采访中的偏差比我们在工作中仔细控制的偏差要明显几个数量级。
许多数据科学领导者采用传统的招聘方法——但他们不应该这样做。
在开始组建我的最新团队时,我与许多数据科学领导者进行了交谈,以收集他们的想法和最佳实践。我尤其受到莱利纽曼,数据科学主管Airbnb,他设计和实现这是一种完全不同的招募数据科学人才的方式,我在设计这个系统时与他交谈过几次,我将在这里与你们分享。我也学到了很多德鲁•康威在项目佛罗里达他一直在改进自己的招聘流程,以挑选能够完全符合自己要求的人才著名的数据科学维恩图:

在本文中,我将概述Riley开发的新流程的目标,我将根据这项研究进行调整,描述它的基本原则,并详细介绍我们在Sailthru进行的实验实现。当然,如果不考虑进一步调整和改进流程的机会,本指南就不完整。
如何开启一场招聘革命
在发展我们的招聘过程中,我们开始改善以下可衡量的目标:
精度:最大化新员工成为优秀员工的机会。
损失:尽量减少优秀求职者提前离开招聘渠道的可能性。
成功:最大化offer被接受的几率。
努力:尽量减少对招聘团队的长期干扰。
乍一看,任何有经验的经理都会认为不可能同时实现以上四个目标。前三点在实践中往往相互矛盾(例如,候选人越优秀,让他们接受offer就越难)。除此之外,改进它们似乎要求团队付出更大的持续努力。
在传统的招聘流程中,如果招聘准确率高达50%,大多数经理都会觉得很幸运。也就是说,只有不到一半的员工是优秀的。损失是很难衡量的(毕竟,在这个过程中出局的候选人不会为你工作),大多数经理都担心他们经常会失去优秀的人才,因为他们的过程太长太麻烦了。
在数据科学这样竞争激烈的领域,优秀的候选人通常会得到3个或更多的offer,所以成功率通常低于50%。
招聘所需的持续努力很容易消耗数据科学团队20%或更多的时间。
在与其他数据科学领导者验证了这一经验后,我试图实现一个可以实现以下目标的过程:
精度:事实上,90%的员工都应该是优秀的员工。
损失我们应该向进入我们漏斗的80%的优秀候选人提供工作机会。
成功: 65%的offer应被接受。
努力:招聘应该占用团队时间的10%以内。
通过设计一个更聪明的招聘流程——既能识别优秀的候选人,又能降低失去他们的风险——就有可能同时改善前三个目标。而且,通过前期的大量投资(随着时间的推移会有丰厚的回报),可以管理团队的持续努力和分心。
为了确保实现我们的目标,我们制定了一套核心原则,适用于任何职能部门的招聘.使每个人保持专注和一致的原则可以极大地帮助任何大的流程变更。当你迭代这个过程时,它们还可以作为一个健康的基础。他们是:
确保你的招聘过程一直在进行,并不断改进.
人们通常认为招聘是一项你偶尔参与的任务,或者是一场定期消耗所有精力的闪电战。相反,你应该把招聘流程设计成一个永远开着的引擎,有一个可预测的人才漏斗,在明确的阶段流动。这可以确保你一直在招聘,无论何时有优秀的人才进入市场,你都有机会参与进来。
投资于一个永远在线的过程将迫使你将招聘视为一种纪律。这将推动协议和结果的一致性,使您能够收集关于成功和失败的数据,并迫使您以管理数据管道的同样谨慎来管理人才管道。
让你的流程反映你的招聘需求。
残酷的事实:标准的面试问题有致命的缺陷。
询问求职者以前的工作经验,你就会发现他们是否能清楚地说出在他们周围的其他工作中发生过什么。问他们技术问题,你会发现他们反刍知识的能力。让他们在白板上解决一个“玩具”问题,你就会发现他们解决玩具问题的速度有多快。一个出色地通过所有这些障碍的候选人在实践中可能是一个完全无效的数据科学家。
要解决这些缺陷,您必须首先非常清楚地了解您希望候选人如何执行数据科学。在最高层次上,您应该清楚您的团队将生产的最终产品。会是可视化和分析为决策者提供信息吗?提供给开发者的设计和原型?或者可以在生产环境中扩展和支持的应用程序?
接下来,你应该清楚地了解你希望成功的候选人做什么。找出5个你希望数据科学家解决的问题。对于每一个问题,确保你有(或可以合理地收集)所需的数据,并且即使你不能自己设计,也能设想一个有效的解决方案。这些机会存在于您公司的近期战略、您的组织或产品功能的可行性,以及您目前拥有或可以合理生成的数据的限制的交叉点。
了解您的团队如何执行数据科学,以及您最希望候选人能够处理的挑战,您可以设计一个密切反映您的工作条件的招聘流程。这意味着你应该把候选人放在一个与他们的“日常”非常相似的环境中。如果他们能在面试过程中获得成功,那么他们长期成功的机会就会大得多。
首先进行客观评估,以减少你的偏见。
那些表现优秀的求职者可能会在传统的面试过程中失败。
罪魁祸首是面试官的偏见。一旦你和候选人一起进入房间,你就开始对他们的能力形成看法(大部分是无意识的)。这类偏见有很多种(点击这里查看100多种认知偏见),但面试中最常见的偏见是更喜欢和自己相似的人。
伟大的数据科学家必须有很强的定量和编程技能。这是没有商量余地的。因此,我们设计的流程首先测试这些技能,然后转向更主观(但仍可衡量)的技能,如解决问题和沟通。只有在面试的最后,我们才能看到最主观的问题——应聘者如何在团队中工作,如何融入团队文化。
这些后期的主观标准是最耗时的,也是最容易产生偏见的地方。将他们移到漏斗的后期,可以减少团队的负担(我们只有在确信他们拥有我们需要的技能时才会评估文化契合度),并将过早失去优秀候选人的风险降至最低。
设计你的流程来推销候选人。
大多数面试过程也无法让最优秀的候选人接受这个职位。往好了说,面试是有压力的,往坏了说,面试是单调乏味的。求职者经常被迫向4个或更多的面试官重复他们的经历,并连续回答几个小时的问题。之后,虽然他们可能会问一些自己的问题,但他们往往很难想象在这家公司工作是什么样子。然后他们要等好几天才能收到很少诚实或及时的反馈。那么,你如何修复这么坏的东西呢?
创建一个流程,向候选人提供数据和问题,这些数据和问题反映了他们在组织中将面临的真正挑战。最重要的是,确保你的招聘过程能让候选人融入你的团队活力和文化,这样他们就能真正体验到和你一起工作的感觉。这些候选人都应该在完成面试过程时,对加入你的团队有一种信任感。
和你的团队一起做出明智的决定,而不是在你的塔里。
无论你如何招聘,每个经理都必须做出艰难的决定。为了自信地做出决定,在你的招聘流程的每个阶段都要建立清晰的评估框架。这包括定义团队中每个人都能理解的目标和指标。
同时,作为一个团队公开地做决定。这可以确保招聘经理从参与招聘过程的每个人那里听到对候选人的直接反馈。更重要的是,它能确保你们都在寻找相同的品质。一个开放的论坛有助于随着时间的推移改变你的招聘需求和策略。
最后,让你的跨职能合作伙伴来评估你的候选人。数据科学从来都不是在真空中完成的。你将与决策者、工程师和产品经理合作。让这些领域的关键合作伙伴参与进来,这样你就可以挑选出能够跨部门、跨部门成功发挥作用的人才。
行动要比市场快。
优秀数据科学人才的市场竞争非常激烈,所以你的流程应该确保你尽可能快地让候选人通过你的漏斗,保持良好的势头,并最大限度地减少他们接受竞争报价的机会。快速行动需要一个简化的过程,让你建立信心和速度。在工具和物流上投资,以跟踪候选人在漏斗的每个阶段停留的时间,并积极地改变你的系统,以保持你的优势。
执行游戏
在电影里模仿游戏在美国,图灵的管理技能差点让英国反情报机构破解德国恩尼格玛加密机的努力脱轨。当他意识到自己需要帮助时,他已经疏远了布莱切利公园的团队。然而,就在这位著名计算机科学家才华横溢的时刻,图灵发明了一种完全不同的招募新成员的方法。
为了组建自己的团队,图灵在《伦敦每日电讯报》上发表了一个填字游戏,邀请任何能在12分钟内完成这个游戏的人申请一个神秘的职位,开始了他对新人的寻找。成功的候选人被聚集在一个房间里,在一个受控的环境中接受一次定时测试,挑战他们的数学和解决问题的能力。在测试结束时,图灵从大约30名应聘者中选出了两名表现最好的。
我们可以从这件轶事中学到很多东西。
这个过程确保了图灵尽可能广泛地网罗人才,用具有挑战性的问题和吸引人的工作机会吸引他们,然后在受控环境中验证他们的技能。在电影中出现了一个虚构的转折,图灵招募的候选人之一是一个名叫琼·克拉克的女人,她成为了图灵非常亲密的合作伙伴。琼的才华令人难以置信,但考虑到当时的偏见,如果不是图灵的科学招聘方法,她几乎肯定会被忽略在密码破译团队中的角色。
就像在模仿游戏,我们会让候选人经历一系列的经历,这些经历大致反映了他们潜在的工作环境,并评估他们在一些问题上的技能,这些问题在我们聘用他们后非常容易预测他们的成功。令人惊讶的是,通过正确的计划和前期投资,这比传统的面试更有效,并且节省了团队的时间。
在最高层次上,这个面试过程有两个关键部分:
实际测试:测试应聘者解决一系列日益困难的挑战的能力的简短练习。
数据:一整天和团队一起工作,完成一个更开放的挑战,最后向一组人展示他们的工作。
我们把这个过程作为一个漏斗来管理。在500名入境申请人中,250人(50%)将提交带回家的测试,25人(10%)将通过,20人(80%)将来到数据日,4人(20%)将通过数据日,然后3人(75%)将接受录取。这意味着,为了找到一名优秀的员工,我们需要超过150名申请人。
这里的关键杠杆是(一)求职者的素质,(B)提交带回家测试和参加数据日的成功率(C)带回家测试和数据日过滤器的准确性。通过这个漏斗跟踪你的候选人,并按渠道检查每个阶段的损失(例如,他们来自哪里),你可以开始识别更高绩效的渠道,以及漏斗中过滤过于激进的阶段。
考虑到我们四个不同的目标,最大化精度(雇佣优秀员工)和成功(确保他们接受报价),同时尽量减少损失(提前放弃)和努力(团队注意力分散)——我们投入了大量的时间来设计一个清晰有效的流程,这个流程是由数据驱动的,对候选人有吸引力。
这一过程分为以下六个阶段,从最简单、最客观到最困难、最主观:
筛选:检查脉搏
实际测试:测试是否有足够的技能
推销商品的言辞:说服他们来参加“数据日”
一天的数据:在现实的、可控的环境中测试能力,评估文化
决定做一个迅速而明确的决定
沟通:跟踪每一位数据日候选人
让我们对每个阶段进行更深入的战术分析。
1.筛选
注意,在Sailthru,我们根本不预先筛选数据科学候选人。我们不需要审查他们的简历,也不需要讨论他们的经验或资格。
如果他们有脉搏(和电子邮件地址),我们就给他们一个带回家的测试。
这是我们的版本模仿游戏字谜游戏。这样可以节省大量的时间和精力,让你更快地与有潜力的候选人接触。
但不进行预筛选的最重要原因是,它消除了初始偏见的巨大来源。许多极具天赋的求职者并不具备招聘人员所需要的教育背景或工作经验。这不仅意味着你失去了优秀的候选人,而且你还将激烈地竞争那些少数书面上看起来不错的候选人——其他人也都想要他们。
2.实际测试
带回家的测试非常重要。这是筛选候选人的第一道防线,考虑到潜在的提交量,它需要你的团队做最多的工作。这也是候选人第一次了解你的团队是做什么的。这个阶段不仅是防止你在不合格的候选人身上浪费时间的关键障碍,也是推销候选人这个职位的极其重要的一部分。基于所有这些原因,你应该在通过漏斗收集候选人表现和兴趣的数据时,不断改进这一阶段的流程。
一个合理的家庭测试应该具备以下属性:
不需加以说明的-你要尽量减少候选人提出问题或需要澄清的机会。
有界的-技术熟练者完成考试时间不超过2小时。
麻木了-它将被广泛传播,所以不要包括任何专有或敏感数据。
有关-将这些问题与你在工作中实际面临的最大挑战相匹配。
直接明确你想要如何回答考试,以及你将如何评估考生的表现。
顺次排列-问越来越难的问题,这样你就能很容易地了解面试者的真正技能水平。
要设计您的带回家的测试,首先要从您希望现有数据科学团队解决的最紧迫的问题开始。从这些问题中,选出一两个你(一)有或能够编造令人信服的数据,(B)对考生来说解决问题会很有趣,还有(C)可以简化为一个非常强大的候选人可以在2小时内解决的问题。
在你对问题空间进行了狭隘的研究之后,编译回答你的带回家的问题所需的数据。理想情况下,这些数据来自您的生产环境,并经过了充分的清理、排列或聚合,以便在落入任何人手中(假设它最终会落入)时不会造成伤害。
或者,您可以构造完全虚假的数据,但要小心,因为数据科学中的许多挑战来自处理不一致和异常值。我建议提供大约100万行数据(可能有多个文件)——足够注意所使用的代码的性能,而不会造成负担。
一旦你收集了数据,提出2-3个非常明确的问题,难度逐步增加,并有明确的、可衡量的答案。确保你的问题不仅要测试候选人处理数据的能力,还要测试他们对分析和解释任何模型结果的逻辑思考能力。
根据收集的数据和选定的问题,起草说明。这应该是一份简短、易于阅读的文档,描述了所提供的数据,并包含了最后的问题。此外,你应该指导候选人他们应该花多少时间,而不是强迫他们限制自己的时间,而是指出你估计的时间,这样他们就不会花几天时间在一个本应该花几个小时的任务上。
最重要的是,面试中要有一个部分专门介绍你希望求职者如何回答问题。你希望他们使用什么工具?您希望他们如何提交答案?在代码质量方面,您希望看到什么?视觉化或解释对你重要吗?小心你的要求。这是你推销自己和公司的关键机会。
接下来,将带回家的测试交给您的其他团队成员或社区中的朋友。使用这个来校准测试,并确保你对确定的答案有共识。你最不想看到的就是应聘者在模棱两可中挣扎。
最后,建立一个清晰的评估提交内容的框架。考虑以下标准:
正确性-他们最终的答案正确吗?
逻辑——他们回答的逻辑合理吗?
假设-他们是否做出了明确的假设?
代码质量代码是可执行的,测试过的,功能性的,文档化的吗?
效率代码是否简洁且性能合理?
技术的使用-他们是否恰当地使用现代工具和库?
沟通-答案是否清晰,并以合理的方式呈现?
3.推销商品的言辞
一旦应聘者通过了你的课后测试,你的下一个挑战就是说服他们来参加你的“数据日”面试。大多数人期待的是传统的面试,他们在办公室的时间不超过4个小时——当然不是一整天。你必须让他们相信这是值得他们花时间的。
你的销售演讲的关键部分是你如何与候选人联系,你如何清楚地表达你所呈现的令人兴奋的机会,以及你如何描述和准备他们的数据日。这一切都应该是为了培养他们的兴趣和热情这不是你评价他们的时候.
每个候选人都受到不同因素的激励,所以仔细倾听并将谈话引向他们最关心的话题是至关重要的。根据我的经验,我发现以下是主要的激励因素:
产品和公司的整体潜力。
数据科学是如何组织的,它在哪里报告,以及迄今为止它产生了什么影响。
在不久的将来,数据科学将面临的主要挑战或机遇。
数据科学如何与其他团队交叉工作。
可用数据的范围、规模和质量,以及未来收集的机会。
团队如何管理他们的工作,并在优先级和决策方面进行协作。
团队使用的特定工具和技术。
最终,你会发现求职者无法或不愿意安排数据日。最后,虽然这可能意味着你错过了,但你必须愿意承担这个风险。
“数据日”将成为你评估所有候选人的黄金标准。
4.一天的数据
数据日本身在很多方面都是招聘过程的核心。如果做得好,它将对候选人的最终技术、战略和技能评估与他/她的文化契合度分析结合起来,从而真正“推销”他们在你的团队和公司。只要准备充分,你和你的团队不需要比传统面试投入更多的时间就能完成面试。
准备清单包括:
指令:一份清晰简洁的文件,描述当天的挑战、数据和评估标准,以及求职者成功需要知道的其他一切。
数据:丰富的生产数据摘录,将挑战和激励您的候选人。一个伟大的数据科学家应该能够花一个星期的时间来研究这些数据而不感到无聊。
移动PC:一台新的功能强大的笔记本电脑,与他们工作时使用的笔记本电脑完全相同,并预装了所需的所有数据和应用程序。
准备工作是成功举办数据日的关键。通过确保候选人拥有高效工作所需的一切,你可以最大限度地利用他们完成有意义的工作的时间。
指令
当求职者来面试时,你应该提供的第一件事是一套打印的说明。要考虑的部分包括(尽可能简洁地):
简介-快速欢迎和介绍一天的时间表和任务。
免责声明(也许是一份保密协议)——咨询你的法律部门是否需要免责声明。
目标——对手头任务的高水平概述,以及在成功的数据日中你想要什么。
建议时间线——你想象一个候选人会如何利用他们的时间。让他们清楚地知道,他们面临的最大挑战就是没有时间了。
数据——对你所提供的数据的广泛描述,足以为下面的部分提供上下文。
主题——一个包含4到5个可以考虑的主题的简明列表(后面会详细介绍如何选择这些主题)。
评估——你希望从成功的候选人身上看到什么。
技术设置-简要说明笔记本电脑上提供的工具。
数据详细信息-对所提供的数据进行更全面的描述。对于每个文件,作为一个整体描述内容,包括每个字段,以及数据集中的大小(行数或观察值)。
最重要的是选题。这些内容应该足够多样化,这样背景各异的候选人就能找到既感兴趣又平易近人的工作。同时,一定要把主题集中在有价值的应用程序上你的业务。这可以确保你在测试你所需要的技能,并让候选人对他们在你的团队中会做什么有一个更现实的认识。
最后,主题应作为建议提出。我更倾向于让候选人自由发挥。最后,最重要的是他们有信心在一天结束时做出有意义的分析和演示。
记住,如果你的指示清晰扼要,回答面试者的问题就会少花很多时间。
的数据
接下来要考虑的是候选人将使用的数据。这个数据集与带回家的数据集有两个不同之处。首先,它不会广泛分布,所以您绝对应该使用生产数据。但请记住,虽然考生将使用您提供的笔记本电脑,但他们将有互联网连接,因此您不能保证完全控制数据集。因此,请确保没有包含个人身份或战略上重要的数据。
其次,这个数据集应该是大而丰富的。你可以包括更多的观察、多组数据、复杂的时间序列和关于每个观察的各种数据点。数据日的主要挑战之一是要求候选人采用“真实世界”的数据集,并确定实际的分析或建模路径。这通常需要忽略大量可用数据,或者通过过滤或聚合显著简化数据。
最后,最优秀的候选人如何使用你提供的东西会让你大吃一惊。
一个重要的考虑因素是应该提前对数据进行多少预处理。一般来说,除非你特别想测试他们清理非常混乱的数据的能力,否则我建议保持这个样本的合理清洁,以确保他们不会浪费宝贵的时间在分析或建模上。
移动PC
为应聘者准备一台笔记本电脑,上面的指令、数据和软件都放在一个可以访问的地方。在Sailthru,我们使用MacBook Pro(所有数据科学家和工程师都使用Mac或Linux机器),并安装以下软件:
水蟒(Python分布)
使用HomeBrew,数据科学家可以根据需要快速安装其他软件。此外,我们将数据放在CSV文件中的主目录中。我们建议考生使用开源脚本语言(如Python,R或茱莉亚)让每个人都觉得舒服。
时间表
Sailthru的典型数据日日程安排如下:
上午10点-欢迎光临应聘者到达后,我们的招聘人员迎接他,并将他带到团队旁边的指定位置。
上午10点05分-伙计候选人的朋友(我们数据科学团队的指定成员)带候选人去喝咖啡,并带她或他参观办公室。
上午10:15 -迎新这个助手会告诉应聘者当天的安排,以及面试笔记本电脑,以及在哪里可以找到数据的简短说明。
上午10:20 -方向求职者坐下来阅读说明和检查数据,通常会决定一个方向。
上午11点半-站起来候选人在每天的团队站立会议上倾听,以了解他或她将从事的工作,并被要求就他或她所选择的方向进行发言。
中午12:30——午餐团队的一些成员带候选人出去吃午饭,更多地了解他/她的背景和性格,并让候选人提出任何问题。
如有需要-问题候选人可以向团队中的任何人询问数据、技术或上下文问题,但通常会从他们的“伙伴”开始。
下午4:30——提醒我们提醒候选人,他/她将在5:30进行演示,并鼓励他们开始演示。
下午5:30——展示候选人用20分钟的时间介绍他/她在一天中发现或建造的东西,然后是10分钟与团队和其他与会者进行丰富的问答。
下午6点——反馈我们要求应聘者就他/她的经历给我们反馈。然后,他的朋友或招聘人员会指导应聘者,并设定我们何时沟通决定的期望。
下午6:15——做决定团队完成了对候选人的讨论,90%的情况下已经做出了决定。
总的来说,团队的时间投入是相当合理的。这个朋友早上花15分钟,下午可能再花15分钟回答问题。不管怎样,脱口秀和午餐都要举行。五人一组的演示和问答需要30分钟,然后通常再花15分钟做决定。总的来说,团队花在候选人身上的时间只有4个小时多一点,并不比传统的极简面试多。
到目前为止,从文化适应的角度来看,一天中最有见地的部分是午餐,在那里你可以看到候选人在非正式的社交环境中是如何表现的。
从技术角度来看,当天最具洞察力的部分是演讲后的问答环节,我们试图提出探索性和挑战性的问题,以验证候选人方法的严谨性,并确定他们如何参与我们团队中常见的激烈技术或分析性辩论。
经验教训
数据日应该是你的团队和公司的反映,所以你应该调整这个过程来满足你的特定需求。我们会在一天结束的时候询问候选人的反馈,并且已经根据他们的输入做出了许多更改。以下是我们学到的一些最好的经验:
候选人几乎总是没有时间.鼓励他们选择一个他们自信的方向,并对他们的工作采取迭代的方法。这样,如果他们的方法不奏效,他们有足够的时间来适应。此外,要强调的是,一个不确定的分析要比一个模糊的分析好得多。
不要让午餐时间过长.候选人的工作时间是有限的,45分钟后,他们会开始担心如何回到工作中,以便及时完成演讲。
邀请不同的群体参加演讲.任何你认为候选人会经常接触的人都应该在场。这让你有机会征求他们对个人工作和沟通风格的反馈,并让你的候选人更好地了解关键的内部关系。
在候选人到来之前,向他们透明地说明数据日的内容.这样他们就有时间在心理上为这次经历做准备,从而缓解一天的压力。
5.决定
在Sailthru,我们根据以下维度评估候选人:
1.问题的结构你是如何构建这个问题的,你做了什么假设,你是如何缩小范围的?
2.技术严格您为完成工作而开发的代码的可靠性、可读性和灵活性如何?这种方法的可扩展性如何?
3.分析严谨你所使用的方法(机器学习、统计、分析、可视化)在逻辑上是否健全、完整和有意义?
4.沟通你能多清楚地描述你的工作、方法、方法和结论?你回答问题的效率如何?
5.有用性如果生产价值,您的工作结果对Sailthru有多大用处?
我们将这些标准包含在数据日的说明中,以便候选人知道成功是什么样子的。
在候选人完成他们的陈述和问答之后,他们的伙伴将他们带出办公室。然后我们立即开始讨论候选人,而每个人的印象都是新鲜的。我们给每个参与者一个机会分享关于上述标准的反馈(如果他们有意见),首先从我们团队之外的人开始。然后是我们团队中最缺乏经验的成员发言,然后是最有经验的成员发言。这有助于防止团队或领导者提前对房间里其他人的意见产生偏见。
一般来说,如果任何参与者对候选人强烈地说“不”,那就有足够的理由拒绝他们。
由于技术原因,这种情况很少发生(带回家的测试应该使大多数考生具有相当高的生产力)。但当它发生时,你应该仔细地重新评估你的测试,以确保它能有效地筛选候选人。
当这种情况发生在文化适应或沟通原因时,公开讨论这个问题是至关重要的。这有助于建立和加强你的团队想要如何表现的健康规范,并降低屈服于一个人的偏见的风险。
如果每个人都对一个候选人不冷不热,这也是一个明显的“不”。这通常是由于他们工作的局限性——他们完成了多少,他们思维的严谨性,或者他们的技术执行力。如果僵局仍然存在,那么团队领导应该做出最终决定(宁可拒绝),或者在极少数情况下,你可能想邀请候选人回来进一步讨论。
6.沟通
这个过程的最后一个阶段是把结果传达给候选人。那些没有通过家庭测试的人会收到招聘人员的回复。我们很乐意给每个提交的作品直接反馈,但考虑到我们审查的提交作品数量的规模,这是不切实际的。
也就是说,数据科学团队的一名成员会在数据日之后跟踪每一位没有收到工作邀请的候选人。这可以确保这些候选人得到建设性的反馈,并能从经验中学到更多。
最终,我们对每个数据日候选人的潜力感到兴奋,希望尊重他们的时间,并在我们的道路再次相遇时保持联系。数据科学是一个小社区。

挑战与未来机遇
招聘优秀的数据科学家是困难的,虽然我相信这个过程对我们在Sailthru的招聘产生了巨大的积极影响,但我也相信我们还有很多东西需要学习。以下是我们继续努力解决的问题。
尽量减少假阴性
我们的流程可能会产生太多的假阴性——即非常适合数据科学的候选人,但没有收到工作邀请。最大的来源可能发生在带回家的考试阶段,在这个阶段,考生可能不愿意投入时间来完成考试。让有才华的候选人更容易完成测试,并提高我们组织在社区中的品牌,这都是我们可以采取的步骤。归根结底,这是一个管道开发的问题,如果它减慢了你雇用最高水平人才的能力,就会产生问题。
更令人担忧的是,放弃那些在数据日挣扎的强大候选人,因为这些候选人对我们进行了投资,而我们也对他们进行了投资.出现这种情况有几个原因,但最常见的是数据日是一个高压环境。考生必须在8个小时的课程中学习一个新的数据集,提出一个问题,开发一个解决方案,并制作一个演示文稿。
虽然一些候选人在这种压力下表现出色,但另一些人会不知所措,无法向我们展示他们通常能够完成的任务。不幸的是,我们在做决定时无法解释这一点,因为几乎不可能将这一点与无能或低效区分开来,而这两者都是我们积极选择的目标。
应聘者在数据日无法成功的另一个原因是他们不熟悉这些工具。他们可能对专有或商业工具或其他操作系统更有经验。这可以通过获得更多商业软件的许可证和在虚拟机上提供Windows的使用来缓解。这些选择需要大量的现金和运营成本。另外,熟悉Linux操作环境和开源工具也是我们强烈要求的。开始
可以说,这个过程中最具挑战性的方面之一是让它启动和运行。许多组织如果没有一个稳固的团队来适应、执行和优化这个过程,就会为此而挣扎。
此外,该系统需要数据科学团队和招聘团队的协作。双方都必须确信这是值得投资和持续发展的,否则它将不可能随着时间的推移得到很好的实施和维护。
为其他功能定制此过程
在Sailthru,我们正在积极地为其他部门塑造这个过程,比如软件开发。该过程的结构在很大程度上可以保持不变,而所提供的具体挑战可以有所不同。
例如,对于开发人员,你可以提供一个干净的Github回购,并要求他们在明确的需求和接受标准下构建一个简单的应用程序。这不仅提供了了解他们如何构建和编写应用程序的机会,而且还提供了了解他们如何开发软件(例如,测试驱动开发)以及如何记录其实现的机会。
或者,你可以从现有的应用程序中抽取一部分,将其简化为开发人员可以轻松运行的内容,删除特定的功能,然后让他们重新编码。这允许您看到它们如何与现有代码一起工作,并且您已经有了应该如何实现该特性的明确基准。
的外卖
这个招聘过程对我领导的数据科学团队来说是革命性的。我们放弃了一些候选人,他们在纸上和谈话中看起来都很完美,但却无法构建开放式数据问题,也无法为自己的分析选择辩护。
我们雇佣了以前从未有过的候选人。
例如,在过去,我几乎把没有几年工作经验的候选人都筛掉了,因为我担心他们过于学术。但是通过这个过程,我们雇佣了一位数据科学家,他只有一个定量博士学位和一些实习经历,因为他在数据日展示了出色的实践技能。他在上任的前两周就开始推动对生产的改变,并在上任的前三个月产生了巨大的积极影响。
然而,我最看重这个过程的是,它从我们的决策中消除了大量的怀疑和不确定性。招聘是我们作为管理者所做的最重要的决定之一有明确证据支持的信心做出这些判断,感觉很棒。
当我们发现一个有前途的候选人时,我们可以迅速采取行动,因为我们已经把候选人推销给了我们的组织和团队,并且在激烈的招聘市场中处于有利地位。作为一个额外的好处,我们可以雇佣许多日后为公司做出巨大贡献的人,而不必总是竞争那些所有人都认为书面表现最好的候选人。
把时间和精力投入到建立一个永远在线的流程上,这个流程可以快速确定地进行,并选择那些能够出色应对你的真正挑战和机遇的候选人。
那就别再担心招聘问题了,回去做伟大的数据科学吧。