简介
本文作者是Mengying李他领导着concept公司的增长数据科学团队,此前曾担任Facebook的数据科学经理和微软的数据科学家。她还就如何建立数据科学团队、选择第三方数据工具以及开发早期数据科学原型为早期公司提供建议。
有很多早期的创始人热衷于将数据科学家加入他们的团队。如今,即使是处于早期阶段的初创公司也在生成大量数据,因此很有吸引力的是请人来帮助分析这些单独的数据点,并将它们转化为可执行的指令,从而塑造产品或核心业务功能。
但当你问这些热切的创始人如何虽然数据科学可以让他们的业务更好,但大多数时候你会得到一些模糊的、简单的答案,比如“这样我们就能更好地了解用户,这将帮助我们发展业务。”
作为一名初创公司的顾问,我有过很多这样的对话。我发现,通常情况下,推动建立一个数据科学功能是由FOMO(害怕错过)驱动的——创始人害怕落后于更“数据驱动”的竞争对手。但是没有全面了解数据科学需求对于你的特定业务,你可能会雇佣一个不具备应对特定公司独特目标和挑战能力的人——这种不匹配会让你倒退,而不是推动你前进。
在一家时间和资源都很有限的初创公司,过快地投入到数据科学中可能会分散企业在规模发展道路上面临的更紧迫挑战的注意力。
以下指南是初创公司数据科学的入门指南,以及你是否应该投资于这一关键招聘。我们将讨论您的企业现在是否具备了构建功能的良好条件,或者您是否最好在早期进行外包。我们还将探索不同类型的数据科学家,以及最适合您特定业务需求的数据科学家。让我们开始吧。
你准备好雇佣你的第一个数据科学家了吗?
要衡量现在是否正是将第一位数据科学家引入团队的合适时机,有几个关键点需要反思:首先,您的公司是否已经达到了拥有足够数据来生成高质量见解的地步?第二,你是否有合适的工具和支持来实现数据科学家的见解带来的ROI ?
你有足够的数据开始吗?
任何公司都不应该在最初的几次招聘中包括数据科学(除非他们正在开发数据科学产品,比如实验平台或分析咨询公司)。为什么?在早期,当你只有一个MVP和一些用户时,你可能没有足够的数据进行分析。大多数时候,人们可以通过采访、直接的客户反馈甚至社交媒体来收集下一次的反馈和产品想法。
但关键问题是:什么时候做你有足够的数据进行第一次招聘吗?这取决于你的公司是做什么的。依赖广告或订阅收入的B2C公司可能想要在早期引入一名数据科学家,而早期客户很少的B2B公司可以等待一段时间。一个可以依靠的经验法则是,当你的月用户达到1000人,持续至少6个月时,就开始考虑招聘。这建立了一个稳定的用户基础,有足够的数据供数据科学家解析使用模式和识别趋势。另一个值得注意的基准是,当你的公司达到50多名员工时,更具体的职能(如财务)正在建立,可能是时候考虑全职数据科学家了。
如果一家公司的数据已经发展到这样的程度,定性评估或基本的Excel分析不再能够为业务决策提供信息,也不再能够准确地监控业务健康状况,那么可能是时候引入数据科学家了。
你对你的客户和你的路线图了解多少?
即使你有足够的数据,也不一定意味着你需要一个数据科学团队。数据科学家可以帮助你的公司发现未知和模式,并验证你的假设——例如,数据科学家可以确定转化率最高的用户细分,以帮助制定获取策略,或评估一项新功能在留住新用户方面有多好。如果你已经做了大量的客户发现工作,并对未来的产品路线图提出了强有力的假设,那么你可能不需要花钱请数据科学家来帮助你做出决定。
但是,例如,如果你无法回答关于客户基础的简单问题,比如一些客户来自哪里,或者他们在你的产品上花了多长时间,这可能是一个信号,表明你将从招聘中受益。
如果你确实认为你需要一些数据科学的帮助,你能证明投资回报率是合理的吗?
数据科学家可能是非常昂贵的平均年薪约16万美元.因此,重要的是要想象一下你可能从这次招聘中获得的回报(也就是说,你预测数据科学将在多大程度上帮助你发展业务)。有时,你最好有一个外部顾问或承包商,他们可以帮助指导你现有的工程和产品组织自己查看数据。在组建团队之前,这些外部人员可能还会让你了解如何正确地处理数据。
例如,如果你的工程师或产品经理有扎实的数据背景,知道如何编写查询,你可能会考虑从承包商或顾问开始。或者,如果您希望开始一个需要数据科学家专业知识的特定项目,但在不久的将来没有任何其他即时需求,这可能是另一个指示,您最好从外部帮助开始。

您是否具备数据科学家开始工作所需的基础设施?
如果没有高质量的数据,再花哨的分析也没用数据科学家可能做的事情并不重要.垃圾进,垃圾出。这就是合适的工具集的用武之地。
这里有一些基本的快速入门现代数据科学堆栈.
数据收集和存储工具将原始日志摄取到数据仓库(例如Snowflake)。
数据管道工具自动化原始日志的处理,使最终用户更容易访问,因为大多数原始日志的格式非常复杂且不直观。
商业智能工具便于可视化和报告数据。这可以是实时的,也可以以一定的节奏进行更新。实时BI工具成本更高,但它们可以帮助您更快地识别任何问题。
交互式查询界面。许多存储工具已经集成了交互式查询接口。但有时,为了简化分析过程,我们可能希望有一个更强大的查询接口,可以直接执行SQL查询和可视化,例如Hex。
当然,并不是每个公司都需要这个堆栈的每个组件(还有很多其他工具没有包括在这个列表中,包括可观察性、ELT、反向ELT等等)。但至少,您需要对产品上的关键事件进行可靠的日志记录,并有一个数据转换层来将数据送入仓库,以便您的数据科学家至少可以处理一些数字。
你可能会想,为什么不下载一个巨大的Excel表格来分析呢?如果没有适当的插装和转换,您的数据将无法正确格式化为Excel表,浪费大量时间解析非结构化Excel文件中的见解,而不是使用SQL/R/Python查询结构化数据。
你是否有足够的空间和支持让一个数据科学团队成长并感到有价值?
即使管理层认为数据很重要,也不是公司里的每个人都同意你的观点。重要的是要确保所有相关职能都知道如何将数据作为决策过程的一部分。例如,数据科学应该被视为一项关键的业务功能,与产品管理和工程同等重要。当你在进行产品变更时,你应该本能地考虑是否有任何数据洞察可以帮助你做出决定。你应该期望洞察融入到产品改进中,而不仅仅是FYIs或锦上添花。
如果期望不一致,并且您的团队没有开始接受数据文化,数据科学家可能最终只是华丽的装饰,而不是推动业务影响。
这就是你需要提前思考的地方:鉴于目前的业务增长,如果没有数据团队,你会在哪里看到更大的问题?例如,你打算开始跑步吗生长实验在明年?这个路线图将帮助你证明为什么你现在必须招聘,这样你就可以为未来更大的挑战做好准备。
你对你的数据科学团队有正确的期望吗?
当你考虑招聘第一个数据科学人员时,对前几个月设定现实的期望。例如,新员工可能至少要到3个月后才能告诉您任何引人入胜的见解,因为他们可能正在忙着解决您的坏日志记录和设置基础数据基础设施。
不要指望你最早的数据科学家能立即创建出漂亮的模型,因为你的产品可能一开始就不需要模型。相反,在早期,他们将花费大量时间与工程师沟通他们的日志记录需求,与低效的数据工具作斗争,并获得用于分析的正确数据。
找到你的第一个数据科学员工。
在确认公司确实需要一名数据科学家并成功获得所有关键利益相关者的支持后,就可以开始了寻找对的人.
第一位数据科学家总是至关重要的,因为他们将构建数据模型的基础,定义数据科学在组织中的角色,进行面试以决定谁将加入早期团队,并塑造数据科学组织的文化。但完美的拼图招聘不会从天而降。
谁是(伟大的)数据科学家?
不同的公司有不同的数据科学家,就像厨师有不同的头衔(副主厨、酱汁师、糕点师等等),不同的餐厅有不同类型的菜肴。
例如,在Meta公司从事幸福感调查的数据科学家可能每天只处理数千个样本,不做任何机器学习,而从事新闻提要排名的数据科学家可能需要解析数十亿行的原始印象数据,理解所有核心机器学习概念,有时还要自己运行排名模型。然而,他们可以共享同一个头衔:数据科学家,产品分析。
以下是你可能经常在数据科学职位描述中看到的一些常见技能:

虽然这些技术技能是日常工作的重要组成部分,但区分优秀数据科学家与平庸数据科学家的关键因素往往不是技术技能,而是他们的讲故事和思想领导能力。为了讲述一个可能改变团队对产品的想法的故事,你雇佣的数据科学家应该能够确定数据可以帮助回答什么问题,他们需要什么数据,如何找到它,何时建立必要的数据基础,然后编写一个易于理解的可视化文档和明确的建议。
理解一些常见的标题和其他经常与数据科学混淆的功能也很重要。以下是一些常见的标题:

寻找混合技能组合,而不是专家。
当然,你想要雇佣一个可以用你提供的任何食材烹饪任何菜肴的主厨,最好是成本更低。然而,大师级厨师通常都很昂贵——更重要的是,你可能根本不需要一个大师级厨师,而是一个可以满足你自己需求的人。
我强烈主张雇佣一个混合型数据科学家作为你的第一个数据科学员工——要么是具有强大ETL背景的传统数据科学家,要么是了解一些基础数据分析技术的数据工程师。原因是,在这个阶段,你的厨房的设置可能是基本的,没有任何花哨的电器。因此,第一个厨师必须处理整个烹饪周期——从清洗蔬菜到装饰——即使它可能不那么高效和准确。一旦公司开始扩大规模并达到一定规模(可能超过200个,有一个更清晰的组织结构),就可能需要聘请数据科学家来执行特定功能,与您的个人组织相匹配。
我见过公司以三种不同的方式招聘他们的第一个数据科学家:
刚从大学毕业
资深数据科学领导者
经验丰富的独立贡献者
每一种都有其优缺点:

所以简单的回答是没有完美的首次招聘.
我经常被问到的另一个问题是创业经验和领域经验在职位描述中都很重要.我职业生涯的前六年都在大公司工作,换过五次工作领域,我不得不这么说不一定.
当然,创业经验是有帮助的。至少这意味着他们有经历过创业公司的混乱和疯狂,所以你会为下一次考试做好心理准备。此外,初创公司使用的工具栈非常相似,因此对工具的学习曲线可能更平滑。但初创公司的数据科学家角色可能会有很大的不同,这意味着他们的工作经验可能与你想要的大相径庭,即使两家公司都是初创公司。
相反,来自大公司的数据科学家可能缺乏使用“现代数据堆栈”的经验,因为他们可能习惯于使用内部构建的工具。但我不会说大公司的所有数据科学家都缺乏解决混乱和模糊问题空间的心态。
来自大公司的人有一个被低估的方面,那就是他们能接触到业内一些最强大的数据科学家。例如,在Meta,我们有一个数据科学职业博客系列,让经验丰富的数据科学家与同行分享他们的旅程。我们还定期举行见解分享会议,向其他数据科学家学习他们的工作。我很幸运地接触到了鼓舞人心的分析思维,不知不觉中获得了有效的数据分析技能和外部领域的知识。
背景很重要,经验也很重要,但最重要的是你应该注意超越简历上的单行项目.他们是否有足够的斗志和韧性?他们是快速学习者吗?他们能很好地与他人沟通和合作吗?他们愿意亲自动手吗?他们有很强的自主权吗?
在我看来,你的第一个数据科学招聘人员理想地结合了数据科学家和数据工程师的特征,不管他们是来自初创公司还是大公司,只要他们能够快速上手,并在前进的道路上不断学习。
帮助你找到理想员工的面试问题:
一个一些问题我建议你在面试循环中添加以下几点:
给他们一个实时编码挑战,看看他们是如何用数字和图表把一个模糊的业务问题变成一个像样的解决方案的。他们能告诉你他们的编码逻辑吗?如果他们被困住了,他们如何解除自己的障碍?他们的数据点和/或图表能支持他们的结论吗?代码不需要非常干净,也不需要局限于任何特定的语言——关键是要了解他们如何解析面前的信息。
让他们解决你目前面临的一个业务问题,看看他们是否能得出合理的假设,并以一种让你信服的结构化方式解决问题。他们是否有一个整体考虑问题的框架?他们对问题感到好奇,会问彻底的澄清问题吗?他们如何交流他们的思维过程?他们的解决方案有创意吗?
在他们之前的工作经验中挑选一个项目,深入挖掘他们的跨职能和所有权经验,包括:谁发起了这个项目?你的角色是什么?你如何在结果上与利益相关者保持一致?产生了什么冲突?项目中最具挑战性的方面是什么?你有没有应对这些挑战?
如何吸引你的第一个数据科学员工。
招聘优秀的数据科学家的竞争非常激烈,所以让自己在顶级候选人中脱颖而出是很重要的。当数据科学家18luck官方网站 就像任何早期的初创公司员工一样,他们正在寻找具有吸引力的角色属性的组合:
有趣又有挑战性的问题。优秀的数据科学家相信,他们的工作可以对产品产生真正的影响,尤其是在他们所热爱的领域。所以是否有足够的空间让他们将他们的工作融入到产品中,并产生真正的影响是至关重要的。他们当然不只是想成为一个训练有素的SQL猴子,并在被要求时提取数据。相反,他们希望使用SQL作为解决复杂问题的工具,并为业务增长做出贡献。
职业发展。第一个数据科学家通常希望确保他们的职业生涯在公司里蒸蒸日上。明确的基于绩效的激励机制,以及他们的长期期望与你能提供的之间的良好匹配,这些都很重要。例如,如果他们的目标是成为公司的数据科学领导者,你会在未来雇佣一个更大的数据科学团队,让他们成长为这个角色吗?
人和文化。和所有其他职位一样,你是否喜欢你将要共事的人是决定你的工作邀请的最关键因素之一。对于数据科学家来说尤其如此,因为数据科学是非常跨职能的。例如,第一个数据科学家关心的问题可能是:领导是否会为他们的团队倡导和收集资源?如果数据讲述的故事与他们最初的直觉不同,领导层会如何反应?
公司的未来。再说一次,你是一家初创公司,这是有一定风险的。因此,第一个数据科学家必须知道公司是否有一个繁荣的未来,并且他们可以将自己视为其中的一部分。
现在你知道数据科学家关心什么了,现在是时候去做了让你的演讲更吸引人.
让范围和挑战具有吸引力。想想一些日常场景,你很难回答一些与数据相关的问题。这些问题是否具有挑战性和刺激性?你认为什么样的技能可以使解决方案更有效?将您的数据问题划分为与您的路线图紧密相关的一些具体领域,并想象一下数据科学家如何发挥作用,这可能会有所帮助。
诚实地说出你对未来数据科学团队的设想。面试官很可能会在面试中问你这个问题,所以把答案记在心里很重要。不要过度推销你能提供的东西——一旦第一个加入你的创业公司的数据科学家发现你不能提供你所承诺的东西,他们就不会留下来了。首先坦率地询问求职者在长期工作中寻求的是什么,然后问问自己这是否是你所能提供的。
在公司内部建立数据文化。初创公司中任何职能部门的创始成员在刚开始创业时都需要很多支持。例如,给他们在重要会议上发言的机会,在公司内部推广他们的分析。这个冠军,很可能是第一个聘用数据科学的经理,负责让第一个聘用的人感到受欢迎和认可。
准备好诚实地分享你的财务数据。评估初创公司机会的人可能会问很多关于公司财务状况的问题——准备好分享有关融资计划、期权稀释、CAC / LTV比率和盈利途径的适当细节。
为了扩大你的候选人池,利用你的网络,请你的投资者帮助推荐伟大的数据科学家。我还建议你找一些渠道,在一群热情的数据科学家面前直接公布招聘消息,比如数据Slack频道、数据聚会和数据会议。认识这些社区的成员或直接赞助这些社区的人可以让你的招聘消息传出去。
总结:招聘要深思熟虑,不要匆忙。
与任何创业公司一样,他们的需求是充足的,而资源是稀缺的。如果没有数据科学家,您可能会错过指导早期业务决策的正确见解。但是,在没有充分了解业务需求的情况下,过于仓促地招聘,可能会迅速分散初创公司在产品适应市场的道路上面临的最紧迫挑战的注意力。
当你为自己的特定业务权衡决策时,关键是要使你的数据科学招聘策略(将他们的技能和经验带到董事会上的数据科学家类型)与你当前的现实相一致。有了合适的工具,解决棘手的问题,使用强大的数据和跨职能收购,你的初创公司可能已经准备好将数据洞察纳入产品。
请记住,顶尖的数据科学人才非常抢手,所以可能需要一段时间才能获得签署的聘书。不要随便找一个人,花时间去找那个对你的创业公司有长远影响的人。