产品

Labelbox的PMF之路:创始人需要逆势而为,并正确行事

有很多普遍的观点认为,在创业之初,创始人应该尽快推出一个MVP,以开始积累反馈。毕竟,一旦创业者有了一个创业的想法,他们就会迫不及待地开始建设,尤其是如果他们非常精通技术的话。

但对于联合创始人来说Labelbox在美国,产品开发是一个缓慢的过程。尽管最初的联合创始人马努沙玛布莱恩Rieger丹尼尔Rasmuson都是非常技术性的(感谢他们的18luck官网 ),他们在Labelbox早期的精力都花在了深入的客户发现工作上,而不是埋头打造一个早期的原型。

这种对想法验证和客户发现阶段的坚定承诺——而不是一开始就投入开发——使Labelbox团队能够收集有价值的早期反馈,对产品进行微调,从而使初创公司立即获得曲棍球棒式的增长。

Labelbox现在是D轮创业公司,拥有超过1.88亿美元的资金,已经成为新兴数据标签行业的领导者。其软件用于批注大量数据;更具体地说,它帮助人们识别和分类数据。想要了解它的产品,想想一辆汽车的图片。弹出一个窗口,询问你是想给它贴上特斯拉还是福特的标签。它的技术可以通过人工智能准确地标记特斯拉的所有照片。

“我们着手解决的一个明显问题是创建一个协作标签系统,”夏尔马说。“尽管在2018年才推出,但当时所有最先进的工具都是桌面应用程序。我们知道人工智能将变得越来越大,数据标记只会变得更加重要,我们希望构建一个解决方案,不仅可以管理大量数据,还可以允许一个团队中的多个用户登录到基于云的平台,并能够在标记过程中进行协作。”

同时担任Labelbox首席执行官的夏尔马讲述了Labelbox的历史和创业精神,讲述了他从一名航空航天工程师过渡到神经网络领域的过程,他如何利用过去工作中的洞察力来验证数据标签的一个明显问题,以及为什么他和他的联合创始人在早期优先考虑客户发现,而不是建立客户,最终吸引了condnast和好事达(Allstate)等大公司成为Labelbox最早的客户。

让我们把时钟倒回去。

探索思想

Labelbox的故事始于近十年前,当时夏尔马和他的联合创始人还是安柏瑞德航空大学(Embry Riddle Aeronautical University)的学生。两人最终将进入科技领域,共同开发人工智能解决方案,但作为一名航空航天工程师,夏尔马专注于将人工智能用于一个完全不同的项目。

人工智能并不像今天这样无处不在。在2010年代初,它主要局限于笨拙而简单的模型,专注于神经网络和训练计算机读取一组数据中的模式。正是通过这些基本的训练模型,Sharma第一次熟悉了人工智能。

“在那个时候,使用神经网络仍然是过时的。这并不是太久以前的事,大约是在2009年和2010年,但使用神经网络的最佳方法之一是使用MATLAB或Simulink软件包,这些软件包在教育机构中广泛使用,”Sharma说。

“我对这些系统非常感兴趣,因为你不需要学习方程式来计算或训练它们。你只要给它们提供数据,它就会开始模仿从数据模式中看到的行为,”他说。

Sharma随后花了一两年的时间,用这些神经网络为航空航天工业测试和构建解决方案,致力于实现自主飞行。

他的联合创始人、现任Labelbox首席运营官布莱恩•里格也有类似的经历。两人都是同一时期的学生,在大学毕业后分道扬镳之前,曾一起做过类似的课堂项目:夏尔马开始在湾区的初创公司从事产品工作,而里格尔最终在德克萨斯州的波音公司担任数据科学职位。

“时间快进到2017年,当时我在湾区的第二家初创公司工作,那是一家卫星成像公司地球。我联系了当时还在波音公司的布莱恩。我们当时都意识到,我们职业生涯的下一个阶段将涉及共同解决有趣的问题,”夏尔马说。“我们彼此达成了一个协议,无论如何,我们都要辞职,创办一家公司。”

但这对夫妇一开始并没有把目光放在风险投资支持的企业上,事实上,他们当时的意图是做一些相当于小企业的事情。剩下的唯一问题是他们应该追求什么样的想法?

夏尔马说:“当时,人们对如何将人工智能应用于自动驾驶汽车等新颖、开创性的领域非常感兴趣地球目的是基于我们每天从300-400张每日卫星图像中收集的大量数据构建计算机视觉应用程序。我们的工程团队构建这些应用程序的方式是探索他们应该使用哪些数据。有一种关于标签的想法,这是一个非常新的概念。”

“为了训练这些神经网络如何正确地标记数据——比如准确地描述从卫星图像中提取的信息——人类必须传授关于某些物体的外观以及如何识别它们的内在知识。”

夏尔马回想起他在大学时的自动驾驶飞机,意识到这种模式并没有改变。神经网络被训练成以同样的方式理解数据:将数据输入一个模型,这个模型将被训练成模仿被告知要做的行为。

“但是什么做了改变的是用于训练这些网络的计算和算法变得更加强大,”夏尔马说。“更重要的是,它的改善速度似乎比摩尔定律。”

这种认识足以激发新业务的种子想法。Sharma开始利用他在Planet的时间吸收所有关于这个问题领域的信息,记录团队内部如何探索构建ML基础设施和扩展AI的方法。

夏尔马开始在市场上四处寻找替代品。有CrowdFlower合作他的技术利用人类智能来完成简单的任务,比如转录文本或注释图像,以训练机器学习算法。

“其他一切基本上都只是开源工具或桌面应用程序,”Sharma说。但你瞧,这些东西都不适合解决《星球》内部的问题。该团队正在寻找一种更强大、更全面的解决方案来组织和标记他们的数据。”

因此,Labelbox概念的起源是:“我们总是倾向于构建工具。我们一直都很喜欢制作工具,也很欣赏那些很棒的工具。所以我们问,‘我们在这里能做什么?夏尔马说:“也许我们真的可以设计出一种产品,成为这些神经网络的接口。”

根据痛点塑造早期产品

到2017年年中,Sharma和Rieger仍然坚信人工智能将继续增长,这个领域存在巨大的机会。

“我们的赌注是,越来越多的企业将需要训练这些模型,但标记数据是一件非常人性化的事情。这需要人类的判断,而人类并不总是会同意,”他说。

Sharma和Rieger对数据标记有一个松散的想法,对神经网络有浓厚的兴趣,他们开始填补由于数据协作标记系统的空白而造成的痛点。

Sharma说:“当时,我找不到协作解决方案,我可以邀请X人,并为他们分配不同的角色和权限,使他们能够协作处理静态数据。”

Sharma回想起他观察到的Planet公司的工程师和团队领导在试图整理大量数据时所遇到的痛点。

“当时所有最先进的软件都是桌面软件,如果你想解决这个数据标签问题,你必须在每台电脑上安装软件,用一个u盘,分配10到20张图像给一个人标签。这是在2017年,”夏尔马说。

他说:“我们有一种直观的感觉,如果我们开发的软件能够方便地从任何地方访问,允许多个合作者同时使用,并为不断增长的业务提供可扩展性,那么它几乎可以解决内部工程团队工作中的所有问题。”

Manu Sharma, Labelbox的首席执行官和联合创始人。

验证想法

尽管Sharma和Reiger固执地认为人工智能和数据标签将在不久的将来成为一个巨大的市场,但他们发现自己很早就加入了这个行列。

Sharma从他目前在Planet的工作中知道,至少有一个内部团队正在修补构建数据标签基础设施,但为了验证他们的信念,即协作数据标签工具是人们愿意为之付费的产品,他们需要找到其他团队。

请专家检查一下脉搏

让球在一个早期客户发现过程夏尔马和联合创始团队决定开始向每天与人工智能打交道的一小群专家推销他们的想法。

夏尔马认为,在与人工智能专家的这些会议中,建立自己的可信度非常重要,因此他借鉴了自己以前的产品管理策略。利用他的设计技巧,他制作了Labelbox产品的模型和早期草图,以及它的工作原理。“这让我们对解决方案空间有了更多的把握,并证实了我们还有发展的空间。”

手里拿着数据标签解决方案的静态草图,夏尔马和他的联合创始人开始与这些专家交谈。

“我们开始与旧金山或我们网络内的一些人工智能初创公司进行交谈。我们会带着Labelbox的想法和一个实物模型找到他们,问他们‘我很想向你们学习如何解决这些问题,’”夏尔马说。

他们从这群早期的人那里得到了非常复杂的反馈。

这个领域的许多专家都试图自己解决这个问题,他们告诉我们,标签盒是一个荒谬的想法,永远不会成功。他们说,不可能为这样一个定制的问题创造一个通用的产品解决方案。

夏尔马说,如果所有的反馈都是悲观的,他们可能不会继续下去。但根据Sharma的说法,这项工作的重点是了解当时人工智能社区最关心的是什么,以及专家们如何着手建立自己的协作数据标签工具。事实证明,在一片“不”的合唱中,也有一些粉丝。

夏尔马表示:“其他人工智能团队会告诉我们,我们的成果非常有趣,他们很乐意使用。”“几乎总是,他们在寻找自己的特殊用例,无论是标记医学图像还是地理空间无人机地图,但他们仍然表示愿意使用我们拥有的任何通用原型。”

创建一个收集反馈的框架

掌握了顶级人工智能专家如何构建协作数据标签产品的知识(或者更准确地说,专家是如何构建协作数据标签产品的)为了做到这一点,两位联合创始人的下一步是与更广泛的受众进行交流。

夏尔马说:“我们对一个好人的长相或他们的头衔没有任何歧视。”“我们寻找的是任何组织的技术领导者,无论他是首席技术官、副总裁、机器学习工程师,还是直接构建计算机视觉应用程序的产品经理。”

虽然联合创始人建立了一些标准,来判断哪些人是值得交谈和最终推销的好候选人,但他们认为,他们还需要一个合适的框架衡量他们收集到的任何反馈。

Sharma分享了他和他的联合创始人从早期客户对话中获得的两个信号,以此来确认Labelbox的想法是可以扩展的:

问题验证。“我们对自己在数据标签领域的经验一无所知,我们对市场形成了假设和假设。从其他人那里听到,是的,他们对可用的桌面工具感到沮丧,是的,他们正在内部构建解决方案,是的,他们计划在未来做更多的标签,从宏观层面上证实了我们的假设。”

解决方案的验证。“有些团队愿意向我们展示他们的内部工具,这很重要。我们能够绘制出他们的心智模型,他们如何处理数据类型,数据结构,以及我们正在处理的数据标记的相同工作流程。这对我们来说是一个更有力的信号,因为它让我们意识到,其他人也在试图解决我们提出的问题。”

在问题中设置护栏

Labelbox的产品市场之路之所以引人注目,是因为联合创始人在早期投入了大量时间来发现问题,而不是埋头苦干。

夏尔马说:“我们希望把大部分时间花在我们试图解决的正确问题上,然后转向并与未来的客户进行验证,这样当时机成熟时,我们就可以放手去做。”

在产品发现中,提出正确的问题占了一半以上的工作。关键是不要给人们提供解决方案,而是让他们以更抽象的方式发现问题。

为了确保他们以一种巧妙的方式做到这一点,夏尔马不仅透露了什么在早期的确认对话中要问的问题(剧透警告:都是关于开放式的问题),但是为什么创始人(尤其是技术型创始人)可以从中受益。

好的问题是开放式的,但要设置护栏。“这些问题包括‘你打算如何给你的数据贴上标签?’”You can learn a lot more when you leave the question open-ended, but the key is to set guardrails so the conversation doesn’t turn tangential. In this case, the parameters are data-labeling.”

好问题能让人放松。问“是”或“不是”的问题可能暗示着不存在的判断。“像这样的问题,‘你认为你愿意把时间和金钱投入到建立标签基础设施上吗?’会让人望而却步,”夏尔马说。相反,用同理心来领导。“问同样问题的更好方式是‘我们之前花了很多时间构建标签工具,并认为可能有更好的方法。我们想知道您是否可以分享一些您所面临的挑战的想法?’”

糟糕的问题是封闭的:这不仅不能提供你从开放式问题中获得的见解,而且你只展示了人们可以遵循的两个逻辑序列。你是在构建一个内部工具吗?是或不是。它关闭了对话,阻碍了对话走向有用的方向。”

随着会议越来越多,反馈也越来越多,夏尔马说,他的团队需要一个分水岭时刻,才能进入建设模式。这一刻发生在一次商务会议上,当时Labelbox的联合创始人丹•拉斯穆森(Dan Rasmuson)差点被挖走。

夏尔马说:“丹和我与一家大型医疗诊断成像公司的首席技术官进行了面对面的交流。“首席技术官告诉我们,他实际上想聘请Dan作为开发人员,构建和改进他们的内部数据标签工具。我们认为,如果有人愿意付钱给丹,让他为他们改善内部流程,这就足够让我们开始行动了。”

这是他们在开始构建产品V1之前需要进行的最后一项验证。

关于通过验证阶段,我坚信有两点:1。在它成为突破之前,你必须有一个疯狂的想法。2.你的想法要想获得成功,就必须既标新立异又正确。

寻找早期客户

在花了很长时间为一个不存在的产品画出模型,并努力获得热情的介绍后,夏尔马和他的联合创始人对Labelbox的销售前景充满信心。

夏尔马说:“当我们迅速拼凑出一个原型时,让一个工作产品的第一个版本精确无误并不是一个大问题。”“因为我们作为一个团队,对我们的问题陈述很有信心,我们相信,任何最终用户都会面临我们试图解决的痛点。”

夏尔马和他的联合创始人没有把资源用于大型的官方产品发布,而是开发了一个应用程序,人们可以免费注册并试用Labelbox的测试版。“当时,我们只是想尽快与ML社区分享我们所构建的内容,并找出它是否有用。我们采取了最快、最短的途径来接触用户。”

Labelbox团队没有试图获得引人注目的新闻报道,而是专注于有机地播种产品。

夏尔马说:“我们会把自己嵌入到社区内的这些对话中,并假设有资格的人会发现它,或者我们会在谷歌上搜索品牌,寻找解决方案的人会看到我们。”“Labelbox的第一天就是在Reddit上的不同机器学习论坛上发布测试应用程序。”

最初的Labelbox测试版发布于2018年1月在Reddit上发布。

对于希望在建立知名度和产品发现方面发挥创意的创始人,Sharma分享了他的团队能够带来Labelbox的更多精明方法是顾客,而不是顾客:

问答网站。“我们会研究人们在Quora等网站上关于数据标签的相关问题,并通过提供Labelbox作为解决方案来回答这些问题。”

维基百科。“我找到了一种方法,把自己作为维基百科上一篇关于数据注释工具的文章的要点之一。我们看到流量增加了40%,因为人们把那篇文章作为找到这些工具的途径。”

从一开始就测试定价

几天之内,Labelbox就找到了第一批用户。对夏尔马来说,合乎逻辑的下一步是立即开始试水价格。事实证明,这种以商业为导向的思维方式有利于带来早期收益。

Sharma和他的团队在跟踪每一个他们看到的使用产品的早期用户方面都很有策略,他们抓住机会向他们征求反馈。他们给这些早期客户发了邮件,问了以下问题:

“你是怎么知道我们的?”

“你为什么在这里?”

“你想让我们做什么?”

通过收集早期反馈,他们能够精确地调整产品的功能在付费墙后面,然后评估一下人们对Labelbox这样的东西会有多少兴趣。

夏尔马说:“我们没有一个预先考虑好的定价系统,也没有接受投标或类似的东西,但我们知道我们需要收费并开始测试定价。”

联合创始人决定提供免费版和专业版Labelbox。“专业版包含了额外的东西,比如更大的数据容量,”夏尔马说。“我们开始每月收费100美元。随着需求的增加,我们也毫不犹豫地提高了价格。在几周的时间里,我们每月收费200美元,客户不断涌入。

今年1月,Labelbox在Reddit上发布了非官方测试版,三个月后,它的日活跃用户开始增加。夏尔马说:“我们注册了Hubspot的免费版本,并开始建立一个渠道,追踪客户的转换情况。”“我们围绕免费和付费版本制定了一个粗略的定价体系。任何需要专业知识的人都可以直接与我们联合创始人交谈。”

瞄准企业

Labelbox在推出时考虑的是面向小型机构的自助服务模式,但该产品一开始就吸引了大公司的注意。

许多通过维基百科链接和社区聊天论坛找到Labelbox的早期客户都是企业。出版巨头康泰纳仕是第一批向夏尔马及其团队伸出援助之手,要求签署合同的公司之一。

夏尔马表示:“当我们在运营的第二个月看到康德纳仕(condnast)进入时,我们就去和他们的团队交谈。“我记得在一次会议上,我们当场签了2万美元。我们的服务价格从每月100美元开始,在60天的时间里,我们签订了一份每年2万美元的合同。那时我们对自己的定价模式非常有信心。”

限定并确定优先级

随着condnast的签约,ARR达到10万美元,更多的大品牌也将在2018年4月前推出——夏尔马和联合创始人实施了一个简单的系统,以确保他们有效地组织渠道顶端。

夏尔马说:“我们开始优先考虑正在筹备或注册名单中的企业标识,并向他们发送电子邮件,询问我们还能为他们解决什么问题。”

这意味着Labelbox的前四到五个客户都是企业公司。

两位创始人进入了一种熟悉的节奏。团队将构建新功能(主要是应公司的要求),将其推广到现有客户的邮件列表中,并对管道中的其他入站请求进行额外的扩展。

在花了足够的时间来验证想法并构建产品的V1之后,速度突然进入了高速。“我们发货的速度非常快。我认为Dan在一年的时间里发布了50万行代码,”Sharma说。

这个过程进行得相当顺利,但为了让Labelbox以更快的速度发展,他们需要更多的工程师。夏尔马和他的联合创始人开始了他们的第一轮融资。

2018年7月,Labelbox完成了由凯鹏华盈(Kleiner Perkins)领投、First round Capital参与的390万美元种子轮融资。“种子轮融资对我们来说是一个重要的里程碑,因为我们看到了很多社区的吸引力。我们最初并没有计划筹集风险资本,然而,筹集资金是满足需求同时提供良好客户体验的唯一途径。在成立的三个月内,我们开始吸引投资者的兴趣,甚至得到了加入Y Combinator的邀请。我们最终决定结束种子轮融资,专注于公司建设。”

对于Labelbox在种子轮融资后获得的投资者吸引力,夏尔马并不是在开玩笑。有了银行的新资金,Labelbox聘请和扩大了团队,Labelbox继续建设,迭代核心产品,并签下了更多的企业作为客户。到2018年底,Labelbox总共有37个客户,好事达(Allstate)和拜耳(Bayer)等公司的合同带来了超过六位数的收入。

持续增长的不仅仅是客户合同。到2019年初,每个月有超过100万个数据资产在他们的平台上被标记。到当年第一季度末,Labelbox的年度经常性收入即将达到100万美元。“这意味着在不到一年的时间里,我们从一个纸上的想法变成了一个百万美元的运行率。”

雪球效应仍在继续。到2019年6月,Labelbox筹集了一笔资金A轮融资1000万美元,由Gradient Ventures领投。

那年晚些时候,安德森-霍洛维茨基金(Andreessen Horowitz)的投资者找到了夏尔马和里格尔。“他们一直在研究这个领域,并建立了一个论点,即市场需要一个可以成为软件玩家的公司一个破坏者。经过多次反复的谈话、会议和交流,Labelbox选择了这家公司来领投他们2500万美元的B轮融资。

夏尔马说:“我们筹款的方式是优先考虑与我们遇到的人之间的化学反应。”“只要我们的估值、指标和参数都是合理的,我们就会做交易,这就是我们进行a轮和b轮融资的方式。”

期待

自Labelbox于2018年推出以来,这个数据标签工具已经发展成为D轮创业公司,筹集了超过1.88亿美元的资金,每月处理超过100万份上传到其平台的数字资产。

最初的Labelbox想法已经扩展到一个多产品套件。2020年,Labelbox发布了一款名为Boost的产品,这是一个数据标签服务市场。2021年初,Model作为调试和性能增强工具发布。他们的数据和分析工具Catalog于2022年发布。“我们一直在尝试这些想法,但在过去的几年里,我们真的觉得我们拥有整个套件中最大的产品市场。

人工智能生态系统在不断发展,随着公司尝试发布产品生成的人工智能夏尔马确信,Labelbox也会随之成长。