工程

你的数据是你的命脉——建立它应得的分析

本波特菲尔德在领英的个人资料中,他只是简单地把自己定义为“经验丰富的冲浪者——这是一个准确的绰号。除了经常在圣克鲁斯海岸冲浪外,他还在许多初创公司冲浪。首先是作为首席工程师粘性的公司。后来,他成为了手机创业公司Rally Up的联合创始人美国在线在2010年),他是那种让连续创业看起来很容易的人,即使事实并非如此。

作为联合创始人和副总裁美人波特菲尔德带领一群工程师开发商业智能软件,帮助企业做出更好的决策。该公司的客户范围从早期创业公司到今天的巨头(Etsy、索尼、迪士尼和雅虎,仅举几例),该公司已经看到了无数公司如何选择设置他们的分析,他们的错误在哪里,以及为什么早期开始是至关重要的。

分析是一件很容易被推迟的事情。当你正在积极建立一家公司并试图找出你的价值主张时,收集和拼接数据似乎并不重要或为时过早。但是,突然之间,你遇到了一个问题,事情变得复杂起来,你需要更好地了解你的客户,你有很多不可用的数据,因为你以错误的方式捕获它们——或者根本没有捕获它们。

在这次独家采访中,Porterfield解释了所有创始人如何从一开始就确定分析基础设施,并分享了他的智慧,包括存储数据的位置、使用的最佳工具、要避免的常见错误,以及今天开始采取正确行动时应该衡量的内容。

说真的,不要等待

一旦你的公司有了用户,你就需要建立一个可靠的分析框架。这不是浪费时间和金钱。

你的冲动可能是节省资源,让现有的工程师拼凑一个内部解决方案来完成这项工作,只跟踪和存储一组最基本的指标。波特菲尔德已经看到许多公司屈服于这种诱惑,结果并不好。花时间和金钱去寻找从一开始就具有稳定性和支持的可靠工具是非常值得的。原因如下:

团队中的每个人都能从轻松访问数据中受益。

将分析列为优先事项意味着要让公司的每个人都能使用它——而不仅仅是技术人员。波特菲尔德说:“你希望每个人都能看到数据,并从中获得意义。”“这应该成为公司里每个人的价值观,尤其是那些直接与客户打交道的人。工程师在将数据移交给销售或客户服务之前,不应该存在任何竖井。这浪费了宝贵的时间。”正确的工具使公司中的任何人都可以很容易地找到他们需要的信息并对其采取行动——而不仅仅是工程。

在构建分析框架时,用于访问数据的自助服务工具是关键,因为最接近问题的人通常是经营业务收入端的人。“我一直在倡导自助服务工具。改变游戏规则的见解并不总是来自分析师或数据科学团队。”“他们通常来自最接近问题的用户,了解产品流程,知道如何提出正确的问题。”

波特菲尔德说,当你将数据直接嵌入到员工执行大部分工作的日常应用程序中时,你不仅是在鼓励使用,还在创造一种数据驱动的文化。

从业务运营的角度来看,自助服务平台可以帮助IT和数据科学家以一种对每个人都更好的方式分配他们的时间。他们可以将更多的注意力集中在产品路线图或更复杂的问题上。

正确的工具可以消除瓶颈。

“数据团队经常会给公司的其他部门带来瓶颈。IT不应该做图书管理员的工作,为那些需要它的人检索和解释数据,”波特菲尔德说。

Todd Lehr,高级副总裁一元剃须俱乐部与Porterfield分享了一个相关的故事:“我们有一个名叫Juan的开发人员,我们需要的任何报告都会通过他来完成。当他的工作积压时,我们称之为“胡安问题”,因为我们的团队无法立即访问数据。”

使用自助服务工具,公司将大大减少像Juan这样的开发人员需要管理的查询队列。然后,工程师可以优先考虑构建产品,并更快地将产品推向市场。

聪明人在分析时常犯的6个错误

聪明的人总是搞砸他们的分析基础设施。从第一天开始就做好并不容易。这需要很多公司认为他们没有的时间。很快就会变得非常复杂。在与大量处理这些问题的公司交谈后,波特菲尔德总结出了公司经常弄乱数据的六大方式。

1.你走得太快了。

也许你一开始就没有看数据。有相当数量的公司直到迫不得已时才会收集和咨询数据。

“早期的公司往往有同样的咒语,‘建造,建造,再建造。波特菲尔德说:“但由于创业公司大多数时候都很匆忙,他们并不真正了解用户粘性——产品是如何被使用的,产品的哪些部分是有效的,以及为什么你的用户会回来。”“用户粘性非常重要地反映了人们对产品的反应。不查看数据,我们无从得知。”

2.你没有追踪足够多的东西。

你不能只给你的团队一个顶线指标或总销售数字的快照。如果你这样做了,而不深入研究事情是如何随着时间变化的(即使是每天),你就不会发现真正促使事情发生的潜在力量。你没有办法看到产品的细微变化或市场趋势对销售或参与度的影响。也没有理由追踪得太少。数据存储非常便宜,这不再是一个问题。

同时分析很多东西是没有风险的。“人们似乎害怕跟踪很多东西,因为他们认为他们会耗尽空间,使系统陷入困境,或者查询时间太长——但它很便宜——所以跟踪更多总是一种胜利,”波特菲尔德说。“如果你追踪得不够,你就学不到足够的东西。”

没有追踪到足够多的东西可能会导致森林大火。一开始只是小的权衡,但最终会影响到你的整个业务。

不要害怕音量。“在这一点上,空间不足不应该是一个问题,”他说。“初创公司通常不处理大数据,只有在特定的情况下,比如你每秒要分析数百万笔交易,或者你打开了Twitter的消防水管。但如果是这样的话,你可以用Hadoop.不过,很少有创业公司有这么大的数据量需要处理——如果你有,那就太幸运了。”

人们真的需要克服对拥有太多数据的恐惧。如果你不用它,没关系。但我保证你会希望你一直拥有它。

3.你的大部分队员还在瞎飞。

“很多公司认为他们可以把数据扔进去Mixpanel年只有或者谷歌Analytics,这就是他们所需要的,但他们并没有真正考虑过团队中谁需要获得这些见解。”“你真的必须告诉你公司的每个人,他们应该随时查阅你的数据,并做出数据驱动的决策。否则,你的产品团队只会一味地追求最好的结果,永远不会真正理解事物成功或失败的原因。”

假设你经营着一家需要获取更多用户的公司。你决定应用已被证实的病毒式传播应用技术,并利用现有用户的联系人来吸引他们。突然间,你会看到新用户大量涌入,这很好,但如果你没有衡量正确的东西,你可能会完全忽略这个功能对现有用户的影响。在这种情况下,人们注册后,不断收到垃圾邮件,将他们的其他网络连接到你的产品,最后退出。你的产品团队可能会宣布这个功能是成功的,即使它的用户流失率很高。

你可能还会获得一群不值得你在此过程中失去的用户。这些都是经常发生的基本错误。但是,通过让你的分析基础设施简单直观地供每个人访问和利用来回答最重要的问题,这些问题可以很容易地得到解决他们的就业机会。

4.你把东西放错地方了。

首先,让我们看看谁做得对。Porterfield引用了一个lookker客户的例子,该客户使用了一个定制的分析架构,该架构是由一个独特的组合构建的NoSQL红移运动和lookker。这个框架不仅可以大规模地捕获和存储自己的数据,还可以处理每月数百万访问者的点击流数据,并允许任何人进行查询。这种策略还允许非sql使用者(业务用户和分析师)深入了解数据的含义。

波特菲尔德说:“从本质上讲,如果你不能用SQL(分析的通用语言)访问数据,你就完蛋了。”“如果它将需要工程工作来获取数据(对于Hadoop,它可能需要编写工作),那么你将自己置于堕天使之后。”

在这种情况下,工程师必须做更多的工作来为业务用户提供他们需要的信息。而且,即使您可以访问原始数据,工程师也可能不得不构建或购买工具来帮助业务用户理解它。这使得运行优化营销或销售的实验成为一个复杂的考验,最终用户根本不会在同一水平上使用数据。

你需要确保所有的数据都在同一个地方。这是关键任务。

假设同一家公司没有注意到病毒式传播技术的影响,也没有将所有数据放在相同的模式中,因此他们无法轻松创建查询来了解他们的事件如何相互关联。他们无法同时看到这些数字,因此无法同时查询运营数据和事件数据。

“许多公司将数据发送到某个服务来存储,但一旦存储完毕,就不能再以相同的形式访问了;它需要工程技术才能把它弄回来,”波特菲尔德说。“其中太多是事件数据——显示你的网站或产品发生了什么事情的指标。这是非常有价值的东西。当您将事件数据与数据库中的操作事务组合在一起时,您将了解哪些事件触发了转换。将运营数据与事件数据结合起来的价值在于,你可以通过你的产品或服务了解用户的旅程——没有什么比这更重要了。”

令人震惊的是,许多公司没有捕获所有的运营数据,这意味着他们根本不知道他们的公司在任何给定的时间在做什么。

运营数据可能包括出货数量、退货数量以及公司正在采取的任何行动。事件数据是关于客户和用户在您的站点上的行为。这两者是紧密联系在一起的,最健康的公司清楚地知道它们在任何时候都是如何相互影响的。

即便如此,Porterfield看到的公司中,约有一半将运营数据和事件数据分开。这些客户仍然能够得出结论,但他们无法全面了解用户做出某些决定的原因。如果公司想知道哪些事件导致了转换,那么他们需要将这些数据合并到同一个中心位置。

只看其中一个是有危险的。波特菲尔德说:“如果你不看运营数据,那么你就无法控制自己的业务,这是一个大问题。”“如果你不查看事件数据,那么你就不了解你的产品使用情况,你就不能对下一步构建什么做出正确的决定。它们是相辅相成的。”

5.你看得不够远。

任何优秀的分析系统都是为长寿而设计和建造的。“是的,你可以随时改变你的分析框架,但请记住,数据是沉重的。你拥有的越多,就越难从一个系统转移到另一个系统。如果你决定改变一些事情,那将是一个真正的痛苦,而且会随着公司的发展而变得更糟。”

移动数据花费了很多人很多时间。通常,在进行转换时,必须在两个不同的地方跟踪数据——旧的存储库和新的存储库。这是确保你在运输过程中不丢失任何东西的唯一方法。

这是从一开始就把事情做好的动力。最好的做法是把所有东西都放到一个分析数据库中,这样你就可以随着公司的发展而扩展。“不要浪费宝贵的时间在大量不同的数据库解决方案之间进行选择。只要选择一个能让你扩大容量的地方,而不是把所有东西都搬到新的地方,”波特菲尔德说。“一开始你所需要的只是一种跟踪事件的方法,并将这些数据放在事务性数据库旁边,这样你就可以对它们进行查询。这对大多数公司来说至少可以维持一到两年。”

当这不再是一个可行的解决方案时,只需增加容量。你不需要把任何东西拖到任何地方。你捕捉到了最重要的东西:不同的行为和产品变化如何影响交互和事务。这是企业最值得借鉴的地方,可以设计出更好的产品路线图和营销策略。

6.你over-summarize。

虽然这个问题在拥有大数据科学团队的公司中更为常见,但对于处于早期阶段的初创公司来说,这也是一个警示。当您试图通过卷起数据来简化数据或减小数据大小时,可能会丢失大量重要信息。

想想看:有多少公司跟踪的是每分钟的平均销量,而不是每分钟的具体销量?“这是一种老式的分析实践,”波特菲尔德说。“在过去,公司不得不将数据立方体或卷起来,因为他们的系统太慢,无法以其他方式处理数据。这已经不是问题了。现在它实际上有可能冻结帧发生了什么与您的业务在每一分钟。查看这些快照可以告诉你很多关于转化率下降或上升的原因。”

当您预先聚合时,您将失去向下钻取和查看异常值的能力,这些异常值可以告诉您某些东西是否坏了,或者某些东西是否运行得非常好。你失去了最具教育意义的指标。

对于团队来说,查看高级指标是很常见的——比如显示在仪表板上的销售额。这可以随意地提供信息、激励和帮助。但波特菲尔德说,你不应该根据这种情报做出任何重大决定。他一直对仪表盘持怀疑态度。

真的,这么多的仪表盘看起来完全没用——它们显示的任何东西都不会改变任何人的一天。

“你不应该为了自我感觉良好而把时间浪费在看数字上。你应该通过观察数字来学习如何做不同的事情。一个好的仪表盘通过向你显示异常值来改变行为。”

抵制过度总结的冲动。它埋藏着有潜力改变你公司的宝石。

避免这些错误的3个最简单的方法

波特菲尔德说,首先,避免这些错误能帮你省下的钱比你想象的多得多。

它们不仅会让你失去对业务和日常运营的控制,而且很容易投入大量的工程时间和资源来修补有缺陷的系统。如果你不小心,你的工程师可能会花费昂贵的时间为你的销售团队破译数据。你的营销人员可能会错过各种最大化用户粘性的机会。不要冒险。

每当数据难以访问或理解时,您的业务就会进一步落后,因为人们的决策速度越来越慢。

好消息是,如果你在开始获取用户或客户时将分析放在首位,你就可以采取三个简单的保护措施来避免这些陷阱:

1.任命一名商业智能工程师。

如果你选择一个对分析感兴趣的人,并让他们找出最有效的方法来记录数据,你将为每个人节省大量的时间。分析支持不会分散到整个工程团队,这个人将有更多的动力去找出最低提升的方法来获取您需要的洞察。

“在Looker,这个人写了一个脚本来记录我们产品中的所有事件,”Porterfield说。“这使得把所有这些日志都放在一个数据库中变得很容易,我们知道当我们需要数据时,我们可以把数据取出来。这为每个人节省了大量时间,最终成为最简单的解决方案。”

2.拥有你的数据。

强烈建议使用开源分析平台,让你实时跟踪所有与你的产品相关的事件,比如Snowplow。它使用起来相对容易,支持良好,可伸缩性强,而且——最重要的是——它是免费的。它还与您可能正在使用的框架的其他部分兼容。

3.将数据放入Redshift或其他大型并行处理数据库尽快。

对于早期公司来说,像Redshift这样的云托管mpp通常是最好的解决方案,因为它们成本低,易于部署和管理,而且扩展性好。理想情况下,您希望从公司记录历史的最开始就将事件和运营数据保存在Amazon Redshift中。波特菲尔德说:“使用红移的优势是这个平台便宜、快速、容易访问。”此外,对于那些使用AWS的人来说,它可以无缝连接到现有的基础设施,因此很容易将数据管道直接构建到系统中,从而便于分析。

他说:“红移让你可以灵活地存储大量非常细粒度的数据,而无需根据事件量等任意内容向你收费。”“其他解决方案会根据你存储的事件数量收费,所以当越来越多的人使用你的产品并采取行动时,最终成本会飙升。”

波特菲尔德在瞭望者圣克鲁斯总部的屋顶上。

如何使用指标赢得市场

分析的好坏取决于它能帮助你的公司做什么。在一家初创公司,所有的数据都应该被用来实现你在公司的每个阶段所定义的成功。波特菲尔德说:“成功的衡量标准是你希望发生的任何事情——通常是参与度。”

例如,一家快递公司可能想要跟踪送货所花费的平均时间。这是有用的,但只有在适当的情况下(毕竟,收件人可能在一个街区外或数百英里外)。送货时间远没有收到包裹的人的快乐重要。确保你的成功指标捕捉到正确的东西。

确定你的主要期望结果:你想让你的客户体验什么?基于预期结果的一些常见成功指标是转化率(如果某人做了某件事,他们购买的可能性有多大)、交易时间(用户购买之前多长时间)和流失率(用户可能永远不会再购买)。你希望转化率很高,而其他两项则很低,甚至在下降。

只关注重要的参与度:不同的公司重视不同程度的参与。什么对你来说是重要的?你可能希望有人反复回到我们的应用,或者你想要回头客。看看将这些关系呈现出来的数字

Upworthy例如,重新定义了他们感兴趣的参与类型,”波特菲尔德说。“通常媒体网站的成功建立在纯粹的页面浏览量上,但他们开始关注他们所谓的‘注意力分钟数’——人们似乎在一个页面上投入了多少时间,他们是否在突出显示单词、滚动页面、点击鼠标、观看视频等等。他们不只是想知道人们在一个页面上停留了多长时间,他们还想追踪人们对他们在每个页面上看到的内容感兴趣的时间。”

这帮助该网站开创了新型标题、布局和内容选择——所有这些都是为了吸引人们更长时间的注意力。在这样做的过程中,他们彻底改变了媒体网站衡量和与观众交流的方式。

衡量回头客的留存率和行为:成功指标也可以归入运营指标和事件指标。确保你同时关注这两方面,以真正理解是什么力量在起作用。

波特菲尔德解释道:“如果你只关注运营指标,你就会知道是否有人回到你的网站,是否买了东西。“这很好,但你总是想知道有多少人回来浏览,但没有购买任何东西。他们为什么要这么做?这是合并数据的一个巨大论据。如果不结合运营数据和事件数据,就无法找到这些答案。”

事件数据将显示非购买访问者如何浏览您的网站或应用程序,什么吸引了他们的注意力,他们点击了哪里,以及在他们离开之前发生了什么。当您跟踪此路径时,您可以修改行为。例如,下次你可以向他们展示一些不同的东西,这会增加他们购买的机会。

发明新的度量标准:为了跟踪对您的业务最有价值和最有影响力的东西,您必须创建特定于您的独特度量标准。这其中有三件事:

识别用户行为类型。

衡量你的观众表现出这种行为的百分比。

对这些数字进行实验,看看这是否真的是需要捕捉的关键信息。

有时候,发明一种新的度量标准可以给你的公司带来很大的不同。问问Venmo

不久前,这款支付应用的支持团队开始从用户那里听到,许多人不小心向朋友付款,而不是向他们要求付款。这些按钮紧挨着。很容易滑倒。虽然该公司知道发生了这种情况,但他们不确定这个问题有多普遍,也不确定是否值得优先解决。为了了解更多,他们利用了他们的分析。

Venmo团队能够围绕支付/收费错误发明一种新的度量标准,以查看问题发生的频率。为了做到这一点,他们假设按钮周围存在混淆,并强调了用户会向某人支付一定金额,然后最终向那个人收取两倍金额的例子。这种行为隔离了这种特殊的混乱,团队能够看到这确实是一个大问题。在他们的下一次软件更新中,他们取消了默认付款的并排按钮。同样的新指标表明,问题很快得到了解决。

让你的指标可共享

只有当你能在整个公司共享数据时,分析才会有用。波特菲尔德说:“当你分享指标时,最大的麻烦就是把你的术语命名错了。“你必须对每件事情的含义都非常清楚。”为了实现这一点,他建议在你的维基或其他中心创建一个分析术语表,这样人们就知道你正在使用的术语,以及如何解释你分享的数据。

他说:“我见过一些数据被冠以荒谬的名字,这些词甚至不能准确地描述它是什么。”“人们喜欢用‘比率’这个词,而不是更准确地说,他们在看一个值而不是另一个值。这种事情会导致严重的、普遍的混乱。”

数据是成功公司的命脉。共享它不仅创造了一种健康的透明感,还在应该一起工作的业务部门之间建立了一致性。您不希望看到每个人都在通过多个数据源查找数据。

同一家公司的两个营销人员——都关心点击率——通过不同的方式追踪这些数据是很常见的。也许一个人是通过BI工具找到的,而另一个人则向工程师寻求帮助。最后,他们可能会对同一个问题给出两种不同的答案。

你的员工需要一种集中一致的方式来访问他们工作所需的数据。

波特菲尔德说,你也不能止步于让数据普遍可用——你还必须让从这些数据中得出的见解易于分享。“洞察力是一个情境化的数据点,它让你改变某事或采取行动。对你公司的大多数人来说,重要的是洞察力,而不是原始的数字。”

正确的分析基础设施可以使共享有洞察力的数据可视化(图表)和深入挖掘最细粒度的细节一样容易。可视化是使数据对整个团队有意义的一种方法。

“大多数人看图表比看表格更清楚。数据库提供数据。可视化可以帮助你理解它,”波特菲尔德说。“无论你选择哪种分析系统,可视化功能都会让分享变得更容易、更频繁、更流畅。”

错误的分析框架会削弱人们的能力。它将你的公司划分为了解数据的人和不了解数据的人。

这是有害的,而且经常发生。如果您最不懂技术的业务用户可以直观地创建队列图表并立即理解它,那么您就知道您选择了正确的系统。这是你在选择分析工具或软件时应该考虑的底线。

最重要的是,正确的系统是用户友好的和可共享的,它使你的整个公司更加以客户和产品为中心。最重要的是,你希望你的数据能驱使每个人问同样的问题:“下一步是什么?”

“分析能让人们在开会时更有准备。这让团队更好地提出问题,如何才能满足用户的需求和需求。”“它消除了猜测。人们不再需要猜测他们的用户在寻找什么,或者是什么让他们购买、点击或过早离开。他们不需要猜测他们的同事知道或不知道什么。这就是第一次就做对分析的回报——非常重要。”

摄影的迈克尔·乔治。