您的位置 首页 赚钱项目

Airbnb的万能数据科学家:从搜索到体验

Airbnb从一家提供独特住宿场所的小众网站开始,快速发展到如今引领旅游和住宿潮流的独角兽公司,同时在上升过程中也获得了大量媒体曝光和品牌认知。但要在几年之内达到这样的成就(估值310亿美元),过程绝非易事。

Airbnb这家在共享经济理念下催生出来的旅行房屋租赁服务网站,最开始成立的原因其实很艰难。它的两位创始人布莱恩(Brian Chesky)和乔(Joe Gebbia)因为无法负担旧金山的公寓租金,而在他们自己的客厅里加了几张小床,开始接待三位来参加会议,却因当地宾馆满员而找不到地方住的远方旅客,并为他们提供每日早餐。就是因为这样,后来的公司全名就叫做Airbedandbreakfast(空中食宿)。最初的理念旨在为出行远方却无法预定到当地住宿的人们能提供一个临时居住地,同时带有房东亲手做的早餐与商务社交联系的机会。

自成立以来,Airbnb就毫不掩饰其对于数据的重视——他们使用数据科学来开发新产品,改善服务质量和创新营销策略。今天这篇文章就介绍了他们是如何使用数据来提升自己的产品和市场营销,以及我们可以从中学到些什么?

数据是客户的声音,数据科学是对此声音的最好诠释

Airbnb的前数据科学主管Riley Newman曾这样说过,公司将数据视为客户的声音,而数据科学就是对此声音的最好诠释。更难能可贵的是,Airbnb的数据科学家并没有只是死板地坐在小隔间的桌子前,分析表格里的一个个数字。相反,他们积极地参与到各种团队中去,直接与工程师、设计师、产品经理和各个团队中的其他人交流合作。

使用数据改善搜索

搜索功能是Airbnb网站的核心。经过精心调整,公司希望其搜索功能可以起到在每一个步骤上都能激发、惊喜和取悦客户的作用。但这并不简单, 最初,Airbnb不知道要提供什么样的数据给客户,因此他们决定用一种模型,能根据用户的搜索返回一定半径范围内的最高质量住宿列表。

随着越来越多的用户访问网站,Airbnb便获得了更多的数据,因而就能够用一个受更多用户数据驱动的搜索方式来取代之前那个基本的搜索模型。Newman解释说:

“…我们决定让我们的社区和用户来解决我们的问题。通过使用用户和房东之间的互动所产生的丰富的数据,我们可以建立一个模型,该模型估算了当用户搜索城市时,在其中某个地方生成房间预定的概率。这样一来,举个例子,当某用户搜索“旧金山”时,Airbnb会把之前同样搜索过“旧金山”并经常发生预定的几个社区呈现给当前用户,比如旧金山的“教会区”和“下海特区”都是以前热门的房间预订地区。

Airbnb还使用数据来按照人口统计地定制搜索体验。他们在2014年就注意到,某些亚洲国家/地区的用户访问首页时的跳出率通常很高。经过进一步的数据分析,他们发现当这些用户点击“邻里”这个链接,并开始浏览照片后,就再也不会回到之前的页面去预定住宿了。

发现问题的数据科学家向工程团队展示了该问题,工程团队为这些国家的用户重新设计了一个新的版本, 将在这些国家的住房页面上的“邻里链接”替换成了中国、日本、韩国和新加坡等亚洲国家的热门旅行地。 结果,来自这些国家的用户转化率提高了10%。

通过数据确定房东偏好

Airbnb的经营原理很简单:把想找住处的人和想出租房子的人匹配起来。现任Airbnb数据科学家Bar Ifrach是通过一个朋友发现了这个网站。当他在研究生期间进行假期旅行时,他的朋友想把这段时间的空房提供给其他人居住,并且这位朋友想在他离开的1-2周内安排尽可能多的住房申请。因此,他会根据怎样可以最大化这段时间的住宿率来决定是否接受住宿申请。

Ifrach对这一情节始终记忆深刻,因而基于此给自己创建了一个小型研究项目。研究的问题是——什么因素会影响房东接受申请的决定?

虽然并不是所有房东的想法都跟Ifrach的朋友一样,但是希望这样做的房东都会尽量避免租客入住和退房的间隔出现以下情况:

Ifrach将他朋友的这一想法应用到了整个Airbnb的房东群体上,然后发现,房东更容易接受符合他们日程安排的租客请求,同时最小化租客入住和退房的间隔:

但这样的安排完全适用于所有市场吗?或者,大市场和小市场会有不同吗?明智的数据科学家需要带有这样的疑问,并且事实证明这个结果相当令人吃惊:

从上图可以看到,在一些大的地区市场,房东倾向一波波住客的住房日期之间没有间隔,然而,对于小市场来说,这些地方的房东更希望能有一些间隔。

这个研究之后从一个小的研究项目变成了一套成熟的机器学习算法。Ifrach与Airbnb的一名工程师合作,创建了一个应用程序,该应用程序会基于房东和租客双方的偏好,对结果进行个性化处理,以确保更准确的匹配。

在这个应用程序里,Airbnb的数据科学家对多方面进行了研究,从房东之前接受与拒绝申请的记录,到某个住宿订单本身的细节。他们没有给算法添加太多的干扰,而是创建了一组过滤器,并通过如下图所示的流程图进行应用:

为了测试这一应用的运作效果如何,他们进行了一个实验,这个实验使用了概率以及一个将其他偏好也考虑在内的排序算法。这个实验的主要目标是测试请求住宿的客户可以获得预订的可能性。由于采用了这些新的筛选条件以及考虑了用户偏好,Airbnb的预订转化率提高了近4%,租客和房东成功匹配的次数也显著增加——这是一种双赢。

创造“Airbnb体验”

数据科学应用在Airbnb的真正核心是提高用户的“Airbnb体验”——租客到房东那里旅行,受到欢迎和招待,安顿下来,开始居住和游玩,这些都是可以通过网站和应用程序来建立或破坏用户体验的方面。对Airbnb本身来说这些数据都非常有价值,因为可以通过他们了解用户旅行的质量。

他们使用净推荐值(NPS,Net Promoter Score)来衡量这种体验,NPS是于2003年引入的一种衡量客户忠诚度的指标。NPS的实质是在问,“你推荐Airbnb的可能性有多大?”

因为Airbnb希望“可能性推荐(LTR)” 指标能尽可能做出准确的预测,他们还控制了其他参数,包括:

  • 总体评价和一些子类别评价(1-5分)

  • 获取客户渠道(非付费搜索或付费营销活动)

  • 旅行目的地

  • 客户初始所在地

  • 客户在Airbnb上的预订记录

  • 旅行时间长度

  • 同行客户数量

  • 每晚价格

  • 结帐月份(考虑到季节性)

  • 房间类型(整套房子、单个房间、共享房间)

  • 房东列出的其他住房

Airbnb承认,其他一些因素也会影响客户忠诚度(比如口碑传播),但这些因素无法衡量。由于评价本身对Airbnb的整体体验如何非常重要,公司想要确定净推荐值(“推荐可能性LTR”)是否相比单纯用评价更能增加用户二次预订的预测准确性。

在这种情况下,数据科学家们对预测准确性的测试加上了“推荐可能性LTR”和“子类别评价”的因素,来看它们在预测用户二次预定的准确性如何。结果如下:

在这项研究的结果中Airbnb发现,旅行后的评价(包括推荐的可能性)只是略微提高了他们对于用户何时会再次预订的预测能力。换句话说,仅凭借用户旅行后的评价和NPS对于数据科学家预测用户何时进行下次预定起到的帮助甚微。

在这种特殊情况下,如果不是因为数据科学家和团队里其他成员进行深入研究,使用评价加上NPS值来研究预测未来预定情况的准确性,Airbnb永远不会知道这一模型是否可以真的应用到提高了用户体验之后的再次预定可能性的预测中,并影响到Airbnb的营收——这就是另一个数据科学帮助企业节省了时间和金钱的例子,尽管事情最终未能按理想的方式进行。

对比测试来调整流程

和所有聪明、前沿的公司一样,Airbnb也大量使用了对比测试。他们称这些为“实验”,并在从概念提出到完成再到优化的每个发展阶段定期进行。然而,在很多情况下,其实很难判断一个特定的产品或产品变化带来的影响有多大。

Airbnb有自己的内部A/B测试框架,而不是使用外部即成的一些解决方案,原因是它在商业模式和客户体验方面,比一般的那种简单改变页面按钮颜色的对比测试并衡量测试效果的需求更为复杂。

例如,无论用户是否登录,他们都可以浏览Airbnb。这使得将操作绑定到特定用户并进行追踪成为一个挑战。用户也可能先在自己的移动设备上浏览,然后回到家再通过家里的电脑完成预订。

此外,成功的预订还取决于租客的要求(和房源)以及房东是否及时回应——这些都是Airbnb无法控制的因素。

虽然Airbnb已经简化了一些流程,但是其预订流程仍然非常复杂。Airbnb主要关注搜索到最终预订之间的转化率,尽管这中间有几个步骤:

“转化”的大部分情况下是租客在特定地区寻找住处,房东设定价格,双方共同商定并办理必要的手续。在这个过程中会有很多内在的小障碍,这也是为什么“实验”是如此重要。

在另一个例子中,Airbnb会为房东提供专业的拍照服务,因为它们认为,如果在搜索结果中提供漂亮的全彩照片,用户会在过程中有更好的体验:

在测试这个新设计时,他们发现这一行为中断了某些微软网页浏览器旧版本上的重要点击操作(这并不是测试中非常罕见的问题)。在修复这个问题的过程中,他们还继续进行了其他测试,并有了更多重大发现——关于一些变动是怎样对不同用户组产生影响的。

因此,他们对于变动的调整必须非常谨慎,避免在实际没有变化的情况下却推断有变化,否则会使结果产生偏差,从而对之后的决策产生负面影响。

数据处理多样性

Airbnb不仅用数据来改善他们的服务和搜索,还用数据来改善他们的雇佣方式。他们非常乐意聘用女性数据科学家,并确保在聘用过程中不会存在偏见。他们采用了与优化转化过程很相似的方法来衡量招聘漏斗的最顶端——申请环节,并发现在过去,女性大概占到了全部工作申请人数的30%左右。

但是仅仅“雇佣更多女性员工”这个想法还不够。在以前,“数据科学家”这个工作并不是大多数年轻女性的梦想职业,所以导致现在提供给想要从事这方面工作的女生的机会变得很少。因此,Airbnb想为此做出改变,从“雇佣更多女员工” 到 “在更多部门中(特别以数据科学家为主的营销科学等部门)雇佣更多女员工”。Airbnb为了这样的改变创建了多种多样的活动,吸引了来自各行各业具备数据科学背景的女生来演讲、合作和交流。这些活动得到了女性数据科学家们的大力支持。

然而这些还不是结束。Airbnb严格把控面试过程,以确保应聘者不仅在工作能力和沟通能力上面与公司要求是匹配的,而且在文化上面也是如此。他们通过一对一交流、成果演示和测试等面试过程来检测应聘者是否在工作能力和文化上与公司要求完全匹配。

就像是每家公司会分析客户旅程以提高最终转化率一样,Airbnb采用同样的方式着眼于公司招聘中的每一个环节,从候选人在一群让人倍感紧张的男性数据科学家面试官前交流表达,到因为对“成功”带有主观看法而在评估测验时可能存有偏见的整个应聘过程中,Airbnb都时时把控这样的事情不会发生。   

最终结果是,他们不仅招到了更多女性数据科学家,而且申请人的质量和应聘经历整体也得到了极大改善。

我们可以从Airbnb的数据科学中学到什么?

以上这些例子,不管是Airbnb证明了、否认了或者在此过程中发现了其他趋势或令人惊讶的结果,都不应该让数据科学家感到不知所措。相反,这些例子说明了从原始信息中挖掘与学习的重要性。如果正确使用数据科学,并且与公司中其他部门积极合作,则可以将数据科学用作创建新假设、测试新想法以及改进现有想法的跳板。

拥抱数据背后的科学意味着,当面对常规测试无法解决的挑战时,不要害怕去深入研究甚至提出自己的疑问。最重要的是,这样的过程旨在帮助你不断激发灵感,并提醒你——一家成功的公司永远不会满足于现状。在数据和科学的推动下,它始终在学习、适应和成长。

关于作者: 七里香赚钱网

热门文章

发表评论

邮箱地址不会被公开。 必填项已用*标注