内容来源:2018年1月6-7日,由人人都是产品经理主办“2017中国产品经理大会:解码未来产品经理”活动,朱文伟作为嘉宾进行了主题演讲。笔记侠作为独家活动笔记合作伙伴,经主办方和讲者审阅授权发布。
封图设计 | Holly责编 | 苏文炳
点此听精华版音频 ↑ 更多精彩内容,还需阅读全文哦~
独家首发·完整笔记·人工智能
本文新鲜度:★★★★ 口感:山楂
- AI能解决哪些核心问题?
- 如何通过AI构建新营销模式?
- 如何进行有效地收集数据和清洗数据?
我今天分享的主题是:如何通过AI加速千人千面,以及营销新模式的建立。
我们先通过京东叮咚的音箱来了解一下人工智能的应用。
叮咚音箱
第一,叮咚音响是智能语音交互上一个巨大的贡献,我们可以通过叮咚音箱实现人类和机器的对话,语音识别和自然语言处理的技术让机器理解了人类的意图,帮助用户实现了点歌听歌的操作。
除此之外,通过和喜马拉雅团队深度的内容合作,这些非常优质的内容也可以通过叮咚音箱来收听。
第二,在京东APP内打开叮咚音响的详情页后,可以看到3D展示的入口,点进去可以看到叮咚音箱的3D呈现。通过触碰和旋转,全方位地感受到音箱的现实模样。
叮咚音箱3D呈现页面
另外左下角有一个AR的入口,点进去,音箱产品的3D模型形态会在现实环境里得到很好地展示,提升你对商品的理解,并且完成购买,提升用户的决策效率(对京东平台来讲)。
这个例子说明:京东已经在整个人工智能领域有大量地涉猎。在2017年年初,东哥(刘强东)在开年大会上介绍了京东下一年的战略,叫科技12年。前12年,京东是一个零售公司,后续是科技公司。
未来京东会做什么事情?
我们在硅谷成立了自己的研发中心,并且在去年和今年相继成立了X事业部和Y事业部。X事业部负责无人仓、无人机、无人车,我们叫“三无产品”,这个是褒义。Y事业部负责整体供应链优化。
我们2018年的目标是,80%以上的商品通过自动化补货,而不是人工下单完成。
所以,今天我会结合AI和营销上的想法以及落地实践的经验,分享我们的一些思考。
一、数据是AI的根本
数据很重要。我们称现在是人工智能的第三次浪潮,有两个决定因素比较能论证这件事情是可以成功的:
第一个,是计算力。举例来看,英伟达最近两年的股票价格增长是600%,从一家市值一百多亿美金的公司,到现在已经突破了一千两百亿,这是一个巨大的飞跃,得益于人工智能的兴起。
第二个,是数据。互联网在经历了这十几二十年之后,已经把用户的习惯和数据慢慢从线下引到线上。现在互联网时代整体收集数据和清洗数据成本比以往要低得多,我们可以看一下数据的重要性。
这两个图中,左边是现场接收到的报名信息里面,大家工龄的分布,可以看到大部分听众是在五年以下的工作经验。右边这张图是性别分布。
这里面涉及到两部分,第一部分是数据收集,第二部分是数据清洗。这两张图可以理解为数据清洗的结果,而获取数据,其实是收集的过程。
1.数据收集
① 数据收集的来源
京东拥有我认为几乎是互联网上最完整、最精准、最高、最长完整链条的数据。
第一方面,京东商城一年有大几千亿的销售额,十几万的商家,10亿以上的商品每天沉淀在平台上,有大量的数据可以为整体的后续营销和人工智能建设服务。
第二方面,我不知道大家有没有用过京东白条?实际上像京东白条,包括理财产品,对用户来讲是有非常高价值的数据。
第三方面是物流。今年4月份,京东宣布整个物流子集团成立,意味着京东物流从一个供给自身商城业务,扩展到社会化物流。
我们现在也开始给大量的品牌方服务,可能这个商家在天猫开店,但它是用京东的仓库,用京东的整个物流体系。各个地区行业的数据获取可以更高,当然数据是永远没有止境的。
第四方面,刘强东在开年大会上也提了无界零售。我们现有八家京X计划,包括腾讯、今日头条,都是行业里最大的媒体和流量端。通过整个的数据清洗,让我们的数据更完整。
② 数据收集的原则
互联网真正地采集了大量的数据,这是人工智能的第一战场。在整个数据收集过程里有几个点,是我想强调的:
第一个,数据并非越多越好
如果有些数据是无效的,也不用刻意地生产很多画像。
第二个,没有应用场景的画像没有任何价值
举个例子,比如你喜欢吃核桃,你又打王者荣耀,你觉得王者荣耀知道你喜欢吃核桃这件事情有任何价值吗?他可能给你出个核桃的装备吗?听上去好像没有什么商业意义。
第三个,大部分画像都是一种概率
大部分数据,包括画像,你可以认为它是一种概率。比如,在我们家大部分电商的消费都是我来完成的,我会帮我老婆买一些女性用品,由于我其他行为也不多,可能我就会被定义为一个女性用户。
但是实际上我在很多其他方面的行为并不是一个女性用户,所以它会存在偏差。
第四个,不要过度关心用户,避免用户焦虑
这个在互联网早期比较多,总让用户填一些个人信息问卷,其实很少有人会认真地去填,所以尽量不要去打扰用户。
再举个例子,比如说杜蕾斯很火,我可能算出来了,你两周肯定会买一次。那到点了,我就在APP首页全部推送杜蕾斯,被别人看见,你是会觉得隐私被侵犯的,所以尽量地避免过度去关心。
2.数据清洗
有了完整数据之后,还是要落地到商品的数据、内容的数据、店铺品牌的数据,以及最重要的用户画像上。
我们在有一套标准的体系收集用户整体链路之后,基于画像的过滤和清洗形成了几个维度:
第一个,人口属性
比如你是哪里人? 现在我们在互联网上都要实名认证,通过你的身份证号可以得到你的性别,你的出生地,这些信息都是比较完整的,但我们绝对是保密的。
我自己也都查不到每个用户的信息。
第二个,用户的属性偏好
你在京东的很多行为,我们会定义为你的品类偏好,品牌偏好,包括商品的偏好,更细分的会在品类上。
以购买力举例:你是买一千块钱的手机,还是买一万块钱的手机,这里会存在一个价格歧视的问题,但这个价格不是说一千块钱的手机卖给你是一千,卖给他是一千五,而是说由于品牌的影响,可能两个商品的差异非常小,但由于我觉得你的溢价能力是比较强的,那可能就会把更贵的商品推给你。
第三个,垂直标签
举个例子,母婴人群。很多人知道备孕的时候要吃叶酸,一旦你在京东买叶酸了,我就知道你可能离怀孕不久了。
我们基于这个用户的行为,可以推算出她在整个母婴过程里面的状态,是在怀孕周期,还是baby刚出生。从怀孕到两岁的过程,我们都定义为母婴人群。
我可以在你的周期里给你推一段奶粉、二段奶粉、三段奶粉,这是一个非常强的应用场景。
第四个,外部标签
最后是我们和京X计划一起获取到的数据。我们会有很多外部广告投放,可以获取到外部的一些用户标签,这是电商所不具备的。
二、AI的本质是:
解决复杂场景的效率问题
AI可以结合营销场景,做很多在营销上的实际应用。在实际应用中我们定义,AI是解决复杂场景的效率问题。
AI不仅仅是一个用户产品,其实对内部提升运营效率也特别有帮助。我举一个不是那么复杂的场景为例:
案例:京东秒杀
1.资源分配管理成本
我们在2016年年初才开始推秒杀的智能化,最早期是这样做的:每天有十几个秒杀场次,每个场次有50个商品,我们现在有六个事业部,基于每个事业部不同的GMV目标,运营同事把这些坑位一个个分给事业部。
现在通过AI来处理,第一个资源位和第五十个资源位产生的价值是完全不同的,如果是最后一个和第一个来比,可能GMV贡献度只有10%。这会导致资源管理的成本非常高,因为要精确到每一个资源位来看它的效率。
2.资源撬动、激励
从前端运营的角度,必然想把更好的商品放到更好的位置。
比如,三只松鼠,本来卖五折,基于历史销售来看,五折其实不是一个很有竞争力的价格,我希望卖到三折。现在是很难去要求的,因为你给他的资源曝光已经非常固化了。放在第十个坑位就是那么多曝光,只是三折的转化率稍微高一点。
如果通过AI技术决定商家商品的坑位,商家能够通过加强折扣力度提升排序,那么就能够激励商家给出更有竞争力的价格。
3.复杂场景下的用户行为差异
这个例子是跟用户相关性更高的,特别典型。现在是冬天,大部分同学从北京到深圳来,他可能要带很多衣服,因为深圳现在气候不是很寒冷,但是在北京,大家可能都穿着羽绒服。
所以不同区域,用户其实有很大的差异,但不仅在于区域,可能在很多行为上会存在很大的差别。基于单一频道,我们有很多通用的模型,并且基于同一个频道做了一些差异化建设。
第一个,考虑资源撬动的问题。
不仅考虑打几折,还要考虑这个折扣和历史最低价、历史销售的对比;不仅考虑它自身的销售怎么样,还会考虑它在品类里排行如何。
针对秒杀这种强促销的频道,我们会更多地考虑它的销售库存,因为一件卖一百块钱的商品,卖一百件和卖一万件,对频道的价值差异是非常大的。
第二个,看商品的实时效果。
除了正常的数据以外,引入两个基于这个频道特性的数据:一个是预约量,我们会做24小时提前曝光。
看这个商品曝光之后,有多少用户真正关心它,愿意来抢。另一个是售謦率。实时跟进销售进度,销售进度越高,会给一个权重。销售很低的,从销售补充的角度来讲,也会给一些权重。
第三个,最重要的用户的偏好。
除了正常的品类、品牌偏好之外,我们会加上品类协同。可能这个用户在A品类没有什么行为,但我们发现用户在A品类和B品类上,是有一些销售关联度的,以及在某些品类上可能会有复购的问题。
比如你买个手机,一般人应该不会在六个月到半年之内再去买第二台。这样的商品我们往往会给它做降权。
基于这些模型,我们去做整体点击率和订单转化的优化,看哪些效率高,哪些效率不高。基于一个运营场景,比如针对618、双11、优惠券等这样强促销的频道,我们会给出不同的解决方案。
因为大促期间用户的行为差异很大,我们会基于去年618或者去年双11的数据,做专门的模型训练,让用户在这个周期里面的行为表现,更趋向于我们预测的现实结果。
可能有人觉得秒杀或者像淘宝、聚划算、淘抢购,它的促销信息太强了,好像AI在里面也起不了什么效果,但从我们实际结果上来看,整体提升率能到30%。
秒杀在双11周期里面,11月1号我们的销售额突破了一百亿。通过AI这个模型的优化,提升30%是一个非常大的量级。
哪些场景可以借助AI解决?
第一个,从运营端来看,人的数量永远是有限的。
秒杀频道有接近100号员工,这是一个非常大的量级。 京东内部的活动,每天线上有5000个,如果一个人负责一个活动,也要需要5000个人,这个规模是不能再去扩充的。
第二个,在京东这样平台,包括阿里,很多资源和流量都是按品类来管理的,每个品类都有销售额KPI,当它做活动的时候,比如生鲜做活动,是不太可能卖家电的。
结合这样两个场景,我们去看有没有办法提供一种更场景化的链路,来完成AI赋能。
案例:准备婚礼
在操办婚礼的时候,有很多事情要做,可能会买家电,要装修房子,可能买喜糖,都是一些跨品类的非常长链路的行为。有没有办法把很多场景通过一个机器挖掘出来,再通过自动化的方式有效组织,以非常简化的结构推荐给用户。
在这个过程里,有一些问题是必须要解决的。
第一个问题,场景怎么来?很多场景很细分,而且几乎很少有一个运营懂全局。
第二个问题,内容怎么来?场景里面有很多商品,有很多内容,总要有一个地方来确定这个规则去选品。
第三个问题,头图怎么来?页面里会有个头图,它是一个氛围图。怎么生成? 以及整体页面结构,页面样式怎么确定?
考虑到这个场景确实非常大,我们最后的结论是让机器来完成所有的事情。
如果场景数量是一个非常可控的量级,比如说50个,可能有几个运营同事就可以搞定了,但当整个数量达到5000甚至更大的时候,人的力量是非常有限的,不可能为了这个频道去招一千个人,从公司整体效率上来讲也是不可行的。
同时所有的场景都在动态变化。举个例子,比如叮咚音箱,包括小雅音箱,它也是一个场景,但这个场景可能在最近两年才起来,明年可能有另外的场景方向,这是需要一个动态调整过程的,我们希望整体过程都是可以机器化生产的。
场景怎么来?
我们把这件事情真正地交给机器,清洗了大量底层的数据,把所有的商品、内容、店铺、商家、达人标签化。然后去看所有用户的行为,搜索行为,访问行为以及去扒全网的,比如百度上热搜,今天发生了什么变化,以及去看不同的人群。
总会有那么一群人,他的行为是领先的,我们称他为达人。他可能先穿着这件衣服,由于他穿着这件衣服就引领时尚了。这些人在京东的行为是怎么样的,我们希望可以把它聚类出来,形成一个场景挖掘。
到现在我们挖了至少上千的频道、场景出来。但是频道、场景挖出来之后,至少要输出到前端给用户。纯粹的后台数据是无法完成这个事情的,所以我们又设计了一个机制叫场景生成器。机器挖掘结果出来之后,提交给人,这个人负责总结频道的名字和副标题。
我们知道,百度、京东、阿里可能都在做AI写作,我们在内容生产上也做过很多这样的尝试,发现效果确实不太好。
它写出来的东西特别是这种短标题,往往是人无法理解的,或者它可能是一个纯粹的品类词,场景感非常弱,所以现在我们这部分是人在做的。确定名字之后,内容质量是人可以理解的场景下,我们会调用整个的场景频道服务。
场景生成器的作用
第一,判断品类特征,找到适应它的结构。比如我买快消品,你买可乐,几乎没有人会去看商品详情页,大部分人是在列表加购,但是你去看3C商品,买手机的时候不太可能搜iPhone直接加购,这个决策成本是不太可能在这么短的链路里完成的,我们基于这种不同场景会生成不同的页面结构。
第二,抓取场景下内容自动生成头图。京东内容生态已经生产了大量的内容,在这里面,我们抓取合适这个场景的图片,结合标题生成头图。
第三,基于机器学习方法召回排序。基于前面挖掘的结果,通过一系列召回策略,生成一个频道,并且把它投到线上。
三、AI是持续学习的过程
AI不是一蹴而就的,从前面的增长数据来看:
第一,需要经过大流量的验证
AI除了数据以外,就是计算。通过流量的验证,可以收集到大量的用户行为数据。
这个和AlphaGo是不太一样的,AlphaGo的规则相对简单,只要告诉它怎么下是合法的,怎么样算赢就可以了。所以在10月份的时候,当DeepMind团队宣布了AlphaGoZero通过40天的自我学习,没有接受其他任何在网络上收集的棋谱数据,就打败了原来的AlphaGo Master。给它数量只有两个,第一个,下棋的规则。第二个,怎么算赢?它不断地自己和自己下。
我所说的很多人都无法想象的一些策略,但是在电商的领域,或者大家面对很多To C用户的时候,用户的数据才是价值,这是需要强输入的。
第二,基于用户体验
还是举前面的例子,几乎不太会有用户希望自己被推荐出来杜蕾斯。当别人看见的时候,发现你跟我用的是一个牌子。所以有些场景机器是不了解的,但是人了解,这个体验需要人来设定规则去做控制。
第三,业务的平衡
大家都知道京东的强项是3C,是家电。如果任由机器去做,导致的结果可能是你看到的永远都是3C,都是家电,因为从GMV产出来讲,这样的品类效率是最高的。
比如,买一台iPhoneX,现在是一万块钱,但买生鲜的客单价可能就是一百多,这是无法相比的。所以在这里面我们要考虑更多的业务场景,包括品类的均衡。
在用户看到的时候,不仅是体验,也是业务因素,要给他更丰富的品类,以及当一些品类新出来的时候,比如京东的7 FRESH(京东7 FRESH生鲜超市)刚开张,像这样的新品类,如果不靠一些战略扶持,冷启动是非常难的。
京东7 FRESH生鲜超市
因为没有任何的用户偏好,用户没有任何的行为,更谈不上品类协同,这就需要一些人为的加权来做干预。
四、平台化,赋能更多场景
整体上,如果我们只是做单点的研究去推荐,那么AI这件事情其实就失去了价值。
因为这样的话需要基于所有的场景做独立化训练,实际上并不用。可以把它建成一个平台化的能力,让它可以应用到更多的场景,我们建设的平台叫京东营销投放平台。
它集成了基础的个性化推荐、精准投放、业务补充和自动化运营能力。
简单的以精准投放能力为例,对于7 FRESH,在APP里,只有当你在那家店周边三公里它的可配送范围内,我们才会把入口开放给你。
有很多很复杂、很繁琐的事情,包括一些业务信息的补充,异常过滤,算法的分流,数据的清洗,这是一个持续优化的过程。我们通过这个平台建设,赋能到更多的业务场景。
现在通过京东营销投放平台覆盖到的APP的首页,PC的首页,618大促活动,包括一些三超的品牌活动,通天塔,优惠券频道等,这些场景可以非常快速地接收,包括前端的埋点、数据清洗的整个过程。
当然很多时候我们提供的是一些比较通用的模型和方案。当一个大流量的业务需要做深度优化的时候,我们也会基于这个场景去做完整的深度链路的优化。
五、全新营销模式正在加速形成
我们在做AI建设去影响营销过程的时候,到底发生了什么?我用三个关键词来总结。
第一个,规则化
传统的营销模式,是基于人对流量和资源位的管理,但是类似于东家小院这样的频道,它是形成一个规则,人是不需要参与的,或者说人在里面起到的是监督的作用。我知道什么样的商品能进来,什么样玩法的内容可以参与。
第二个,开放化
由于自动化引入,人的效率大大提升,或者说人可以释放出来了,营销曝光的资源更多了。京东现在有16万商家,大量商家可以参与。可能在原始的运营模式里面能参与的商家只有头部,我们正常一个采销管理的商家在500到1000左右。
在这个规模里,最多20%的商家可以在整个京东营销资源流量里去玩,剩下怎么弄?自己去做搜索,可能这是唯一活路了,或者去卖广告。通过规则化的实施,更多商家可以参与进来。
第三个,个性化
前端流量效率的提升,伴随而来的是销售越来越长尾。京东从最早卖手机、卖家电这种标准化的东西开始向生鲜、向时尚这样的品类去做,核心的因素就是,在大流量下用户的需求差异化非常大。
而京东自身特别是做自营,其实做不过来。京东自营现在的SKU种类也就一百多万,加上图书可能有200到300万。但是用户的需求是永无止境的,十几亿的商品才能真正地满足,可能这个量还不够。
基于不同用户个性化需求,可以让很多细分领域的商家存活下来,在这个平台更茁壮地成长。
主办方简介——
人人都是产品经理(woshipm.com)是中国最大、最活跃的以产品经理、互联网运营为核心的学习、交流、分享社群,集媒体、教育、招聘、社群活动为一体,全方位服务产品经理和运营人,微信公众号woshipm。
成立7年以来举办在线讲座500余期,线下活动300+场,覆盖北京、上海、广州、深圳、杭州、成都等10余城市,在互联网业内得到了广泛关注和高度好评。社区目前拥有300万忠实粉丝,其中产品经理占比70万, 中国75%的产品经理都在这里。
笔记侠实力好课程:
↓↓一堂用得上的商业课,没有一滴鸡汤 ↓↓↓