【广州论道】易视腾CEO以AI时代的互联网电视为题发表精彩演讲

发布时间: 2017-05-27

【流媒体网】消息:随着家庭数字化、网络化的发展,新一代客厅经济衍生;随着电视与互联网的融合加速,产业的变革充满了变化。2017对互联网电视而言,既是政策回归下的重振,也是走向家庭互联网的新起点。

我们期望通过本次分论坛,探求互联网电视的商业机遇和破局良方,就OTT+、家庭技术趋势、产业跨界合作、运营模式创新、业态开发拓展等方面展开讨论,毕竟电视+互联网时代已至,视不可挡。

2017年5月26日下午,流媒体网举办的第13届电视新媒体产业峰会“OTT+ 探寻新蓝海  破局2017”分论坛上,易视腾CEO侯立民进行了主题为《AI时代的互联网电视》的演讲。

以下为演讲全文:

易视腾多年以来专注互联网电视领域,在最近一段时间里,积极地把AI技术和新的演进融合到现在的服务里,这也是大势所趋,之前李彦宏说的移动互联网时代来了,但是现在AI时代来了。有点夸张,有点尖锐,但是意思没错,某种意思上连接已经解决了现在的连接速度,连接的量。从现在运营商的连接能力来看不是障碍,只是一个时间问题。但从另一个角度有这么强的连接,我们又能做什么事情?又有很多新的东西,新的空间,在连接、智能的时候如何改变生活。

从易视腾的角度做的这款终端有一段时间了,但是一直没有真正把它发布出来,可能最近一段时间我们会真正意义上把它集成,然后正式发布出来,之前总觉得不是火候,从现在很多东西的演进上来看,尤其是AI相关的东西的演进。

其实说云+端,说了很多年,从第一次参加灯少的活动,那时候就说了云+端的事情。在AI的语境里,恰好终端是解决感知问题的,云端是解决认知问题的,后面的问题可以再展开探讨。

易视腾一直在做互联网电视,会在五个方向上继续努力做事情。

首先是个人电视,前面大家谈了个性化的事情,其实大家的理念、想法探讨的比较多了,往下的关键是怎么实践?但是在电视节目本身的收视方法,包括怎么样在OTT环境里解决直播的问题,以及个人电视的话题。


侯总1优化.png

大数据为每一个用户专属编排个人电视台

还有电视上的永恒话题,怎么交互?大家试过遥控器,手势等等各种各样的东西。现在比较火的是远场语音,每种都有他的优势,但是怎么样真正自然的交互起来?还是大家要解决的。我们也在尝试,但是大的方向还是有的。

多屏也是多年的老话题,但是怎么真正的实现起来?多屏的体验大家都在做,只不过现在简单一句话大家看的电视是一个屏,手里拿的手机跟电视没什么关系,我们也看了微信和头条,但是体验并没有结合起来。真正的多屏,大家都说投屏,并没有使用起来,只能说理念到了,视频的片也到了,可现实还没发生。

家庭社交、电视社交,还是老话题,说到社交电视,三四年前好多人说社交电视的事情,到现在也还没有发生。最终的电视生态是一个长期问题,这必然是一个永恒命题。

个人电视,在我们看来,行业里大家尝试了很多,面板大家做了很多年,要个性化,到目前为止我们看到的是大家实际用的,通常还是根据人群,或者根据内容,没有有不同的面板编排。真正个性化,能够了解用户想看什么,了解用户的场景,真正了解谁在看电视,这还是一个待解决的命题。当然我相信现在真正到了一个技术手段和产品成熟度。

我们平台上有2000万用户,但是实际这个版本还没有推上去,用户虽然有了一定规模,实际上因为平台的碎片化因素,包括一些老旧版本的升级问题,新的这些体验真正想上去还是挺难的。但是在一些最新锐的地方,一些比较领先的专网上,已经在快速的往这个角度去。我相信在往下的2、3个月里面,可能会有上百万的用户,可以看到真正意义上完全个性化的个人电视服务。

这个里面是针对每一个用户,每一个时刻,我们去单独给他计算,他可能的当时的偏好。而不是咱们推荐一个片,用一个算法,一次性去算。

其实在做互联网电视这么多尝试里,我们来回来去试过几次,首页放不出视频,最初是技术障碍。后来发现首页能放出来,但是老是那几个东西。第一眼大家发现首页有视频不错,可是一个视频看三遍五遍就厌烦了,即便运营商天天换视频也很困难。所以在后来很多版本里,视频这件事就放下了。现在可能又是新的轮回,当然曾经我们也放过直播,直播放哪个频道就是大问题。天天放湖南用户受不了,天天放导视用户受不了,因为给用户的永远是同一个东西。当然不同阶段有不同的初衷,觉得用户能看到视频,觉得这是一个电视,但是仅此而已,达到这个并不能真正满足用户的需求。

所以我们希望在新版本里,打开电视机时,每个用户看到的是他这个时刻最想看的节目。为什么强调这个时刻?每一个时刻每一个场景在电视上,在手机上,每一个用户想看到的东西不一样。前所未有的我们现在有了能力,去了解每一个用户,当然在多屏的时候谈到了,去了解每一个用户,尤其包括有摄象头的时候,对于了解用户,对于真正实现智能非常关键。

一个家庭,真正的智慧家庭,如果只是一个闭着眼睛的盒子,不会真正能够跟它智能交互。

所以个性化的首页,个人频道,简单说就是每一个人7×24小时的个性节目单,每一个人有自己的节目单,当然你不愿意动它就自己学,而且它会越来越贴近你,这些事情要感谢现在的人工智能技术,有各种各样的算法,可以持续的去深度优化。

收视推荐,这是一个很有趣的产物,跟OTT整改有关系,因为OTT不能连着播,每一次跳出来,反倒变成一个非常有趣的机会。所以实际上把大数据、深度学习算法用上去,第一个应用点就是不能续播的时候推荐什么?实际上每一次的节目更换,每一次的退出,每一次的暂停,其实都是我们的用户交互,和推荐用户,向用户了解的最好机会。

所以在这里面,看上去不太起眼,但它是实现智能的最容易进入的入口。

收视提醒,刚才我们在TCL视频里看到提醒老人吃药,这是一个非常直观的,有说服力的看法。但是我们看到的是怎么样提高电视收视率,节目的活跃度。怎么样跨过用户打开电视机的心里门槛?怎么能够让用户回到电视机上来?有手机和电视两个结合起来的入口之后,就可以做适当的符合场景的推荐。

侯总3优化.png

人工智能和大数据密不可分

原来做短信推送,后来变成了骚扰,咱们有了政策不能再做这件事。但是实际上大家都知道,如果推荐的东西是用户感兴趣的,用户是会接受的。关键是怎么了解到他喜欢什么?这也是在人工智能的语境底下要解决的最大问题,去年前年的时候大数据谈的多,今年全面的变成AI,其实这两个东西确实是密不可分的。大数据是AI的基础,大数据做下去,它自然的产物就变成了AI。

所以从个性化的角度,我们做了一些探索,这些探索的基础是两三年前开始做用户的收视分析图,当时带来了非常多的启发。实际上对每一个用户,都会产生这样的图,这个图纵轴是日期,所以大家看到一个一个横道是周末,就说明一到周末用户的电视就持续的在播放。

当然有可能他晚上没关,但是他在白天的时候往往是有效的在看。不同颜色其实是不同的节目,带有各种不同的行为。

看到切换颜色,或者有很多竖道,是用户在换节目,找东西,持续的连续的,就是他在追剧。所以这样的行为,这是一个典型的相对重度的用户,他到下午晚上一直在看,中午看一下,早上8点起床了,这个人生活还挺规律。有很多不同的用户,做了一个有趣的实验,拿了200张随机的用户,发现一张张看,看不过来,没有整体感,让他们把整体的200个给我像原始的在电脑上一张张的在电脑上切,就看到稀疏的,密集的,有不同时间段的。其实我给运营同事看是想告诉他们,有很多非常不同的用户,每一个家庭每一个人的习惯都非常不一样。但是在电视上他们都很规律,每一个人是什么样的人?他是不会随时改变自己,所以每一个人的需求,他的生活规律,场景需求非常清晰、非常鲜明,也非常多样化。

基于这些东西,现在有这么多数据,P级的数据,像日志数据,每天收上来就是几十个G的日志数据,这些数据是财富,现在再用算法和工具持续挖。挖出来的东西就要把它变成产品,变成影响用户、服务用户的工具。

这些是后续的产物,以前咱们传统做手机业务的时候,大家用画像。现在市面上各种大数据公司,基于手机数据的为主,咱们大家每个人的手机里面,可能埋了N多个数据上报的SDK在里面,所以各种数据各种行为,其实都是被收集、被综合了。

这些东西如果做的好是脱敏的,相互之间结合起来,会产生用户画像。但是到目前来讲,产业里手机并不多,我们对家庭用户,家庭环境,跟家庭里的包括人的关系了解的少,恰恰是做家庭业务,做电视业务的时候,就有很大的空间可以把它提升。

原有从各种手机APP上对用户的了解,其实相对来讲,各种APP的行为,有通讯型的APP,有视频的,但是当现在有这些电视APP,包括有摄像头的时候,其实对用户的认识,对他的理解,又有一个大幅度的提升空间。

所以在做UA系统的时候,这一页是为数不多的干货在做这个UA系统的时候,我们有大块不同的体系,从源到域处理,还有算法引擎,然后到外部的应用系统,推荐、广告等等这些东西。

从个性化的角度,我们的诉求其实是深度理解收视意图,根据这些意图形成为每一个用户的动态的诠释个人频道服务,这些东西你手机上拿出来,是你想看的东西。回到家里陪小孩,是小孩想看的东西。以前可以粗旷的做这件事情,但是有了多屏,和睁开眼睛的盒子,我们相信在这种形态下,用户的行为会走到一个新的形态。

自然交互,现在最火的远场识音,这个东西业界有无数公司在优化,但是现在已经是一个性价比的问题,所以作为做终端的厂家,我们会尽可能利用好产业的更新,希望所有这些终端的能力,能够快速地进入到中国消费者,尤其是运营商环境的消费者的消费区间里去。如果这个终端是1000块钱的,我想这个东西就得变成高端用户的产品。希望这样的产品目标,要到300块钱左右,这个目标通过一个服务套餐,直接一年可以达到理想目标。

戴摄像头能够自然交互,通过人脸识别,情绪识别,通过手势操控,加上远场语音操控结合起来,因为每一种操控方式不一样,语音非常适合搜索、对话。但是如果每一件事情都靠语音做,坦率讲是不舒服的,实际上在运营里用过语音你会发现,很多时候用户更愿意沉默的动几下手指头,比如说翻篇、播放、退出。语音非常好的解决了我要搜索,我要对话。咱们现在不管是讯飞还是百度,他们在快速趋同,基本的语音识别已经实现了。

下面的语意理解,NLP,大家做的都不好,咱们的聊天机器人,基本上是恶搞型的聊天。我们希望在电视环境里不需要调情,只需要了解用户看电视的意图就可以了,当然人工智能是深度学习的特点,今天做不好可以持续做,越多的用户量,越多的样本,就可以训练他。甚至现在前两天人工智能大会我跟一些专家交流,实际上现在从算法本身都在学习过程中,这是一个培养过程,需要整个行业一起培养,在真实的用户,真实的使用环境,这是一个养成游戏,人工智能养成游戏,要实现这种东西也不是那么玄幻,在大量的用户里面,从今天开始让他学习。

所以语音、手势、人脸识别,这个是我们认识用户时用的界面,在的产品里,基本上家里装了这个盒子,他会需要认识你,不认识的话他会跳出来说认识一下,拍几张照片。下次他要没认对,你再纠正一下,这需要一个过程。

然后是手势操控,在一些场景下适用,但是不能全靠它。所以遥控器、手势、手机、语音,这些东西你要把它结合在一起。有时候同时用两个,所以现在在做手势+语音结合的方式,这些东西都会从算法上、效率上,产生大的跨越式的提升。

所以自然交互上,希望逐渐达到面对电视的时候,像面对一个人在沟通。

第三条是多屏,多屏是老生常谈了,但是越老生常谈就越感觉到每年多有新的意义。这段时间我们在跟专网上一些最领先的伙伴在努力尝试,真正把多屏的装机,多屏有效用户的实际行为真正做上去。因为大家演示的多屏产品很多,但是真正使用的太少了。

尤其是在运营商的OTT里,其实也可以包括MTV,在这样的市场里,多屏的应用是主旋律。实际上人的生活是全场景的,电视代表家庭,手机代表人。到目前为止手机这张屏,做了很多电视上应该做的事情,这不一定是必然的,更多的应用电视还没跟上。当有效的形成一个自然的自动的多屏体验,人可能就回归他更自然的场景选择。

现在大家感觉到回家以后,为什么要开电视?很多时候我可能觉得掏出手机上就够了,有时候甚至躺在沙发上也懒得开电视,很大一部分原因是电视的心理门槛比较高,因为电视你要正儿八经往那儿一坐才会打开,这是现在电视和手机之间需要做出改变的。当然看手机、追剧,体验挺别扭的,所以现在产业里面对的是怎么能够大家真正该看电视的时候,电视做他该做的事情,手机做他该做的事情。但这是割裂的,有可能大屏上放一个东西,手机上是另一个,完全不是一个服务。现在期待的多屏,我们力图让电视上播出的东西跟手机上的东西真正结合起来。开着电视看手机的时候,就希望大家用的是同一个环境下联动的。所以这里面一个是自动感知自动连接,以前做多屏,把两个东西连起来要很多步,这件事情损失了绝大部分用户,现在包括WIFI,包括现在的技术,回到家里自动连接已经是必备的标配,而且连接进去我觉得有必要,而且也感觉到通过有效的推送,通过有效的提醒,去让用户把手机拿出来,去让用户真正看到一个上下屏联动的场景。

当然像遥控、同屏这些事都是必然发生的,当然一个封闭的服务环境还是有必要的,这里面我觉得比较有优势的是移动运营商,除了苹果之外,在这方面更有整合力更有业务基础的必然是运营商。

自动感知,自动连接。当用户回到家,希望电视能自己打开,当然做盒子的时候打开电视是现在最大的障碍,对于做一体机的同志们这是一个优势。现在对于做电视行业的人来说,怎么让用户回家把电视打开,还是一个非常关键的问题,不打开电视根本没有机会做下面的工作,所以提醒他在合适的时候,在他愿意的时候提醒他,这个是关键。垃圾短信跟有效提醒差别就是时机跟意图。

所以不管是回家的收视提醒,还是地铁上拿出个手机客户端,我们都要有机会了解他想看什么,这跟前面的个人电视是息息相关的。

手机和电视之间的信息同步必然发生

云同步,现在有很多云服务,但是真正意义上的云服务用起来不多。手机跟电视在家庭的环境里,云同步又有一些新的机会,因为大家知道,手机每人一个,每人的存储其实都不共享,家庭环境里有很多东西条件共享,能够共享的更方便,而且拿出来看会更方便。但如果单独看成是一件事,使用门槛很高。如果从电视的相机、手机的相机天然的结合起来,就能很方便外出拍的相片打开在电视上,可以方便分辨,这个时候云相册、云存储就会跨过那个服务门槛,会有更实际、有效的使用。

当然在手机和电视之间的数据、个人信息的同步,这些是必然发生的。

远程投屏,像父母找不到节目看,这个是经常遇到的现实中问题,一更新找不到是哪个台的节目了,这时候就有必要远程跳一个节目,直接给他投过去。

投短视频,包括一些个人家庭直播,这些都是在电视上,整个家庭服务例马上会出现的,也非常方便的。这种直播不是网红直播,所以想这可能是封闭的,家庭的人员,或者是你们的好朋友之间出去玩,给他们家电视上播一段还是挺嗨的事情,或者是戴摄像头的盒子上,我们可以做虚拟演播室的直播,可以是一个虚拟场景,甚至是一个视频背景。

多屏的角度当然还有监控,电视上的摄像头一直不太认为是安防监控,它更多是回家看看的作用,比如说看看沙发,其实就是看看家人在干什么,看看小孩在干什么,这是合适的。当然这种也是一个对家庭非常有效的场景。

刚才谈完了多屏,对于社交,大家都知道其实微信现在等于垄断了社交跟通讯录这一套体系,但是在微信里他对家庭关系并没有一个有效的描述,他的应用场景跟家庭关系是非常个人的,跟家庭的沟通方式,亲情的沟通方式还是有距离的。所以我们感觉到,从做设计互联网产品来讲,在这个时候谈社交其实很危险。但是在家庭这个环境,感觉还是有机会,围绕家庭,围绕实名好友,构建社交关系和朋友关系。

这个很大程度上,尤其是围绕移动运营商的业务环境,做家庭业务,通过电视、手机,通过刚性的变相用户的APP,把全业务结合起来,这其实是一个非常好的机会。运营商做手机通讯录,其实困难都比较大,最大的困难还是社交关系跟用户体验。通过家庭来做这件事我相信是一个新的机会,不一定会产生一个跟微信抗衡的东西,但是它很可能产生一种有效的用户体验,比如说把家庭成员和手机通讯录能够通过一个核心APP、刚需APP,把它重新抓回来。

所以在电视的社交环境里一起看电视,大屏弹幕,原来像A站、B站这些弹幕是小孩干的,但是在电视的环境里,通过云输入、云识别转文字,可以很方便的实现共享直播和弹幕的体验。

在我们平台上,上次国家队那场球,实际上弹幕一起聊天就产生了不少应用体验的效果,还是有很多用户在积极的用弹幕聊。

在社交里,大屏相机,通过图片、短视频分享、直播分享,产生社交关系,所以刚才谈到云相册,包括一些应用人工智能技术,比如说年龄识别,判断颜值,包括道具、视频等等,前面也有演示,素描效果、视频这些东西其实抓眼球,适合分享。

家庭云相册,基于家庭的共享相册,云相册有机会,后续变成一个虚拟家庭,它就会产生一个类似虚拟圈的效果。

再有是在社交里必然会走向通合,可视通话对于运营商来说,从3G一开始的时代就认为是可视通话。大家可能认为人不愿意说话的时候看到对方,因为我用手机通话的时候说起话来很别扭。但是实际上坐在大屏,沙发前面,人看上去还是漂亮多了,而且待在那儿也舒服自在多了,这还真可能是视频通话走向实用的场景。我们不觉得这个东西通话量很大。因为之前我跟运营商朋友沟通的时候他们说话务量很少,其实这个可视通话不是跟语音通话相同的东西,但是只要一周有一次跟父母见面,通个话,慰问他们一下,或者看一下小孩,这个东西价值就很高了,这个时候在电视的大屏跟手机的屏幕上能够把它打通,能够把它变成一个普及型的、低门槛的业务,这个空间效果就能做出来。

包括电视上一起看一场球赛,或者一起说话、来天,是不是可视通话不一定,但是语音通上有一定必要,这种情况下大屏上要解决可视通话就要解决通讯录和朋友圈的问题,只要结合上手机,这件事就自然形成,包括大数据。所以这些事情我相信在不久的版本里,就会有大规模的应用机会。现在这个UI是我们刚刚做的,一个月左右后会发布,实际上在手机上投到电视上,随时播可视通话很方便。

电视生态,基于前面所有事情,都有产生生态的机会,主业足够强,生态才能长上去。今天早上老段讲大屏触屏生态,每一种核心应用场景都有机会产生生态,咱们刚才谈到的在大数据AI环境,在机顶盒,有摄象头,有交付能力,在智能认知,智能理解完全个性化的环境里,带来了各种东西的生态,都会产生变化。对于不管是传统视频内容,还是游戏,还是商务,都会带来新的生态机会。

在我们和运营商一起合作的时间里,其实怎么把生态做的更开放,更快捷,这个是我们的大问题,最近我们也在全力以赴做这件事情。

在OTT环境里,实际上增值业务运营和广告业务的时代快要来了,之前OTT是在积累用户,现在有四五千万用户规模的情况下,不打开这个生态,开始做价值运营,尤其是后向运营已经到了比较成熟的时候。