【企服观察】隐藏在微信背后的AI,为什么值得期待?
LTT 企服头条记者 2019-01-11

张小龙长达4小时的“微信之夜”演讲中,有一个比较意思的时刻,他开讲不久后,突然回头发现大屏幕上有实时同传,便有些惊讶地说:“没想到他们把我说的话给翻译过来,主要是我的普通话不标准,而且也没有对我进行过专门的学习。”



然后他若有所思地停顿了几秒钟。观众被他的这种反应给逗乐了,可以说很是细节控。现场同传能够直面各种港普、印式英语,先不说准确度如何,也是相当自信了。

 

另外,前段时间微信改版,用户在发布视频动态时,也发现了一个惊喜,视频内容能够被识别出来并且自动配乐,还挺智能的。比如拍的内容是雪景,系统会自动匹配跟雪相关的歌。

 

这些场景背后都有微信AI的影子。虽然微信很少对外谈资AI,但作为一款现象级应用,承担着10亿多用户生活、工作数字化的工具角色,每天有大量的文字、语音、图片在平台上涌现。微信是AI的天然训练场。

 

张小龙也在演讲中谈到,微信投入了很多精力来做AI。微信的语音识别都是微信内部团队做的,并且在长达好几年的时间里每天优化识别的准确率。微信投入做语音识别的时候,业界对AI还没有特别大的关注。微信不会跟风来做AI,但是AI要落地到实际的功能或者场景中去。

 

不断扩展生态边界的微信是大胆和务实的,默默耕耘AI、布局未来的微信更是性感的。


- 1 -

 隐藏在产品背后的AI能力


语音交互可以说拉开了人机交互的新篇章。标志性事件还是在2011年,苹果4S发布,个人手机助理Siri诞生。当年深度学习技术也取得了突破,促进了计算机视觉、语音技术的成熟。

 

微信语音团队成立初期,微信还处于和米聊掐架的阶段,雷军突然推出对讲机功能,用户猛增到100万,一个月后,微信开始增加语音聊天,同样出现了爆发式增长,可以说语音功能为微信在早期吸了不少粉。

 

于是微信组建团队开始悄悄研究语音系统,并在2012年试水推出语音提醒公众号,效果并不理想。到了2013年正式推出语音输入获得了很大成功,随后在2014年就正式上线了语音转文字的功能。

 

2015年,微信团队还和香港科技大学宣布成立人工智能联合实验室,研究的方向包括机器人、NLP(神经语言程序学)学习、数据挖掘和语音识别等,可以说是腾讯最早开始接触和深入研究人工智能的部门。

 

该实验室在一年后也交出些开脑洞的成绩单,比如训练AI对文章内容进行理解,掌握“阅读”技能,基于上下文理解提高用户的搜索准确率;对大数据进行“传播可视化”,微信团队就可以用这样的“千里眼”做热点追踪、谣言监控;以及给微信机器人赋能“高情商”,如今服务机器人可萌可贱,一定程度上褪去了机器对话的“机械感”。

 

但微信一直把AI能力隐藏在产品背后,直到2016年AlphaGo击败世李世石,让大众对人工智能的认知达到了高潮。微信才开始尝试将智能语音进一步商业化应用。在2017年推出 “微信智聆”,一方面支持内部各业务线的智能语音应用需求,同时也开放给开发者进行调用。

 

微信翻译团队还基于AlphaGo Zero 论文做了一件有意思的事情,开出了PhoenixGo 人工智能围棋程序,在 2018世界人工智能围棋大赛上获得了冠军。据说PhoenixGo 平时利用微信服务器的闲时计算资源进行自我对弈,并且在机器训练效率上有所创新,缓解了Zero 版本对海量资源的苛刻需求。

 

在今年的小程序公开课上,微信语音团队有了“二胎”,也就是继“微信智聆”之后发布了对又一AI技术品牌“微信智音”,分别在语音和语义两个领域展开人工智能技术的研究和应用。

 

微信智音不仅能够听懂语音所代表的含义,还能进一步提供相应的服务,比如基于微信智言推出的品牌“小微”,主要应用在家居(智能)硬件领域。如果用户使用小微搜索“陈奕迅”,它会理解成你想要听他的音乐,然后推荐相应的歌曲和专辑,而不是简单解释陈奕迅是谁,从而降低语音入口的深度,甚至拥有直接达到小程序服务的能力。

 

那么接⼊小微平台的设备就可以通过智能对话使用音乐、新闻和视频等内置技能,并且通过开放平台进行自定义设置。

 

也就是说,微信AI不再是单纯的技术输出,而变成了一种“连接器”。

 

一面连接腾讯内部海量服务资源,比如QQ音乐、企鹅FM、腾讯新闻、腾讯视频、微信公众号、小程序等,一面连接各种智能设备,比如智能耳机、智能音箱和智能屏等。

 

- 2 -

 “连接”的行业定位

 

“连接一切”已经是腾讯的至高战略。

 

去年腾讯进行了第三次组织变革,转型ToB,投身到互联网的下半场——产业互联网中。

 

但是很多人对腾讯2B的能力持有怀疑,比如在云服务领域落后阿里云、缺少2B客户、没有技术中台等。

 

对于腾讯在人工智能领域的布局也是如此,毕竟相较谷歌要“AI First”,将搜索和人工智能部门拆分成了两个独立单元;百度喊出“All In AI”,投入大量研究;阿里成立达摩院,规划三年投资100亿……腾讯似乎总是差了那么一点。

 

比如在人工智能的布局,腾讯围绕“基础研究、场景共建、AI开放”三层架构持续深入,形成了AI的三驾马车——腾讯AI Lab、腾讯优图、WeChatAI,齐头并进,颇有“赛马制”的风格。

 

但是曾有员工表示,“AI 对腾讯来说是一件很不确定的事情,与其倾尽全力去寻找它的商业化方向,不如先让各个团队自己去摸索。”

 

在去年的人工智能大会上,马化腾也承认,“部门里面的平台也很希望近水楼台先得月,数据就在身边流动,我为什么不能招人先研究一把,为什么给你呢。我们现在还处在内部怎么把数据分享出来这个阶段。”

 

这些都是腾讯AI身上的枷锁,另外今年年初,腾讯AI Lab主任张潼宣布辞职的消息也引起轰动,不禁让人唏嘘腾讯又少了一位大将。

 

毕竟在张潼的带领下,腾讯AILab在人脸识别方面已经落地,应用到了安防、金融领域,同时还在内容、社交、游戏和平台工具型AI四个方向在内部进行研发与应用合作。

 

对于内部技术、数据隔离的问题从去年腾讯2B转型开始有了好转。

 

腾讯在去年九月份成立技术委员会,对公司内部基础技术进行整合和共享,帮助腾讯建立一个生态系统,为数字化转型行业提供云计算、大数据、AI等新系技术。


就微信来说,在发展语音识别、人脸识别的同时,也用了优图的技术,将优图实验室的人脸识别技术跟微信支付结合。虽然赛道很多,但“三驾马车”都也在避免“撞车”。

 

更进一步说,为什么微信AI的连接作用虽然看起来起步晚,但基于微信生态,多年的蛰伏,更像是蓄势待发。

 

比如使用语音输入最多的应用可能还是微信,微信智聆每天处理超过4亿条的语音,识别正确率达到97%,服务于腾讯内外超过100项业务。微信智言形成了智能硬件、PaaS、行业云和AI对话机器人等四大NLP技术领域应用为行业赋能。

 

对于B端用户来说,虽然对文娱需求并不感冒,但是对这背后聚集的用户资源,强关系网络蕴含的广告营销价值极感兴趣。

 

相信很少有公司没有尝试过申请一个公众号,再加上小程序的下沉服务能力,将大大减少企业运营负担,从而更方便B端用户进行营销以及用户运营。

 

那么在产业互联网的趋势下,微信坐拥10亿多用户,微信AI不管是技术研发还是行业落地,都有一张最有说服力的名片。

 

张小龙在演讲中谈论AI的时候,透露内部还在做一个功能,但是作为一位称职的职业经理人,他迅速意识到自己应该卖个关子。

 

各位读者朋友如果有想法,不妨留言猜猜看吧~


分享到

点赞(2)

说点什么

全部评论