【企服态度】百度大脑的前世今生
LTT LTT 2018-10-25

企服行业头条(微信:wwwqifu)10月25日报道



2011年3月,百度各项业绩创下新高,市值近五年内首次超过腾讯,位居BAT之首。


同时,伴随着国内互联网业态的欣欣向荣,百度内部从李彦宏到一众VP们都认为,去科技胜地硅谷“秀肌肉”的时候到了。

 

不过,当时百度的VP们可能不知道,从北京再次回到硅谷,是“技术男+理想主义者”李彦宏在早期做搜索引擎时就有的梦想。

 

- 1 -

起  步

 

就这样,百度的“硅谷店”很快就在2011年开张了。


根据第一位员工——百度美国资深架构师James Peng的回忆,当时在硅谷库比蒂诺,百度只是租了一间车库大小的办公室,很不起眼。


不过搬进去之后James发现,原来乔布斯的苹果公司在搬出车库后,租用的第一个办公室就在他们的隔壁。所以当时那个地方也算是“风水宝地”。

 

后来这个小分队逐渐壮大。到了2013年底,百度美国就搬到了谷歌的“后花园”——硅谷中心桑尼韦尔。


之所以深入硅谷科技圈的腹地,除了李彦宏的硅谷梦之外,更能激励百度前行的,莫过于谷歌这家公司了。 


百度研究院在硅谷桑尼韦尔的办公大楼

位于该大楼的2层(2015年图)


时间回到2012年,谷歌神秘的X实验室,用1.6万台计算机搭建了拥有10亿神经连接的深度学习神经网络,在没有人工干预的前提下,具备识别物体这一感官能力。


比如它能在2万个物体的照片中,以高准确率识别出包含“猫”的图片。


次年,深度学习技术就被《MIT技术评论》评为“年度十大技术突破”之首。

 


尽管当时这项技术,现在看起来还只是一个咿呀学语的孩子的水平,但在实际应用中却不容小觑,很多IT公司开始利用深度学习进行大范围创新:微软此前借同类技术将语音识别的错误率降低了30%;苹果在Siri中运用了深度学习技术;谷歌在翻译、语音识别系统也利用了该技术。

 

百度也看到了深度学习的潜力。至少在当时看来,它可以帮助优化搜索的核心体验。


2013年1月,李彦宏推动成立专注深度学习的研究院,并命名为Institute of Deep Learning(简称IDL)。李彦宏亲自坐镇院长,余凯任常务副院长。

 

2013年4月,百度将他们在硅谷的小分队正式命名为“深度学习研究中心” 的人工智能实验室。


实验室主要做三件事情:一是打造最具创新的环境,二是吸引最优秀人才,三是做有挑战的项目。

 

从库比蒂诺到桑尼韦尔,地点上的变迁,让百度向邻居们“挖墙脚”也方便了一些。因为从地图上看,他们左邻摩托罗拉,右邻亚马逊,上有谷歌,下有微软。地理位置得天独厚。


就这样,百度开始与国外IT巨头们展开了一场人才争夺战。

 

很快,百度硅谷实验室就先后吸引了像Fackbook前资深科学家徐伟、AMD异构系统前首席软件架构师吴韧、Twitter和Facebook数据中心建设的负责人Ali Heydari、曾训练世界级最大人工神经网络的Adam Coates等顶尖人才的加入。

 

为了进一步夯实人才实力,培养人工智能技术人才,2014年1月,IDL启动“少帅计划”。该计划首批设有9个名额,入选人员可直接拿到百度T9至T10的职级,年薪百万人民币起步,上不封顶。


此外,“少帅”们如果通过3年考核,即有机会获得“百度天使投资”,并全权带领20~30人团队,独立领导创新项目。

 

为了帮助“少帅计划”入选者顺利成长,百度还配备了团队阵容豪华的导师,包括李彦宏、余凯、张潼、徐伟、吴韧等在内的世界级科学家。


 

有了人才的底气,2014年初,李彦宏就对外表示,百度要做自己的“百度大脑”,用技术模拟人脑思维,初步达到2~3岁孩子的智力水平。这也是百度大脑首次被公众所知。


后来在2014年5月,百度给硅谷的研发中心带来了两件惊喜:一是3亿美元的研发基金,另一个就是挖来了吴恩达博士。


斯坦福大学人工智能实验室主任吴恩达

“谷歌大脑”和“百度大脑”的重要参与者

 

当时,美国IT界几乎没有人不知道吴恩达。他不仅是斯坦福大学人工智能实验室主任,也是“谷歌大脑”主要创建者之一,创办的在线公开课Courera更为他带来如潮好评。

 

有钱又有科技界大牛作“金字招牌”,李彦宏在年初宣布的“百度大脑”计划很快就步入了正轨。


与此同时,百度在国内的研发团队也没闲着,在北京也设立了另外两大实验室:北京深度学习实验室(原深度学习研究院)和北京大数据实验室。

 

后来百度“少帅计划”代表人物顾嘉唯加入百度IDL实验室,担任主任研发构架师,负责人机交互;


2015年6月,NEC美国智能图像研究院负责人林元庆加入百度,出任深度学习实验室主任;


黄畅(原IDL主任架构师)、倪凯(百度无人驾驶汽车团队前负责人)、师从机器学习专家Alex Smola的李沐也先后加入百度。


尽管后续这些参与百度大脑构建的元老们如今几乎都已离开,但我们不可否认的是,彼时的百度,绝对算的上是国内较早一批人工智能的布道者、技术领域的黄埔军校。


 - 2 -

试  水

 

2014年可以说是百度“将相齐全,大胆试水”的一年。

 

从技术研发上看,百度需要挑战的是三级火箭:


底层是开放云,包括低能耗数据中心、超大规模分布式架构、新一代智能自动化运维、超强云安全;


在这之上是大数据平台,包括新一代数据库管理和查询技术、大数据挖掘机;


最上层则是“百度大脑”,包括深度学习、超大规模机器学习、大规模GPU并行化平台等。

 

这些基础主要塑造的是“百度大脑”在智能语音、图像识别、深度学习、运动捕捉等基础技术。


吴恩达加入之后,百度在硅谷的技术团队也很快取得了突破,研究出了一种新的语音识别方法——深度语音系统“Deep Speech”。它可以在嘈杂环境下实现超过80%的辨识准确率。


而当时其他的商业版语音识别API,包括Bing、Google以及Wit.AI等的最高识别率仅有65%。

 

“当红炸子鸡”特斯拉很快和百度一拍即合。从2014年11月19日开始,特斯拉的中国车主们可以使用语音控制导航、车载娱乐系统以及通过蓝牙打电话发短信等。

 

在各种AI技能之上,百度还推出了消费级的产品,包括BaiduEye、百度魔镜、百度无人车驾驶汽车、百度识图、百度机器人、DuBike、百度筷搜等。


另外在生态层面,百度也先后开放了语音、图像等人工智能相关技术,吸引第三方软件的接入,打造生态链。

 

但好景不长。


到了2015年,百度的人工智能开始饱受诟病。

 

毕竟如果说百度的搜索业务已经是成熟的现金牛,那么当时百度的人工智能还处于培育期,更多在感知和认知层面。


而且承载各项智能技术的硬件产品,也都只能算是“功能机”的水平,离“智能机”还有相当的差距。


同时,百度也意识到在2014年中推出的消费级智能产品,其实在市场上并不成功。除了无人汽车和小度机器人至今还有新的进展和动向之外,其他产品线如今基本上都收缩了。


另外当时百度在AI方面其实也有些“三心二意”,因为在2014年,百度投入了诸多资源在O2O业务上。


彼时,随着移动端的普及,科技巨头都希望做好O2O业务,来占据用户移动端的生活社交入口。百度也是如此,尤其是移动端对Local Based Service(LBS)的依赖。从百度地图等的业务发展来看,做O2O是必然的趋势。

 

但其实资本市场并不看好百度押注O2O,因为O2O需要大量的线下资源投入,现金补贴,且利润率低。


百度的优势是技术,O2O需要依靠运营培养足够的用户忠诚度,将用户沉淀下来,这对于百度而言无疑是个难题,也很难和别的业务进行协同。


后来大众点评与美团的合并,也让百度O2O业务遭遇重挫。

 

更让百度元气大伤的是,IDL开始出现核心成员动荡:包括创始人、常务副院长余凯、百度IDL杰出科学家吴韧、百度IDL首席架构师黄畅、IDL主任研发构架师顾嘉维以及百度无人驾驶汽车团队前负责人倪凯等人都先后离职。

 

因此,百度开始减慢产品推出的速度,集中精力在核心领域寻求突破,在无人驾驶和智能语音方向发力。

 

- 3 -

调  整

 

到了2016年,百度开始把人工智能作为百度“核心中的核心”,人工智能对于百度来说意味着什么?李彦宏用了4个字来简单描述:百度大脑。


语音、图像、自然语言理解和用户画像能力,组成百度大脑1.0的主要能力。

 

当年,百度世界大会的主题非常鲜明——AI is the new electricity。百度直接把AI比喻成无处不在的电力,为互联网时代提供新兴能量。


现场,百度大脑1.0正式公布。它已经具备基础AI能力以及核心技术开发平台的作用了,并且拥有超大规模的神经网络+计算能力+大数据的体系。

 

当时百度大脑现场根据张国荣国语声音片段,合成了一段来自天堂的告白;百度金融形象大使胡歌站台念完宋词《青玉案·元夕》的上阕之后,机器自动合成了一段音线相似的下阕念白。


李彦宏(左)、胡歌(右)

胡歌在念《青玉案·元夕》的上阕

 

这样类似的语音合成请求,当时百度每天会接到近2.5亿次请求。


百度希望能触及的市场不只是搜索和收听,他们还想在无人驾驶、教育、智能家居领域进行场景落地。


于是依靠技术平台化的打法基本确定,吴恩达宣布全面开发百度的两大核心AI平台:深度学习平台和“百度大脑1.0”平台。

 

百度深度学习平台的特色是以更少的数据准备及训练配置,实现易学易用、性能高效;而百度大脑1.0开放平台则向合作伙伴开放技术与培训资料,实现因智而能,促进行业发展。

 

这场大会基本确定了百度“All in AI”的决心,想要拿到打开未来智能社会的钥匙。


尽管打法已经确定,吴恩达在台上的介绍也有条不紊,一切看起来似乎都在向着百度有利的方向发展。但平静之下却又遇暗流。


因为实际上,当时吴恩达带领的百度研究院,在内部的处境却有些尴尬。

 

因为百度还有另外一波人工智能势力——由王海峰带领的自然语言部(NLP)。


这是百度真正元老级的部门,几乎把控制百度的整个命脉。

 

在2014年,原微软公司首席研发总监景鲲加入百度,就职于大搜索任总产品架构师。当时百度搜索团队就有做度秘的想法。而人工智能确实跟搜索有着“血缘”关系。所以王海峰带领景鲲、朱凯华等从2014年开始自发研发度秘。


在一年后的百度世界大会上,李彦宏正式介绍度秘出道,标志着内部两股人工智能势力的形成,而且互相之间的合作并不顺利。

 

一方是由内而生的搜索团队,一面是李彦宏亲力推动的外生力量研究院,哪怕李彦宏已经提出转战人工智能的战略,但是两派并没有进行有效融合。而且李彦宏在2016年也没有过多的精力去对内部的管理进行梳理。

 

不夸张的说,那一整年百度都在疲于应付外界丑闻。


从年初的卖血友病吧,到年中5月的“魏则西”事件,直接导致百度广告业务被监管、收入暴跌。


当时,阿里和腾讯的市值已经有2400亿美元左右,但是百度却一直在五六百亿美元徘徊,身位逐渐被拉开。

 

眼看AI就快熬出头,却防不住社会舆论的打压。李彦宏如坐针毡。


喜出望外的是,很快李彦宏听说陆奇刚从微软因病辞职,就马上把人给挖了过来。


被寄予厚望的陆奇如同神兵天降。

 

不出所料,陆奇在2017年初成为了百度的二把手,李彦宏让百度现有各业务群组及负责人都直接向陆奇汇报工作:包括搜索公司总裁向海龙、技术体系和新兴业务群组总裁张亚勤、高级副总裁朱光携金融业务群组、高级副总裁王劲携无人驾驶事业部和首席科学家吴恩达带领的人工智能技术团队。

 

陆奇捏着李彦宏给他列出的百度Top10挑战,站在了媒体的面前。严谨、低调是陆奇给人一贯的印象。当然,也不乏发布会PPT出现错别字,直接公开为李彦宏拍马屁这样的桥段出现。

 

但不得不说,陆奇几乎拯救了百度。把百度从笼罩在魏则西事件、血友吧等负面舆论的情绪中拉了出来。


他用作为职业经理人的专业,让松散的公司组织变得聚焦和清晰起来。

 

上任之后,陆奇主要推动了两件事情:一,重新梳理百度的业务架构和人事;二,推动AI产品落地,为百度确定了“夯实移动基础、决战AI时代”的战略。


陆奇杀伐果断,直接裁撤医疗事业群、成立智能驾驶事业群组(IDG)、领衔筹建国字号国家深度学习实验室、收购渡鸦科技、升级度秘事业部等。

 

而原来百度体系内的两股人工智能势力,研究院一直处于节节败退的局势,布局很多硬件产品却很少有被市场认可;得不到百度搜索大数据的支撑,百度研究院也很难产生实际成果;人才流失严重…….

 

于是,陆奇将原度秘团队升级为度秘事业部,并直接向其汇报。内部的搜索派与外部的研究院之间的争斗,就这样以吴恩达2017年3月的离职而正式宣告结束。


 

尽管失去了吴恩达,但回头来看,经过陆奇梳理过后的百度AI,的确有了更加清晰的定位:AI开放平台面向开发者开发,由百度大脑2.0和百度智能云两部分组成,无论是DuerOS还是Apollo,都是基于百度大脑2.0来获得越来越多的知识和能力。



百度大脑2.0包括算法层(机器学习平台+深度学习平台)、感知层(语音识别、图像识别、AR/VR等)、认知层(NLP、知识图谱、用户画像)和平台层(AI开放平台);智能云是整个AI平台的基础,由AI+大数据+云组成。

 

陆奇把百度云和百度大脑2.0进行结合,看到的是云计算公司AI化的趋势。比如谷歌在美国就是用TPU颠覆亚马逊的业务。


同样在国内,百度也有相似的机会。

 

百度AI也不再是简单的通过智能技术进行分类,而是从市场和功能出发,做更细致的产品划分,为AI接入各行各业开始做准备。

 

- 4 -

续  航

 

一年零四个月之后,陆奇离开了百度。百度AI的故事似乎才刚开始却戛然而止。

 

背后的原因,外界诸多猜测,比如在陆奇调整架构期间,王劲、吴恩达、曾良、陆复斌、李东旻等人相继离职,恐怕留下来的员工也存在不少怨念。李彦宏虽然放权给陆奇,但是自己却去盯着百度Feed流业务,马东敏也回归百度系,让这位外来的职业经理人所能调配的资源,存在诸多变数。

 

但无论如何,百度失去了陆奇,AI之路还要继续,李彦宏只好重新亲自接盘续航。

 

在今年7月份举行的百度AI大会上,“Everything Can AI”成为新口号。李彦宏不再向外界秀技术,而是秀产品了。

 

百度Apollo与金龙客车合作打造的“阿波龙”客车开始量产,自动驾驶系统Apollo迭代至3.0版本;发布AI芯片“昆仑”;


百度大脑也进入了3.0阶段,最大的变化是开始实现多模态深度语义理解功能,并且百度大脑的开发能力也从2.0版本的60余项增加到了3.0版本的110多项。 

 

百度大脑3.0已经成为能够进入行业商业化的重要AI赋能平台,开始成为水、电、媒一样的存在。


在自我进化的同时,百度大脑3.0也开始将触角延伸到更细分的产业,从市场的灼炼中汲取更多价值和养分。

 

比如就企业服务领域来说,前段时间,百度提出了基于百度大脑平台的 “企业服务解决方案”,同时在去年发布的“燎原计划”之上,推出 “百度大脑行业创新合伙人计划”。

 

我们可以从两方面来理解百度在企业服务的布局: 

  • 一是基于百度大脑的AI能力,针对不同的企业服务场景,比如客户服务、财务税务、人力资源等,提供呼叫中心、会议服务、简历智能匹配、销售培训等服务;另外百度想借助自身平台的流量和品牌优势,吸引一批合作伙伴加入,来弥补在AI技术市场化能力上的短板。

 

自从燎原计划发布以来,加入百度的企业已经超过了200家,其中有73家优秀企业进入了百度AI加速器。燎原计划2.0将推动AI产品与方案的丰富性,有助于百度大脑在行业落地时形成完整的交易闭环。

 

  • 二是百度大脑的AI能够云化,为前端的Apollo 和 DuerOS 提供技术支撑。张亚勤在百度云智峰会上提出要三位一体发展,也就是人工智能、大数据、云计算深度结合,又称为ABC战略。

 

百度公司总裁张亚勤


“百度云的目标不是行业第一,而是要成为最智能,最能为客户解决实际问题的云。”


张亚勤曾这样形容这朵百度云。通过 ABC 赋能企业级市场,为金融、工业制造、农业等行业提供基于数据的行业洞察,推动业务流程与模式变革。


同时,ABC 的深度融合也创新出机器人、自动驾驶等新业态,为产业智变带来新机遇。


尽管百度大脑的发展历程一波三折,但我们依旧愿意相信,百度大脑正在把未来带给现在的我们。

 

本文素材参考自:腾讯科技、Techweb、华尔街见闻、华尔街俱乐部、深几度、极客公园、21世纪商业评论、iFeng科技、物流搜索、微型电动车、杨静lillian等

分享到

点赞(1)

说点什么

全部评论