原创不信不可能:飞桨,划一个时代的初心
时间:2019-11-07 00:25:34 热度:37.1℃ 作者:网络
AI在哪里?
大部分人可能会想到科幻电影,或者异常先进的实验室。但是河北工业大学教授刘晶却认为AI就在一间间工厂车间里。学习了六年深度学习,花两个月时间跑了一百多家钢铁厂,最终,她把在钢铁熔炼复杂的配料过程中,老师傅们练就的三十年经验,变成了三秒就能给出最优配比的AI模型。
这个模型,每年可以为钢铁企业节省10%的原材料,把配料计算时间节省了90%。而她能做到这一切、把不可能化成可能的基础,是应用了百度的飞桨平台。
这一秒钟,千千万万个这样的故事,正同时上演在中国广袤的大地上。AI不在别处,AI就在这里,在我们的农田、工厂、矿山、办公室,在万家灯火渺渺炊烟中。
AI从天边来到千行万业去,从不可能变成可能,就是一段完整的关于飞桨的故事。
(百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰)
11月5日,“WAVE SUMMIT+”2019深度学习开发者秋季峰会在北京召开,AI开发者再熟悉不过的、被称为AI时代操作系统和百度AI底座的飞桨,又一次迎来了大规模技术升级。
毕竟还有不到两个月2019就要结束,在关注飞桨狂飙突进的速度之外,此时或许有必要回望一下关于飞桨走过的路,未来的方向,以及不变的初心。
在这些故事、逻辑和蕴藏的情感里,我们可以真实地读懂百度AI,读懂深度学习开发者,读懂中国智能时代的黎明。
盛宴:百度AI的彪悍速度
也许我们的读者都还记得,今年4月,百度曾主办了首场深度学习开发者峰会。当时很多读者给我们留言,表示飞桨升级的技术实在太多了,只是读完都感觉脑子有点跟不上。也有读者说,别人家都是一场发布会说一两个技术,百度是一场发布会说一打技术。
到了秋天,我们发现百度显然决定在彪悍之路上一条道走到黑。这次的深度学习开发者峰会上,飞桨一口气发布和重要升级21个产品方向。没错,一打已经不够用了。
峰会现场,不少媒体同行和开发者表示,技术实在太多,边听边记都跟不上速度——而百度居然就生猛地把它们一个个做出来了。
会上,百度深度学习技术平台部总监马艳军博士,介绍了飞桨产业级深度学习开源开放平台全景图,详解了飞桨全新发布的21个产品方向。
其中,十分引入瞩目的是,飞桨全新发布了4大面向应用任务的产业级端到端开发套件。包括NLP领域的ERNIE语义理解,CV方向的PaddleDetection目标检测和PaddleSeg图像分割,推荐方向的ElasticCTR点击率预估,在关键产业应用中,满足低成本和快速集成需求。
而全新发布的端侧推理引擎Paddle Lite 2.0版本,则进一步提升了飞桨在硬件端的易用性和兼容性,具有超高 INT8 量化性能。
此外,飞桨还全新发布了3项深度学习技术工具组件:联邦学习PaddleFL、图神经网络PGL和多任务学习PALM,从而将最先进的技术带到产业实践中。
EasyDL则发布了为算法工程师提供一站式解决方案的EasyDL专业版、PaddleHub 也全新升级,支持迁移学习与飞桨Master模式。
飞桨Master,也是本次峰会的一大亮点。这一模式把算力、数据、算法集成为产业级预训练模型。与大量迁移学习工具平台配合,构成了产业底座,为产业AI开发者奠定了全面基础支撑。
此外,飞桨还进行了动态图全新升级、新增大量算子库、优化API 接口,技术文档更加完善;分布式GPU训练相比其他主流框架实现了20%-100%的速度提升,分布式CPU训练最大吞吐量达到行业6倍以上;官方模型从60+增加到了100+,提供预训练模型超过200个;并且此次新开源了4个国际竞赛冠军模型;同时重磅推出了大量资源、课程、奖励赋能的飞桨生态激励计划。
对于AI开发者来说,盛宴,当如是也。
初心:飞桨的来处与去处
在飞桨令人眼花缭乱的升级,保持超高速进化的背后,或许每个人都会想问这样一个问题:到底是什么支撑了飞桨的奔跑?他们会一直这样跑下去吗?
毕竟这一年里,欧美主流深度学习框架的更新频率并不高,而欧美大型科技公司对AI开发的技术升级也多次被批评过于缓慢。
当降速的欧美AI,碰上了飞速奔跑的中国AI与飞桨,我们当然会兴奋,也自然会充满疑问。百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜,对这个问题的回答是,飞桨的升级动力来自百度AI团队与产业开发者的高效频繁沟通。
今天的飞桨,已经深深扎根于产业环境和开发生态当中。来自各个产业的AI需求、挑战和瓶颈会随时反馈给飞桨,开发者遇到的问题与挑战会随时与百度沟通。在这个开放和高效运转的空间里,百度的AI科学家们与产业开发者形成了一个整体。开发者需要什么,飞桨就去做什么;产业智能化遇到了哪些无法克服的问题,百度就去调兵遣将解决它。
这样的模式,是封闭在小环境中的互联网公司所无法完成的,飞桨的奔跑,来自百度对技术的探索和追寻,同时也来自开发者和产业的真实声音循环反馈。对此,我们的感触也十分清晰,记得今年上半年在百度黄埔学院第一期毕业礼上,我们与开发者讨论飞桨还有哪些问题。如今半年过去,这些问题真的已经被一个个升级所击破。
其实不管是大规模分布式训练、全硬件平台支持、工业级模型库,还是几大领先世界的AI操作系统特性,飞桨的背后,是对一个简单目标的极致化:让AI开发具备更高性能、更低门槛。
这是飞桨的初心,而围绕这个初心的穷思竭虑,变成了飞桨的升级速度和产业广度。
围绕开发易用性和开发性能升级,本次飞桨大规模升级里,有两个关键点可以作为很好的解读点。
一个是Master模式的诞生。所谓Master模式,从逻辑上看就是飞桨基于大量产业实践,总结出产业AI开发者到底需要哪些数据、算法和算力。然后飞桨将其最大公约数变成预训练模型。而对于企业来说,只要在此基础上进行小规模的数据标注,就可以省去复杂模型的研发成本,以及庞大冗长的训练流程,快速把AI能力结合到场景应用。
这是一个高强度面向产业实际应用的模式。它是百度AI技术的高度集成和沉淀,同时也来自飞桨对产业真实应用具体而微的理解,必须保证预训练模型与产业最大效率接轨。百度一位专家,把Master模式比作饭馆做菜时候的那锅老汤——产业应用者只需要享受一勺下去味美绝伦,而不用等待漫长而复杂的熬制过程。
再一个就是上面所说,飞桨端到端开发套件的发布。今天的情况是,众多产业开发者并不具备深厚的AI功底,但需要迫切能解决问题的AI能力。端到端开发套件,就可以让一个只有基础编程能力的技术人员,利用套件工具来解决具备主流应用性的AI问题。比如语义理解是智能语音相关AI问题的核心;视觉分割和图像检测是机器视觉能力最大的应用需求;CTR推荐具备从互联网到实体经济极其广泛的应用覆盖度。飞桨把这些套件提前做好,就可以把相应问题的AI开发门槛降到最低程度,产业可以无缝进入AI时代。
这些技术与产业智慧的碰撞结果,是将飞桨打造成了源于产业实践,与产业共进的深度学习开源开放平台。而未来,飞桨还会继续进化,毕竟核心框架的进化还在进行时、开发者的需求还有无穷无尽、中国产业智能化的大门刚刚开启。
(百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜)
吴甜认为,未来飞桨还会持续发展超大规模分布式计算、异构计算能力,定位于全硬件平台支持、端云边结合。深度学习平台还要继续向前,推进核心框架持续向完美发展;而飞桨的四大领先特性也会持续前进,坚持面向产业级应用,挖掘中国全产业拥抱AI的可能。
飞桨的去处,归根结底是百度AI科学家们看到了这样一个机会:中国拥有最广泛全面的产业链,而飞桨则提供了当今最快的AI基础设施进化速度。
广和快的碰撞,往往是奇迹的原点。
承担:智能时代的中国情怀
很多西方学者都提出过这样一个观点:中国的现代化进程,尤其是近年的经济腾飞,堪称集体主义在人类文明史中完成的奇迹。
中国人的经济智慧,是调集力量克服困难,哪怕承担一部分牺牲,也要把基础做好,把起点做扎实。然后在此基础上建设产业、发展生态,让智慧的中国人有舞台腾飞。从互联网、通讯、高铁、城建莫不如此,这也是中国之所以被称作“基建狂魔”的原因。
AI时代,人类正在悄然抵达第四次工业革命的起点。而过往的三次工业革命,东方更多时候都是看客。这次,中国AI和产业智能化显然不想再旁观和等待了。
那么谁来担当中国AI时代的“基建狂魔”呢?
自2016年正式开源以来,飞桨是中国首个也是目前国内唯一全面开源开放、技术领先、功能完备的产业级深度学习平台。它的功能与特性,已经可以支持超大规模的工业级AI开发,为产业AI担当工业大生产底座。
所以中国人的视野和情怀中,百度与飞桨责无旁贷。
事实上,在经济放缓和行业资金链下行的大背景下,百度发展飞桨是很容易理解的。但如此超高速发展,屡次完成令世界惊讶的升级,确实是逆势而行、万人亦往的。飞桨升级不仅意味着巨大的投资,同时也意味着庞大的顶级人才投入,以及大量与产业开发者的交流沟通工作、巨大的教育和人才培育投入。
但是路总要有人修、石油总要有人找,产业AI基座总要有人去建。百度在此刻,承担了一个令万千开发者、令无声的中国产业生态非常欣慰和骄傲的角色。
乌镇互联网大会上,百度CEO李彦宏首次提出了智能经济。智能经济不会招手而来,它跟石油经济、电力经济一样,要从钻井、电站做起。于是百度的选择是,拿起飞桨,就去划开一个时代好了。
百度CTO王海峰判断,具备了标准化、自动化和模块化的基本特征,正在让深度学习推动AI进入工业化大生产阶段。这个阶段里,百度的AI技术以及对AI开发的理解,沉淀为飞桨这个技术底座。让飞桨变成上接应用、下接芯片指令集的AI操作系统。
这种产业模式,事实上已经发展出了中国AI独有的产业生态原点。谷歌Tensorflow代表的主流欧美框架,并没有集成开发者大量对工具、套件、预训练模型、定制化服务的产业需求,也缺少工业级AI训练开发的支撑特征,以及与产业互动的高强度方案。
这些是飞桨的独创,也是中国AI悄然发展出的一步优势。中国的各行各业,全产业链都可能从中受益。
深度学习和飞桨,正在成为与中国未来鱼水相融的时代之路。
如钢铁,如秋实,如梦幻:飞桨的一年
写到这里,突然有种一梦忽醒的感觉。几年来,我们都在跟踪报道飞桨的快速进化。尤其在今年,飞桨可以说真正冲破了产业级的壁垒,极大程度打开了AI与现实世界的融合。
虽然飞桨是一个个技术与工具构成的,但却很容易从它和它背后的百度人那里,感觉到飞桨的温度、执念和情感。
采访中,我问吴甜和马艳军两位博士,对飞桨一年来变化最大的感受是什么。
吴甜提到了车间。飞桨这座车间里,以前是一些简易的流水线设备,对技工的要求很高。但现在车间里做出了高级车床,谁进来都可以很快开始生产自己想要的零件。而未来,飞桨会变成充满高精尖技术,现代化的,世界最领先的AI车间。
而马艳军提到了房子。他说毛坯房也能住,精装修房屋也能住,但生活品质是不一样的。飞桨这一年就是在把这座房子进行了精装,而且是生态化、环保化的精装。并且盖着盖着房子,还盖出了很多新的东西来。而大家觉得飞桨的升级令人目眩神迷,其实都是开发者的需求——建筑师的初心,是给业主想要的。
(百度深度学习技术平台部总监马艳军)
如果说AI的逻辑是一场统计学的春华,飞桨则在这一年中让它结出了钢铁般坚硬的秋实。金融行业苛刻到恐怖的数据要求可以落地于飞桨;工业流水线上精准到毫秒的时延条件生根于飞桨;企业主渴望AI,却又难以承担的成本难题,被飞桨的技术破解开。
飞桨把现实世界的不可能常识,变成了一切皆有可能的智能幻梦。
飞桨是什么?
是深度学习开发者峰会上,一座难求的热络。
是一位位田野里、工厂里的AI开发者,他们的倔强、不甘,与最终得到无数喝彩时,眼中的泪光闪烁。
是百度科学家,深夜依旧在解答开发者问题时的疲惫和执着。
飞桨是这样一个常识:如果我们跟眼前的困难握手言和,就会跟雄伟的未来擦肩而过。