文|曾响铃
来源|科技向令说(xiangling0815)
除了“技术炫”,人工智能的另一大特征是“开会多”,然而,专门针对“深度学习”的开发者大会却少之又少。
究其原因,搞“技术”的AI企业,在深度学习这件事上反而被“技术门槛”所钳制。不过,这对于一直深耕技术的AI企业来说,也就成了优势,例如拥有国内唯一开源深度学习平台PaddlePaddle的百度。
4月23日,百度就与深度学习技术及应用国家工程实验室在北京联合主办了首届(2019)WAVE SUMMIT深度学习开发者峰会。
不开则已,开则“有料”。
百度高级副总裁、深度学习技术及应用国家工程实验室主任王海峰面对大批深度学习开发者,抛出“深度学习推动人工智能进入工业大生产阶段,深度学习框架是智能时代的操作系统”的言论。
这句话有两个关键词:AI的发展要进入一个新的阶段—“工业大生产”,而这个新的阶段深度学习框架将起到关键作用—“操作系统”。
深度学习在AI体系内的关键价值,使得它已经成为AI深入发展的技术堡垒,也成为各平台转型AI企业角逐AI时代的核心内容。WAVE SUMMIT 2019百度试图率先举起深度学习的旗帜,通过站位“智能时代的操作系统”扩大AI竞争优势的意图,而王海峰敢这么说,百度已有充足的自信。
AI“工业大生产”临门一脚,深度学习成为“跃迁”力量
AI深入发展的表现之一,是提出“为什么AI”的企业正逐渐减少,而提出“为什么不AI”的企业群体逐渐庞大。
当最传统的制造业等产业也开始把“智能+”挂在嘴边时,多样化场景反过来需要平台型AI企业在各种层次上进行开放:
有些开发者只需要借助外部技术完善自家产品,例如智慧客厅场景中,OTT TV的智能互动(语音、图像等)需求,或互金平台、游戏平台等的智能客服需求,这些是目前多数AI企业在技术上所能达到的层次;
有些开发者则因为业务的特殊性,需要借助外部更基础的深度学习框架能力,如构建农业病虫害治理应用,这种AI技术呈现出“高门槛”的特征,能够提供开发者生态的少之又少。
很明显,越是高通用性的领域,AI技术越是只需要到达“表层”;越是低通用性的领域,AI技术的介入越需要切入“深层”。
问题来了,语音、人脸可以依靠通用性快速普及,那些需求越来越旺盛的AI个案应用怎么办?——AI全面发展必然要解决“个性化”与“规模化”的矛盾问题。
王海峰提到的深度学习的通用性特点,以及深度学习框架及平台的发展,正在推动人工智能标准化、自动化和模块化,进入工业大生产阶段,就是在针对这个问题。其解决方式本质是通过深度学习框架,让AI在“深层”也实现“框架能力”的通用性(对应地,AI已经在“表层”实现“应用能力”的通用性),如此,专属领域的AI应用也可以被“批量生产”。
由此,也不难理解PaddlePaddle同时在峰会上发布的中文名字“飞桨”——AI发展到了这个阶段,深度学习已经急速划动AI潮流、帮助AI跃迁进入“工业大生产”时代。
这里通过百度PaddlePaddle平台案例来理解。
在林业管理中,红脂大小蠹是非常严重的害虫灾害,过去,林业管理系统需要通过人力监测来预报和治理虫情,现在,北京林业大学在百度PaddlePaddle支撑下研发的智能虫情监测系统,30分钟可完成原本研究院一周的观察工作量,大大提升了灾害防治的效率;
此外,百度曾基于PaddlePaddle深度学习能力完成了一个“AI控烟”监测项目,数万张吸烟动作图片进行了43次深度学习模型训练,能够以较高的准确率完成吸烟人群的识别。
这些案例与人脸识别不同,都具备极强的“个案”色彩,其需求是独特而少有的,传统AI平台在应用层并不能提供对应的解决方案,开发者必须借助深度学习平台自主开发、训练和部署应用。
反过来,这些“个案”的生产实际上建立在框架能力的通用性基础之上,图像识别的深度学习还能以同样的姿势生产出更多有关“识别”的个性化AI应用。
如果类比人类历史上的工业发展变革,深度学习框架实际上也提供了“标准化、自动化、模块化”的生产平台,只不过生产的东西变成了“AI应用”。
抢占智能时代的“操作系统”,百度PaddlePaddle竖起中国深度学旗帜
按王海峰的观点,深度学习框架下接芯片、大型计算机系统,上承各种业务模型、行业应用,是“智能时代的操作系统”。
这也可以理解为,AI深度学习之战,就是抢占智能时代“操作系统”的战争,而“操作系统”的价值不言而喻,这也给了“技术派”百度更充分的底气。
至少在现阶段,凭借深度学习领域的三个“唯一”,百度PaddlePaddle已树立中国深度学习的一面旗帜,打造了一套运行良好的“操作系统”。
1、唯一具备深度学习所需的前置技术积淀
解决问题(AI应用),与教一个人如何“解决问题”(深度学习自构建AI应用)有着维度上的不同。
深度学习的平台服务能力,不是找上一批人、搭上一个班子就能快速上马的,它需要的长时间的深厚积淀,如同飞机发动机的研发只能依靠技术沉淀而没有“捷径”一样,“财大气粗”短期投入突破的可能性并不大。
百度的深度学习历史可以追溯到2013年设立全球首个深度学习研究院,这比大多数AI企业切入AI领域还要早。
2016年PaddlePaddle正式开源,形成了目前国内唯一开源开放、功能完备的深度学习框架,之后的2017年,百度又在国家发改委批复下牵头筹建了国内唯一的深度学习技术及应用国家工程实验室。
其结果,是百度形成了难以被追赶的深度学习积累,不论是率先开源还是筹建实验室,在国内不存在对手。其他提供深度学习开发服务的AI企业,其发展阶段还远未到能够开源或被官方认可的程度。
2、唯一具备开发、训练、部署无死角系统化能力
深度学习框架这个“操作系统”也有自己的构成:开发、训练与部署的“三步走”标准姿势。
用大白话说,先针对要处理的数据构建一套合适的模型(可自己设置也可以利用深度学习平台提供的现成案例),把这个模型到平台上跑很多次教会它识别数据,最后将成型的“产品”装载到硬件或云端,最终一个AI应用被生产出来。
这三个环节缺一不可,模型建立不佳,大方向失误;训练能力不足,要么教出“差学生”,要么教出“坏学生”;部署时掉链子,好好的成型“产品”被搭载的平台拖累甚至难以执行。
深度学习框架是“取整函数”,任何一个环节缺失或能力不足就让“操作系统”的价值大打折扣。
上文百度PaddlePaddle所谓唯一“功能完备”的深度学习框架,其意义也在于此——“无死角”的系统化能力。
例如,在开发环节,PaddlePaddle已开源60多个经过真实业务场景验证的官方模型,涵盖视觉、NLP、推荐等AI核心技术领域。其中,新发布的视频识别工具包,能为开发者解决视频理解、视频编辑、视频生成等一系列任务,可实现一键式的高效配置来做训练和预测;
在训练环节,PaddlePaddle对原有大规模分布式训练(即多个芯片一起进行计算)进行了升级,一方面提升协同训练的效率,另一方面大幅度放松训练所需求的软件、硬件、带宽环境(可理解为各种学习条件下都能“好好学习”);
在部署环节,PaddlePaddle的软硬一体能力起到了重要作用,例如有针对多硬件支持的底层加速库和推理引擎Paddle Mobile和新发布的Paddle Serving。这可以理解为老师除了教会学生知识,还给予他们快速适应环境、实践上手的能力。
马化腾曾经当面承认李彦宏的百度在人工智能方面走的更靠前,而腾讯则要落后不少。回过头来看,这样唯一全套齐备的深度学习平台出现在百度并不意外。
3、唯一具备技术理解基础上的细节优化能力
通用AI应用十分强调易用性,拿来就用,接通就能放到实际业务中。
事实上,包括AI在内,所有涉及信息化的技术越是“深度”,也越要谈“易用性”。可读性、兼容性、开发效率都是操作层面的注意点,如同Windows操作系统一直在优化其体验一样,开发者也讲“体验”。
而在没有深度理解之前是无法谈细节的,越到细节优化层面,PaddlePaddle越难以看到对手。
例如,与“标准化、自动化和模块化”相对应,PaddlePaddle提供了包括迁移学习、强化学习、自动化网络结构设计、训练可视化工具、弹性深度学习计算等在内的工具组件。此外,Paddle还提供零基础定制化训练和服务平台EasyDL和一站式开发平台AI Studio。
工具化、平台化降低了深度学习的门槛,AI“工业大生产”将拥有更多参与者。PaddlePaddle深度学习框架作为智能时代的“操作系统”,也能让“用户”快速上手、实现生产力目标。
飞轮效应典型适用,深度学习平台一步赢步步赢
操作系统的市场开拓是“飞轮效应”的典型案例——起步慢,一旦超过临界点就会越跑越快,竞争优势持续扩大,Windows、Android皆是如此。
深度学习框架这个“操作系统”也不例外。
如前文所言,积累和沉淀需要漫长的过程,但行业“旗帜”一旦打起来,就难以再被追赶,正如PaddlePaddle。
其原因与普通操作系统一样,达到一定规模后,市场与生态的延展由“主动式”变为“吸附式”,持续做好产品新用户就会源源不断被“吸附”进来,竞争对手抢占市场的代价变得更高昂。
这次峰会上,百度宣布其一站式开发平台AI Studio将为开发者提供总计1亿元的免费算力,包括“一人一卡”模式下大量派发V100训练卡(实体的训练单元),以及远程集群模式下AI Studio云端算力使用。
此外,高校方面,百度提供有深度学习师资培训,通过专项基金以及AI Studio教育版,培育深度学习领域的高校人才;企业方面,百度之前黄埔学院基础之上,还发布“AI快车道”计划以及AI技术的生态扶持计划,预计深度扶植1000家AI企业;开发者社区方面,百度则通过课程和赛事激发开发者群体的创新精神。
有外部开发者群体不断被吸附,也有核心平台积极为开发者破除AI应用开发的桎梏,百度深度学习生态的发展已经进入滚雪球模式。
从整个市场竞争格局而言,“旗帜效应”下的“圈地运动”将只有一个玩家——不用“跑马”圈地,旗帜照耀之处,皆是权属土地。
*此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
【完】
曾响铃
1钛媒体、品途、人人都是产品经理等多家创投、科技网站年度十大作者;
2虎啸奖高级评委;
3作家:【移动互联网+ 新常态下的商业机会】等畅销书作者;
4《商界》《商界评论》《销售与市场》等近十家杂志撰稿人;
5钛媒体、界面、虎嗅等近80家专栏作者;
6“脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业。
7现为“今日头条问答签约作者”、多家科技智能公司传播顾问。