分享热点新闻
打造优质自媒体!

波峰会2021年在飞桨, 百度加9 Buff 人工智能很快上线 嘿 只是玩

5月20日,由深度学习技术与应用国家工程实验室和百度百度联合主办的WAVE SUMMIT2021深度学习开发者峰会在北京召开,首次公布了人工智能集成与创新趋势下AI工业化大生产的实现路径,飞桨深度学习平台带来新的发布,继续引领深度学习技术的发展。

峰会上,深度学习技术平台部高级总监就新发布升级发表了讲话,何表示,年初,正式发布开源框架2.0版,是发展的重要里程碑,2.0版将默认编程范式从静态图升级为动态图,实现了动态与静态的统一设计,很好地兼顾了科研和行业的需求。目前,飞桨深度学习开源平台已从基础模型库、端到端开发工具包升级到基于框架2.0版的工具组件,开发体验得到全面提升。2.0版本的大规模培训能力不断突破,参数服务器技术在迭代,达到第三代,是业界第一个通用的异构参数服务器架构。近日,4D混合并行技术发布,支持超模训练。

波峰会2021年在飞桨, 百度加9 Buff 人工智能很快上线 嘿 只是玩 科学快报 第1张

峰会的飞桨框架再次发布,展示了最新的科技成果和开源生态成果,其关注度可想而知。接下来,我们将从开发、培训和部署的整个环节揭示飞桨开源深度学习平台的最新成果。

 飞桨开源框架V2.1,技术底座呈破圈之势

基础设施迈出一小步,人工智能走向在线迈出一大步。

峰会上,飞桨开源框架正式发布V2.1,对自动混合精度、动态图和高级API进行了优化和增强。特别是自定义算子函数完全升级,降低了开发者自定义算子的学习开发成本,“自定义OP函数优化”等升级带来了科研开发的极大灵活性和扩展能力,工业应用从成熟的AI行业延伸到生物、物理、化学等大科学跨境领域的开发集成,助力前沿基础科研。

打包更加简洁,训练和推理完全打开,算子API一键编译安装生成,有效降低了开发者编写和使用自定义算子,的成本,让开发者更加关注算子计算的本质。DeePMD-kit就是一个典型的案例。DeePMD-kit自发布以来,已广泛应用于凝聚态物理、化学物理、材料合理设计、生物物理、药物分子设计等领域。DeePMD-kit的社区开发者可以利用飞桨框架的定制OP函数,轻松定制计算单元,加快功能开发。

开发方便灵活,应用普遍多样。飞桨正在一步步打造领先同行的深度学习和开源能力,产业渗透呈现“破圈”趋势。

 大规模图检索引擎,特殊场景的“启动密码”

随着大规模图学习在知识地图和搜索推荐领域的广泛应用,大规模图模型训练越来越受到重视,成为许多特殊场景的“启动密码”。

飞桨提供了从分布式数据处理、图形检索、前向和后向图形模型计算和多服务器参数更新的全过程的通用分布式能力,形成了大规模图形模型训练框架。对于图检索阶段,本次发布的图检索引擎可以高效支持数万亿条图边的存储和检索,并通过双层哈希切分方将图的邻接表存储在不同的图服务器上,工作人员通过图检索引擎请求图服务器获取子图进行训练。最后,是t

该技术已在网易云音乐主播推荐服务中得到应用,基于大规模图形检索引擎和飞桨分布式培训技术,成功支持语音主播业务的图形模型培训,通过知识转移有效解决冷启动问题,提高主播推荐场景的有效播放率。

 ERNIE四大预训练模型,开源家族又添生力军

在模型套件方面,文心的ERNI发布了4个预训练模型,分别是多粒度语言知识增强模型ERNI-Gram、集成场景图知识的跨模态理解模型ERNI-Doc、集成语言和视觉的模型ERNI-UNIMO。知识与深度学习相结合,可以实现知识增强的语义理解,既能理解语言,又能理解图像,实现统一的跨模态语义理解。

ERNI-Gram提出了一种显式的n-gram掩码语言模型,通过引入多粒度语言知识来增强预训练模型的效果。五个典型的中文文本任务的效果明显优于行业开源预培训模式。

ERNI-Doc提出回溯建模技术和增强记忆模型机制解决长文本建模不足的问题,在理解长文本的13项任务中取得领先成果。

ERNI-ViL,针对跨模态理解的问题,基于知识增强的思想,实现了集成场景知识的跨模态预训练,在5个跨模态理解任务中取得领先成果。

ERNI-UNIMO进一步增强了不同模式间的知识融合,并通过跨模态比较学习,提高了跨模态语义理解和生成、文本理解和生成的效果,在13个跨模态和文本任务中实现了主导作用。

推理部署导航图,打通AI应用最后一公里

在工业数字化的背景下,人工智能建设正从互联网市场走向千行,所有行业,落地成为必然要求。AI能否合理顺利的部署,已经成为成败的关键。飞桨提供了一个全过程深度学习开发工具。根据不同的软硬件部署环境,飞桨提供了完善的推理部署工具,开辟了完整的工具链。

峰会上,飞桨多终端多平台推理部署工具链发布并全面升级。飞桨模型压缩工具PaddleSlim模型压缩升级,优化剪枝压缩技术,添加非结构化稀疏工具,具备软硬协同优化能力,结合多种压缩策略优势,率先支持OFA压缩模式,实现不同部署环境的高精度压缩。飞桨轻量级推理引擎Paddle Lite也已全面升级,稳定易用,性能卓越,多硬件支持。Paddle Serving根据服务部署的实际需求,增加了完全异步的设计流水线模型,可以打破串行设计的约束,提高吞吐量和GPU利用率。飞桨,前端推理引擎Paddle.js新升级后保持高兼容性,完全支持飞桨Framework 2.0及更高版本的模型格式,新支持多种后端和主流图像分割分类模型,兼顾高兼容性和高性能。另外,划水。JS还引入了前端模型加密解决方案,有效提高了服务的安全性。

推理部署工具链中每个工具的升级都在加速,整个链的流畅度也很重要,这在一定程度上决定了AI应用的最后一公里能否顺利。峰会上,一张飞桨推理部署成功的导航图引人注目,300多条部署路径一目了然,深刻诠释了飞桨在开启AI应用最后一公里的不懈努力。

波峰会2021年在飞桨, 百度加9 Buff 人工智能很快上线 嘿 只是玩 科学快报 第2张

 硬件生态新成果,AI工业大生产“朋友圈”再扩容

AI基础软硬件的生态建设意义重大,芯片与深度学习框架的融合成为打造全球领先AI应用推广生态的关键。

飞桨的繁荣离不开硬件生态伙伴的支持。硬件生态方面,从去年WAVE SUMMIT2020发布硬件生态合作圈到今天,飞桨已经和包括百度昆仑、英, 特尔在内的22家国内外硬件厂商进行了适配和联合优化,31个芯片或ips已经完成并正在适配中。

飞桨正与合作伙伴携手加快软硬件整合,提供强大、高效、可扩展、高性能的解决方案,帮助实现人工智能创新,促进人工智能产业化大规模生产的实现。在峰会上,来自英特尔, 英大卫、海光, 华为盛腾、瑞新威的众多合作伙伴展示了企业硬件生态的成果,飞桨生态的硬件圈再次扩大。

 螺旋桨、量桨最新升级

除了新发布,还见证了螺旋桨和测量螺旋桨的最新升级。

PaddleHelix升级到1.0的官方版本,增加了复合预训练模型ChemRL,应用于更多的下游任务。今年3月,在国际权威图形神经网络OGB上,两个与毒品有关的数据集,艾滋病毒和PCBA,获得了双冠军。

桨量子是适应飞桨帧2。x,整体运营有很大提升;测量桨的整体功能得到了进一步增强,适应了最近的量子设备,增加了量子核方法等特征提取方法。对于纠缠提纯这一艰巨任务,在测量桨上增加了优化的量子纠缠处理框架,给出了行业最佳且可实施的提纯方案,多个场景达到行业最佳。

在AI量产阶段,飞桨作为百度大脑“AI量产平台”的基础基地,一直保持着迭代,的高频更新,既是“技术启用者”,也是“价值启用者”。根据国际数据公司的数据,飞桨是世界上三大深度学习框架。目前,飞桨平台已聚集320万开发者,同比增长70%,服务12万企事业单位。“人工智能赋予万物以力量”的飞桨威武再次凸显,“用科技让复杂的世界变得更简单”的百度使命也以行动实践。