飞桨(百度深度学习平台)_百度百科

飞桨

百度深度学习平台
展开2个同名词条
收藏
0有用+1
0
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集核心框架、基础模型库、端到端开发套件、丰富的工具组件、星河社区 [47]于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台 [1-2]飞桨在业内率先实现了动静统一的框架设计,兼顾科研和产业需求,在开发便捷的深度学习框架、大规模分布式训练、高性能推理引擎、产业级模型库等技术上处于国际领先水平。 [48]
飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,高效支撑以文心一言为代表的文心大模型的生产与应用。
IDC发布的2022年 [46]中国深度学习框架和平台市场份额报告显示,百度稳居中国深度学习平台市场综合份额第一 [46]中国信息通信研究院《深度学习平台发展报告(2022)》指出,飞桨已经成为中国深度学习市场应用规模第一的深度学习框架和赋能平台 [41]
当前飞桨已凝聚800万开发者,基于飞桨创建80万个模型,服务22万家企事业单位,广泛服务于金融、能源、制造、交通等领域 [50]
中文名
飞桨 [5]
外文名
PaddlePaddle
隶属公司
百度
语    种
C++、Python
平    台
Windows、MacOS、Linux(Ubuntu、CentOS等)
最新版本
v2.5 [49]

发展历程

播报
编辑
  • 2018年7月,开源框架 v0.14发布——提供从数据预处理到模型部署在内的深度学习全流程的底层能力支持。官方首次开源CV/NLP/语音/强化学习等10个模型。
  • 2018年10月,开源框架 v1.0稳定版本发布——提供更稳定、向后兼容的API,易用性大幅提升。提供 MacOS 下的多种安装方式,新增对Python 3.5的支持。并开源8个CV、NLP 方向主流模型。
  • 2018年11月,开源框架 v1.1发布——支持万亿规模稀疏参数大规模多机异步训练。移动端预测新增Mali GPU、Adreno GPU、FPGA等硬件支持。开源5个推荐领域模型,大幅优化CV、NLP模型的训练速度和显存占用。
  • 2018年12月,开源框架 v1.2发布——CPU多机异步训练升级包括worker异步并发和IO、通信优化在内多项功能,整体吞吐大幅提升。支持Python 3.6及以上各版本。模型库新增图像分类任任务的预训练模型、语言模型任务新增基于cudnn的LSTM实现、分布式word2vec模型。
  • 2019年3月,开源框架 v1.3发布——统一Executor和ParallelExecutor接口,正式发布AnalysisConfig 预测接口,支持计算图分析、算子融合等优化;模型库新增发布飞桨视频模型库,提供5个视频分类经典模型以及适合视频分类任务的通用骨架代码;新增支持NLP语义表示BERT模型,支持多机多卡训练,支持混合精度训练,训练速度对比主流实现提升50%+;发布大规模稀疏参数服务器Benchmark。
  • 2019年4月,开源框架 v1.4发布——正式发布模型压缩工具包PaddleSlim和模型预测服务Paddle Serving,全面提升飞桨部署能力。正式发布视频分类工具包,覆盖主流视频分类模型;正式发布PaddleNLP,工业级中文NLP工具与预训练模型集。正式发布PaddleHub预训练模型管理工具,提供包括预训练模型管理、命令行一键式使用和迁移学习三大功能。发布业界领先的超大规模并行能力,包括大规模稀疏参数服务器解决方案、工业级数据处理、带宽不敏感训练能力等。
  • 2019年7月,开源框架 v1.5发布——正式发布动态图Preview版并提供 7个模型动态图版本官方实现。PaddleHub共提供40+预训练模型,覆盖文本、图像、视频三大领域八类模型,并全面提升易用性,发布PaddleHub官网。模型压缩框架PaddleSlim新增基于模拟退火的自动剪切策略和轻量级模型结构自动搜索功能(Light-NAS)。官方模型库正式发布PaddleDetection物体检测统一框架、图像生成库;升级视频识别与定位工具集;发布PaddleNLP-Research,包含百度在 NLP 领域近期研究工作。
  • 2019年11月,开源框架 v1.6发布——训练框架进一步优化了速度,完善了显存优化机制,并支持在框架外部自定义C++/CUDA OP。分布式训练新增LocalSGD、GEO-SGD等策略,大规模同步训练、异步训练速度继续提升,并支持K8S + Volcano任务提交。服务器端预测库增加C API,并支持版本兼容检查。发布Paddle Lite,定位高性能、多平台、轻量化的端侧预测引擎,并可作为服务器端预测库的加速库。PaddleServing新增超大规模分布式预估服务能力。PaddleSlim强化了量化训练功能,增加了基于硬件的小模型搜索功能。发布全新Seq2Seq相关API和文本生成模型样例。语义表示库新增XLNet预训练模型;开源EMNLP2019阅读理解竞赛冠军模型D-NET,同时支持18个不同抽取式阅读理解数据集打榜。发布飞桨多任务学习库PALM (PAddLe Multi-task learning),更便捷支持多任务机器学习调研。发布训练部署端到端的图像分割库PaddleSeg。图像分类新增EfficientNet等43个预训练模型。PaddleDetection新增2019 Objects365 Full Track冠军模型、BlazeFace等人脸检测小模型,行人检测和车辆检测的预训练模型。PaddleVideo新增ActivityNet Challenge 2019夺冠模型,扩展包含video caption、video grounding等模型。发布PaddleSpeech,包含语音识别模型DeepSpeech和语音合成模型 DeepVoice3。PaddleHub新增超参优化Auto Fine-tune功能,并全面提升Fine-tune功能的灵活性和易用性,预训练模型数量大幅增加。飞桨图学习框架PGL正式版发布,飞桨深度强化学习框架PARL并行能力进一步提升,支持进化算法。Paddle2ONNX和X2Paddle全面升级,飞桨和其他框架的模型互转更加方便。发布飞桨联邦学习框架PaddleFL。
  • 2020年2月,开源框架 v1.7发布:
训练框架:增加自动混合精度训练AMP接口和新控制流接口;优化Tensor使用方式和显存分配策略;新增支持NVIDIA DALI GPU数据预处理库;持续优化基础OP的功能和性能;动态图的功能进一步完善,性能大幅提升,对Data Independent的动态图模型提供转为静态图可预测部署模型的功能;框架调试分析功能和易用性全面提升。
预测部署:服务器端预测库的Python API大幅优化,新增R语言Go语言的预测API,并增加相关的使用方法和示例,强化了量化支持能力;Paddle Lite支持无校准数据的训练后量化方法生成的模型,加强对OpenCL的支持,支持昆仑XPU的预测;模型压缩库PaddleSlim重构裁剪、量化、蒸馏、搜索接口,与模型库充分打通,新增大规模可扩展知识蒸馏框架Pantheon。
分布式训练:参数服务器模式下统一了Transpiler半异步、全异步和GEO的实现模式,后端实现上统一到Communicator中,前端接口统一到fleet中,通过fleet strategy灵活选择不同模式;发布大规模分类库PLSC,通过模型并行支持超多类别的分类任务。
基础模型库:发布语音合成库Parakeet,包括多个前沿合成算法;PaddleCV新增14个图像分类预训练模型,3D和跟踪方向模型持续丰富;PaddleNLP的分词词性标注模型支持jieba分词;PaddleRec增加多任务模型MMoE;模型库整体增加了广泛的动态图模型实现。模型库整体层次结构做了调整优化。
端到端开发套件:PaddleDetection和PaddleSeg新增大量模型实现及预训练模型,提升了典型模型的训练速度和精度,大幅提高模型压缩和部署能力,使用体验得到了全面优化;发布ElasticRec推荐排序系统,通过K8S进行部署,支持流式训练和在线预测服务。
工具组件:PaddleHub新增52个预训练模型,总数超过100,功能和体验持续优化;多任务学习框架PALM升级内核,开放API调用,支持更多的任务类型;联邦学习PaddleFL新增了公开数据集深度强化学习框架PARL和飞桨图学习框架PGL也对应版本升级,支持更多功能,开放更多算法和基线。
  • 2020年5月,开源框架 v1.8发布 [6]
训练框架:深度优化了命令式编程(动态图)功能、性能和体验,特别是增强了动静转换的能力,能支持依赖数据的控制流的动态图实现进行静态存储部署,也可以转为静态图模式训练;Data Loader的功能和梯度裁剪的使用方式进一步优化;声明式编程模式下多卡运行时fetch不定长Tensor等问题得到解决,混合精度配合重计算显示出支持大Batch训练很好的成效。新增了大量API,并新增 ComplexVariable,支持复数张量的表示和常见的复数运算。
预测部署:Paddle Inference 新增CUDA多线程多流支持、TRT子图对动态shape输入的支持,强化量化推理,性能显著优化;Paddle Serving 全面升级,功能完善,易用性显著提升;Paddle Lite进一步优化编译安装体验,全面提升对支持芯片的覆盖度(包括RK、MTK、百度昆仑寒武纪、比特大陆、华为NPU等等)以及对应的模型数量和性能;PaddleSlim量化、裁剪和NAS功能持续强化;发布国内首个开源JavaScript深度学习前端推理引擎Paddle.js,可以帮助用户实现网页端深度学习模型部署。
开发套件:全新发布PaddleClas,包含23个图像分类网络实现,117个图像预训练模型,并添加了数据增广、SSLD蒸馏等辅助策略,以及特色应用案例;PaddleSeg人像分割系列模型全面升级,新增多种遥感相关的策略方案;PaddleDetection、PaddleOCR和语音合成套件Parakeet算法覆盖更全面,速度显著提升。
工具组件:PaddleHub新增包括一系列视觉预训练模型在内更多的模型,模型总数120+; PaddleFL发布1.0版本,开源基于Mulit-party Computation (MPC)的联邦学习,支持横向、纵向等多个联邦学习场景;PGL发布业界首个结合语义信息与结构信息的图神经网络模型ERNIESage;PARL开源工业界首个进化学习应用框架Evokit;全新发布量子机器学习框架量桨Paddle Quantum。
  • 2021年3月,开源框架v2.0发布:
编程范式:默认开启动态图模式开发和训练模型,通过动转静的方式部署和加速模型训练。如果需要使用静态图编程范式,可以通过paddle.enable_static()来切换到静态图模式。
API体系:对API进行了补充,对目录结构进行了调整,更加易用,详情请参见API文档 [28],同时提供高层API简化使用流程;详情请参见飞桨高层API使用指南 [29]
框架功能:对数据加载、动态图执行、OP性能、混合精度训练、分布式训练、动静转换等进行了功能增强和性能优化
环境适配:提供了对ARM架构CPU的支持,增加了对Python 3.8、CUDA 10.1/10.2的支持,发布支持CUDA 11的安装包(experimental),发布支持百度昆仑芯片 [31]的安装包(experimental),详情请参见官网的开始使用部分 [30]
模型库及开发套件:飞桨的官方模型库和套件的绝大部分模型已经升级至飞桨框架2.0.0版本。
PaddleHub:支持2.0动态图,全面迁移动态图编程范式,模型开发调试更加方便,Finetune接口更加灵活易用。
PaddleDetection: 支持2.0动态图,覆盖检测方向主流算法(PP-YOLO、Faster-RCNN、SOLOv2),支持动静转换,打通预测部署,提供了更加模块化的组网方式。
PaddleClas: 支持2.0动态图,提供了29个系列的分类算法和134个预训练模型,提供了基于SSLD知识蒸馏的优化方案,将分类模型的精度普遍提升3%以上。
PaddleSeg: 支持2.0动态图,提供了50+的高质量预训练模型,支持15+主流分割网络,提供了业界的SOTA模型OCRNet,很好的提升了产品易用性。
PaddleOCR: 支持2.0动态图,PP-OCR系统、文字检测模型(DB、EAST、SAST)与文字识别模型(Rosetta,CRNN,StarNet)完成2.0动态图适配。
PaddleGAN:支持2.0动态图,所有模型,包括风格迁移、视频增强、唇形迁移、人脸动漫化等九种模型均基于动态图开发。
PaddleRec:支持2.0动态图,免安装,动静组网统一,方便用户的调研和上线,同时整理发布了推荐系统经典数据集。
PaddleNLP:支持2.0动态图,提供25+预训练模型和易用的API方式,提升文本建模效率。
Parakeet:支持2.0动态图,已发布的声学模型声码器均良好支持动态图版本。
PaddleVideo:支持2.0动态图,包含了视频分类和视频动作定位方向模型,包括: TSN、TSM、SlowFast、AttentionLSTM、BMN模型以及特色应用预训练模型VideoTag和FootballAction。
AmazonDJL:易用流畅的Java推理接口,支持各类操作系统平台(Mac/Windows/Linux),支持飞桨预训练模型部署,更多的信息请参考DJL支持Paddle的官方文档 [32]
  • 2021年5月,开源框架v2.1 [33]发布:
环境适配: 增加了对Python 3.9、CUDA 11.2的支持;提供了对ROCm平台的支持(experimental);提供了对昇腾AI处理器的支持(experimental);增加了可在百度昆仑芯片上运行的模型数量;详情请见:开始使用。
分布式训练:在已有静态图的多维混合并行的基础上,新增动态图实现。
框架功能:完成了多项功能增强和性能优化,特别的,新增了以下重要功能:
自定义算子:提供了在框架外部自定义算子的新方案,简化了自定义算子写法与训练推理部署流程,详情请见:自定义外部算子。
新增inplace操作:新增可降低显存占用与提升性能的inplace操作,包括View策略,与12个inplace API。
高层API相关:新增支持混合精度训练的高层API;新增通过paddle.hub来查看、共享、加载模型。
自动混合精度训练优化: 优化了混合精度训练中slice、where、range等多个op的计算性能,提升了在MaskRCNN、ERNIE等模型上的加速效果。
oneDNN下BF16训练:新增支持了AMP(AutoMixedPrecision) pure_BF16模式; 新增支持了BF16类型的SGD和initializers初始值设定并减小了内存;新增支持了大部分word2vec BF16训练需要的前向和反向op。
模型库及开发套件:
PaddleHub: 新增轻量级中文对话模型plato-mini;新增基于VOC数据集的高精度语义分割模型2个,语音分类模型3个;新增图像语义分割、文本语义匹配、语音分类任务的Fine-Tune能力;新增ONNX和PaddleInference模型格式的导出功能。
PaddleOCR: 开源百度自研端到端文本识别算法PGNet(AAAI 2021发表),多语言模型支持种类提升到80+,英文数字模型效果进一步优化。
PaddleDetection: 新增3个业界最广泛应用的多目标追踪算法:JDE、DeepSort、FairMot,并全面打通预测部署;新发布人体姿态预估算法HRNet和HigherHRNet;旋转框检测算法S2ANet全面打通预测部署;新增PP-YOLO Tiny的移动端部署Demo;支持批量预测。
PaddleX:支持2.0动态图;新增RestFul API,支持用户在本地控制远程服务器构建深度学习训练任务;新增PaddleX Deployment模块,并与飞桨其他开发套件(PaddleClas,PaddleDetection,PaddleSeg等)打通,支持用户用更少的代码快速完成C++ Inference部署预测。
PaddleGAN:新增动作驱动模型First Order Motion,支持单人及多人脸部动作迁移;新增视频超分辨率模型EDVR,发布视频修复的复合解决方案。
PaddleSeg:新增全景分割场景,其中Anchor-Free算法PanopticDeepLab业界SOTA;高精度的人像分割模型humanseg升级为动态图版,并显著优化边缘锯齿问题;新增10中学习率策略;新增Weighted Cross Entropy Loss,针对样本类别不均衡场景优化效果显著;部署能力进一步完善,新增移动端部署和Web部署,并支持添加后处理算子(argmax/softmax)。
PaddleClas: 新增RexNet、MixNet、ViT和DeiT部署模型;增加面向不同能力开发者的中文文档;更新whl安装包。
PaddleNLP: 新增千言等特色中文数据集,及NLP数据处理通用API;新增XLNET、ERNIE、RoBERTa、ALBERT、GPT、Unified_Transformer等中文预训练模型;新增知识关联WordTag、语义解析Text-to-SQL、语义匹配SimNet、文本图学习ERNIE-Sage、情感分析SKEP、通用对话PLATO、小样本学习P-Tuning等应用场景;新增Transformer解码模块,支持高性能推理。
PaddleRec: 新增召回模型MIND,升级PLE, FFM等5个模型到2.0API和支持动态图;新增可视化支持,引入VisualDL;支持开源工具Milvus用于向量存储和召回服务,并提供教程;新增推荐系统公开数据集12个;支持单机多卡,多机多卡等多GPU训练环境;支持inference预测库和serving部署能力;支持Perf的DNN、DeepFm、Wide&Deep的Benchmark功能;新增完善动转静,预测部署,可视化等文档。
Parakeet:新增音色克隆功能;集成VisualDL实现可视化分析
PaddleHelix:全面从静态图升级到动态图。新增2个新应用:分子生成和药物联用;新增6个新模型:蛋白质化合物亲和力预测2个,分子生成3个,药物联用1个;新增多个数据集和升级基础模块;修复已知bug
Paddle Quantum:新增量子数据编码模块,支持量子核方法的模拟,并提供相关教程;增加新的噪声模型,模拟真实量子计算环境;新增多个双量子比特门,包括离子阱量子计算设备原生门;新增打印电路功能,方便查看电路结构及参数;新增变分影子量子学习(AAAI 2021发表)、旅行商问题等多个教程。
Paddle Lite:提升opt和推理库体积压缩的易用性;支持armv8.2 FP16指令计算;大幅提升OpenCL相关计算性能;新增支持Intel FPGA
Paddle Serving:集成开源框架2.1 inference;支持FP16和INT8的低精度推理;通过Kubernetes部署Serving服务;新增安全网关与Serving协同部署;X86 + XPU环境部署Serving服务。
Paddle.js: 完善WebGPU/NodeGL后端; 新增Float16模型格式及WebGL Pack加速功能;新增算子OP总数达到43个;封装数据处理API,引入numjs。
  • 2023年12月
2023年12月,百度首席技术官(CTO)王海峰表示,飞桨开发者达到1070万。 [51]

领先技术

播报
编辑
飞桨全景图
  • 开发便捷的深度学习框架
飞桨深度学习框架基于编程一致的深度学习计算抽象以及对应的前后端设计,拥有易学易用的前端编程界面和统一高效的内部核心架构,对普通开发者而言更容易上手并具备领先的训练性能。飞桨自然完备兼容命令式和声明式两种编程范式,默认采用命令式编程范式,并实现了业内首个动静统一编程范式,开发者使用飞桨可以实现动态图编程调试,一行代码转静态图训练部署。飞桨框架还提供了低代码开发的高层API,并且高层API和基础API采用了一体化设计,两者可以互相配合使用,做到高低融合,兼顾开发的便捷性和灵活性。
  • 超大规模深度学习模型训练技术
飞桨突破了超大规模深度学习模型训练技术,率先实现了千亿稀疏特征、万亿参数、数百节点并行训练的能力,解决了超大规模深度学习模型的在线学习和部署难题。此外,飞桨还覆盖支持包括模型并行、流水线并行在内的广泛并行模式和加速策略,推出业内首个通用异构参数服务器架构、4D混合并行策略和端到端自适应分布式训练技术,引领大规模分布式训练技术的发展趋势
  • 多端多平台部署的高性能推理引擎
飞桨对推理部署提供全方位支持,可以将模型便捷地部署到云端、边缘端和设备端等不同平台上,结合训推一体的优势,让开发者拥有一次训练、随处部署的体验;飞桨从硬件接入、调度执行、高性能计算和模型压缩四个维度持续对推理功能深度优化,整体性能领先;在硬件接入方面,飞桨拥有硬件统一适配方案,携手各大硬件厂商软硬一体协同优化,大幅降低硬件厂商的对接成本,并带来领先的开发体验,特别是对国产硬件做到了广泛的适配。
  • 产业级开源模型库
飞桨建设了大规模的官方模型库,算法总数达到500多个,包含经过产业实践长期打磨的主流模型以及在国际竞赛中的夺冠模型;提供面向语义理解、图像分类目标检测图像分割文字识别OCR)、语音合成等场景的多个端到端开发套件,满足企业低成本开发和快速集成的需求,助力快速的产业应用。飞桨的模型库是基于丰富的产业实践打造的产业级模型库,服务企业遍布能源、金融、工业、农业等多个行业。其中产业级知识增强的文心大模型,已经形成涵盖基础大模型、任务大模型和行业大模型的三级体系。

建设成果

播报
编辑
建设成果
基于百度飞桨的视觉工具套件,华夏天信(北京)机器人有限公司开发出了输煤胶带智能巡检机器人,不仅能实现高频次、无间歇巡检,还能通过摄像仪将实时视频回传并智能识别分析,解决了工作效率、恶劣环境、作业安全等多项难题。目前,华夏天信生产的这类机器人已经在国内多家主要煤矿企业成功实施上线,为煤矿安全生产和管理提供了高效、智能的保障。
上海哲元科技发展有限公司与飞桨展开合作,基于飞桨EasyDL零门槛AI开发平台仅使用20个工时就训练出食品生产流水线数量清点及外观检测模型,成功打造出食品自动化生产质检系统。该系统已应用于多家一线食品品牌实际产线中。2021年9月,在上海哲元提供的智能化质检系统加持下,某知名冰淇淋品牌的江苏太仓工厂被认证为世界级“灯塔工厂”,成为全球冰淇淋行业的第一家“灯塔工厂”。哲元为该冰淇淋品牌定制的检测模型,能够做到蛋卷皮外观、巧克力喷涂、灌料、撒料、压盖、包装全流程14道工序智能化质检,检测速度从人工质检的1个/秒提升到自动化检测11个/秒,保障了食品安全生产的同时,保证了检测质量与效率。
复亚智能基于飞桨的PaddleDetection、PaddleSlim研发出一套全自主无人机巡检系统,为电网作业巡检提供不依赖三维点云和预设航线的全自主电力杆塔与通道巡检系统。通过地面站系统可一键上传飞行任务后,能实现4分钟一级塔的全自主巡检,同时还会综合考虑巡视人员水平不一、巡视质量参差不齐、变电站分布分散、多处偏僻地段等因素。通过电力全自主巡检系统,巡检时间预计可缩短30%以上。 [39]
截至2022年5月,飞桨已累计凝聚477万开发者、服务18万企事业单位、创建56万AI模型。 [40]
2022年7月,中国信通院最新报告显示,百度飞桨深度学习平台居中国市场应用规模第一。报告指出,以飞桨为代表的自主可控全栈平台和生态加速了我国技术普惠与产业赋能,是构建国产化生态体系的重要一环。 [41]
截至2022年11月,飞桨平台已凝聚535万开发者,服务20万企事业单位,基于飞桨创建了67万个模型。 [42]
截至2022年12月,通信通院最新报告显示,飞桨已经成为中国深度学习市场应用规模第一的深度学习框架和赋能平台。已汇聚535万开发者,服务20万家企事业单位,基于飞桨构建了67万个模型。 [43]
2023年3月消息,NVIDIA召开了全球开发者大会GTC 2023,GPU芯片与百度飞桨深度学习平台的合作持续深入。 [44]
截至2023年8月,飞桨开发者数已达800万,模型数超80万,服务22万家企事业单位。 [45]

硬件生态

播报
编辑
飞桨硬件生态持续繁荣,包括英特尔、英伟达ARM等诸多芯片厂商纷纷开展对飞桨的支持,并主动在开源社区为飞桨贡献代码。飞桨还跟飞腾、海光、鲲鹏、龙芯、申威等CPU进行深入融合适配,并结合麒麟、统信、普华操作系统,以及百度昆仑、海光DCU、寒武纪、比特大陆、瑞芯微高通、英伟达等AI芯片深度融合,与浪潮中科曙光等服务器厂商合作形成软硬一体的全栈AI基础设施。当前已经适配飞桨的芯片或IP超过30种,处于业界领先地位。

开发套件

播报
编辑
ERNIE
飞桨语义理解套件, 基于持续学习语义理解预训练框架,使用多任务学习增量式构建预训练任务,支持各类训练任务的Fine-tuning,保证极速推理的Fast-Inference API,兼具灵活部署的ERNIE Service和具备轻量方案的ERNIE Tiny系列工具集 [7]
PaddleClas
飞桨图像分类套件PaddleClas,目的是为工业界和学术界提供便捷易用的图像分类任务预训练模型和工具集,打通模型开发、训练、压缩、部署全流程,辅助其它高层视觉任务组网并提升模型效果,助力开发者训练更好的图像分类模型和应用落地。 [8]
PaddleDetection
飞桨目标检测开发套件PaddleDetection,旨在帮助开发者更快更好地完成检测模型的训练、精度速度优化到部署全流程。PaddleDetection以模块化的设计实现了多种主流目标检测算法,并且提供了丰富的数据增强、网络组件损失函数等模块,集成了模型压缩和跨平台高性能部署能力。目前基于PaddleDetection已经完成落地的项目涉及工业质检、遥感图像检测、无人巡检等多个领域。 [10]
PaddleSeg
飞桨图像分割套件PaddleSeg,覆盖了DeepLabv3+、OCRNet、BiseNetv2、Fast-SCNN等高精度和轻量级等不同方向的大量高质量分割模型。通过模块化的设计,提供了配置化驱动和API调用等两种应用方式,帮助开发者更便捷地完成从训练到部署的全流程图像分割应用。 [9]
PaddleOCR
飞桨文字识别开发套件PaddleOCR,旨在打造一套丰富、领先且实用的OCR工具库,开源了基于PP-OCR实用的超轻量中英文OCR模型、通用中英文OCR模型,以及德法日韩等多语言OCR模型。并提供上述模型训练方法和多种预测部署方式。同时开源文本风格数据合成工具Style-Text和半自动文本图像标注工具PPOCRLable。 [11]
PaddleGAN
飞桨生成对抗网络开发套件PaddleGAN,集成风格迁移、超分辨率、动漫画生成、图片上色、人脸属性编辑、妆容迁移等SOTA算法,以及预训练模型。并且模块化设计,以便开发者进行二次研发,或是直接使用预训练模型做应用。 [34]
PLSC
飞桨海量类别分类套件PLSC,为用户提供了大规模分类任务从训练到部署的全流程解决方案。提供简洁易用的高层API,通过数行代码即可实现千万类别分类神经网络的训练,并提供快速部署模型的能力。 [13]
ElasticCTR
飞桨个性化推荐开发套件ElasticCTR,可以实现分布式训练CTR预估任务和基于Paddle Serving的在线个性化推荐服务。Paddle Serving服务化部署框架具有良好的易用性、灵活性和高性能,可以提供端到端的CTR训练和部署解决方案。ElasticCTR具备产业实践基础、弹性调度能力、高性能和工业级部署等特点。 [12]
Parakeet
飞桨语音合成套件,提供了灵活、高效、先进的文本到语音合成工具,帮助开发者更便捷高效地完成语音合成模型的开发和应用。 [14]
丰富的工具组件
AutoDL
飞桨自动化深度学习工具,旨在自动网络结构设计,开源的AutoDL设计的图像分类网络在CIFAR10数据集正确率达到 98%,效果优于目前已公开的10类人类专家设计的网络,居于业内领先位置。 [16]数据来源内部测试10种网络分别为:vgg_15_BN_64、vgg_16、resnet_32、resnet_56、resnet_110、resnet_v2_bottleneck_164、wide_resnet、densenet_BC_100_12、resnet_29_8x64d、shake_shake_64d_cutout,实际结果可能受测试环境影响而在一定范围内变化,仅供参考)
PARL
飞桨深度强化学习框架PARL,在2018、2019、2020夺得强化学习挑战赛三连冠。具有高灵活性、可扩展性和高性能的特点。实现了十余种主流强化学习算法的示例,覆盖了从单智能体多智能体,离散决策到连续控制不同领域的强化学习算法支持。基于GRPC机制实现数千台CPU和GPU的高性能并行。 [35]
PALM
飞桨多任务学习框架PALM,一个灵活、通用且易于使用的NLP大规模预训练和多任务学习框架,旨在快速开发高性能NLP模型的上层框架。使用PALM可以非常轻松灵活的探索具有多种任务辅助训练的“高鲁棒性”阅读理解模型,基于PALM训练的模型D-Net在EMNLP2019国际阅读理解评测中夺得冠军。 [18]
PaddleFL
飞桨联邦学习框架PaddleFL,研究人员可以很轻松地用PaddleFL复制和比较不同的联邦学习算法,便捷地实现大规模分布式集群部署,并且提供丰富的横向和纵向联邦学习策略及其在计算机视觉自然语言处理推荐算法等领域的应用。此外,依靠着飞桨的大规模分布 式训练和Kubernetes对训练任务的弹性调度能力,PaddleFL可以基于全栈开源软件轻松部署。 [20]
PGL
飞桨图学习框架PGL,业界首个提出通用消息并行传递机制,支持百亿规模巨图的工业级图学习框架。PGL基于飞桨动态图全新升级,极大提升了易用性,原生支持异构图,支持分布式图存储及分布式学习算法,覆盖30+图学习模型,包括图语义理解模型ERNIESage等。历经大量真实工业应用验证,能够灵活、高效地搭建前沿的大规模图学习算法。 [19]
Paddle Quantum
量桨Paddle Quantum,飞桨量子机器学习框架,提供量子优化、量子化学等前沿应用工具集,常用量子电路模型,以及丰富的量子机器学习案例,帮助开发者便捷地搭建量子神经网络,开发量子人工智能应用 [21]
PaddleHelix
飞桨螺旋桨生物计算框架PaddleHelix,开放了赋能疫苗设计,新药研发,精准医疗的AI能力。在疫苗设计上,PaddleHelix的LinearRNA系列算法相比传统方法在RNA折叠上提升了几百上千倍的效率;在新药研发上,PaddleHelix提供了基于大规模数据预训练的分子表示,助力分子性质预测,药物筛选药物设计等领域;在精准医疗上,PaddleHelix提供了利用组学信息精准定位药物,提升治愈率的高性能模型。
PaddleHub
飞桨预训练模型应用工具PaddleHub,覆盖文本、图像、视频、语音四大领域超过200个高质量预训练模型。开发者可以轻松结合实际业务场景,选用高质量预训练模型并配合Fine-tune API快速完成模型验证与应用部署工作。适用于个人开发者学习、企业POC快速验证、参加AI竞赛以及教学科研等多种业务场景。 [15]
PaddleX
飞桨全流程开发工具PaddleX,以低代码的形式支持开发者快速实现深度学习算法开发及产业部署。提供极简Python API和可视化界面Demo两种开发模式,可一键安装。针对CPU(OpenVINO)、GPU、树莓派等通用硬件提供完善的部署方案,并可通过RESTful API快速完成集成、再开发,开发者无需分别使用不同套件即可完成全流程模型生产部署。可视化推理界面及丰富的产业案例更为开发者提供飞桨全流程开发最佳实践 [23]
VisualDL
飞桨可视化分析工具VisualDL,以丰富的图表呈现训练参数变化趋势、模型结构、数据样本、高维数据分布、精度召回曲线等模型关键信息。帮助用户清晰直观地理解深度学习模型训练过程及模型结构,进而实现高效的模型调优、并将算法训练过程及结果分享。 [17]
PaddleCloud
飞桨云上任务提交工具,能够帮助您一键发起深度学习任务,为您提供快速打通云上计算资源通道,支持您快速发起单机/分布式飞桨核心框架训练任务,致力于推动AI应用更广泛地落地。 [22]
AI学习与实训社区
AI学习与实训社区,面向教育和学习场景,集开放数据、开源算法、免费算力于一体,为开发者提供高效易用的学习和开发环境、丰富的体系化课程、海量开源实践项目、以及高价值的Al竞赛,并提供教育版支撑高校和机构老师轻松实现Al教学,助力深度学习人才培养。目前AI Studio平台上已累计了80多万开发者、80多万的样例工程和数据集、5000多精品课程内容、80余场AI竞赛,并提供海量免费GPU算力资源。 [36]
飞桨企业版
飞桨企业版针对企业级需求增强了相应特性。包括提供更全面和强大的功能、更易用的可视化界面,预置更丰富的场景模型,提供更强化的安全权限管理等。
相对于同类平台而言,飞桨企业版具有自主可控的底层飞桨开源框架支持,预置百度积累的大规模数据训练而成的高精度预训练模型,全面支持安全高效的公有云和可灵活支持私有化或本地部署。数据更安全、部署更灵活、训练精度更高、集成更便捷,让各类企业享受高质量的一站式AI开发服务。
飞桨企业版包含EasyDL零门槛AI开发平台BML全功能AI开发平台:
  • EasyDL [24]:面向企业AI应用开发者,提供零门槛、内置端到端自动化训练机制、多场景的高精度模型定制平台。
  • BML [25]:l 面向企业算法工程师,提供功能全面、预置丰富的网络和模型、可灵活定制和被深度集成的AI开发平台。
应用落地
中国商飞
飞机复合材料结构件超声图像损失检测
  • 项目背景
随着国产大飞机ARJ21C919等型号研制推进,中国商飞北研中心承担的航空复合材料许用值试验和疲劳门槛值试验日趋加重,对试验件无损检测和损伤检测需求逐渐增加。但由于无损检测过程中缺陷评定对检测人员的专业知识有依赖性强,设备开放程度低、检测数量大等问题,人工缺陷评定速度已成为制约型号任务进度的瓶颈。
  • 应用方案
针对项目落地面临的数据量少、应用场景复杂、检测精度要求高,以及AI开发能力薄弱等问题,商飞北研中心利用百度飞桨PaddleSeg开发套件顺利完成了复合材料检测算法的开发。首先,开发人员使用PaddleSeg集成的数据增强工具,结合航空复合材料超声图像数据的特征,轻松完成了数据大规模扩张;然后,通过对PaddleSeg官方提供的预训练模型U-Net和Deeplabv3进行训练、测试和多维度结果分析,选用了跟业务场景更契合的经典模型U-Net完成语义分割;最后,利用PaddleSeg提供的完善的配置文件,非常便捷快速地完成了部署上线。
  • 应用效果
流程完成了智能化改进后,全流程用时仅5.3分钟,检测工时减少71%,准确率提升至95%,单批次试验人工成本减少21.63万元。有效减少了检测人员工作量,极大地缩短了复合材料超声检测时长,有效加速了型号研制迭代速度,实现了勤俭研制大飞机的企业目标
测试集推理结果示例
动力电池高精度质量检测
  • 项目背景
作为动力电池制造龙头企业,宁德时代新能源科技股份有限公司动力电池产量大、质检严,仅新能源车领域需要检测的参数就超过了3000个。为了保证电池品质,宁德时代要求产品线上的电池达到缺陷漏检率小于1DPPB、单张产品图像缺陷检测平均时长<2ms检测标准。但动力电池缺陷种类复杂且差距小,想要通过传统质检方法达到安全生产要求,需要耗费大量的人力财力:一条流水线就需要十几个质检工人,而且不同的生产线标准不一样,需要人工逐个确认。
  • 应用方案
为了解决产业难点,宁德时代通过百度飞桨深度优化过的PP-YOLO和ResNet系列算法,提升了算法精度;通过调整预测Batch,采用多线程数据预处理、优化数据内存拷贝时间等策略,提升了检测精度及预测效率,使其充分适应实际生产需求。
  • 应用效果
采用电池质量智能化检测后,部分工序已经运用人工智能算法进行升级,整体产品检测相较于原本的传统检测算法过杀率降低了66.7%,缺陷漏检率小于1DPPB。算法泛化能力和在多产线上进行迁移部署的效率也得到了全面提升。不仅进一步保障了宁德时代的动力电池质量,也在一定程度上实现了低成本高效复用经验,大大降低了产线研发成本
应用效果
5G智能园区车辆行为识别
  • 项目背景
随着物联网设备连接和交互能力的大幅提升,园区车辆管理能力再次成为物流行业的主要瓶颈。采用传统的本地化监控系统,不仅监控位置不直观、无法云端观看,还需要配备高频次的人工巡检。异常处理时间长、作业效率低、人工失误不可避免。
  • 应用方案
京东物流运用飞桨PaddleDetection、PaddleSeg和PaddleSlim等开发套件,设计了一套完备的CV监控方案,实现了车辆智能化管控。通过目标检测和OCR来识别车牌、检测车辆(进入/离开园区),并针对货运车辆车牌形态多样化,采取数据增强方式确保样本覆盖现有业务场景。在用目标跟踪和状态识别来监控车辆状态的任务场景中,针对遇到的问题,研发团队将多路摄像头数据在训练阶段就混入了单模型的训练数据中,提高了目标跟踪过程的精确度;在状态识别过程中,充分考虑时序特征,提高了最终的识别精确度。
  • 应用效果
升级为可远端高清直播、可自动分析异常的智能化监控系统后,京东物流的车牌识别率大幅提升,人员、场站、生产、监控、巡检五大领域管理能力实现了全面提升,迎来了从“被动型传统管理”到“主动型智能管控”的巨大转型,降低了人工误差的同时,有效提升了作业效率。
应用效果
支持海量用户需求的大规模分布式推荐系统
  • 项目背景
OPPO自2018年起开始大举进军互联网业务,创立了信息流信息流广告应用商店、游戏中心、商业中心等诸多业务线,并迅速积累了大量的用户和数据。由于业务规模的急剧扩张, OPPO原来在单机上搭建的训练系统不具备处理大规模数据和训练大型推荐系统的能力,严重制约了互联网的业务发展,急需更好的框架体系来满足业务方对于模型训练速度、效果指标增长的需求。
  • 应用方案
基于飞桨的能力对应用商店进行了升级:采取高性能数据读取接口Dataset完成大规模数据的读取;采用基于参数服务器的大规模CPU分布式的全异步训练模型,以较低的资源消耗来训练海量的数据以及极大的稀疏参数。
  • 应用效果
  • 性能强:全异步大规模训练集群规模,业务模型训练速度提升效果显著;
  • 参数规模大:Embedding规模&模型扩大数倍;
  • 效果好:在多个场景(广告,信息流等),线上关键指标提升效果显著;
  • 性价比高:参数服务器训练,大幅度减少内存开销。
应用效果
南网科技
机器人安全巡检
  • 项目背景
电能从生产到消费要经过发、输、变、配、用五大环节,任何一个环节出问题,都会影响到电能的正常供应。其中,输变电是电能通过电网传输的重要部分。电力巡检的核心工作内容,就是对输变电设备进行运维,以确保其正常工作,保障电力系统的安全运行和电能的稳定供应。
  • 应用方案
南方电网电力科技股份有限公司的技术攻关团队引入飞桨开源深度学习框架,利用飞桨团队实现的高性能目标检测算法YOLOv3及语义分割算法U-Net,使机器人面向表计的深层次特征提取能力大大提高,突破了环境因素的制约,方法的准确率和鲁棒性显著提升,在表计目标检测、示数读取等方面的效果尤为显著。
  • 应用效果
在基于飞桨的表盘检测及表盘分割项目中,表盘检测的最高mAP达到了0.9857,总体的读数±2°误差内准确率高达99.01%。借助深度学习赋能的变电站智能装备(机器人),人工巡检耗时大幅减少。原来需要6小时才能完成的巡检工作现在只需花10分钟进行读数复核即可,实现了基于准实时自动巡检的变电站智能运维。
应用效果
度小满
金融风控建模
  • 项目背景
互联网金融快速发展,每天在平台上会发生数以万计的借贷、还款等行为。传统人工处理不仅对从业审核人员要求非常高,而且效率、审核标准的统一性也无法保证。传统的风控建模技术是基于小样本的监督学习,依赖于特征挖掘,需要耗费大量人力且依赖个人经验;传统技术对于小样本的文本类数据处理往往缺乏上下文的理解,未能提取其重点,导致对用户的理解出现偏差。
  • 应用方案
百度自研知识增强语义理解框架ERNIE,充分利用海量数据和飞桨多机多卡高效训练优势,通过深度神经网络与多任务学习等技术,持续学习海量数据和知识,助力各NLP任务效果显著提升。目前,百度对外发布基于该框架的ERNIE 2.0预训练模型,该模型累计学习10亿多知识,刷新16个中英文NLP任务效果。
在度小满风控场景中,利用ERNIE对业务信息进行语义层面深度建模,结合风控少量训练数据进行精细Fine-tune,在较短的时间内即可完成风控模型的收敛并且具备更好的泛化能力。
  • 应用效果
度小满金融风控模型KS相对提升约6.35%,AUC相对提升超过1.55%,用户排序优化约 21.5%。
三行科技
  • 项目背景
对项目标的主体公司的风险评估是金融机构开展业务的起点,而标的公司财务数据分析是量化评估业务风险的基础。三行公司发现采用传统人工的方式进行财务数据分析,不仅会耗费高额的人力成本,而且人工录入效率低、错误率高等特点,更是会给业务带来不可预知的风险和损失。但想通过机器识别代替人工也并非易事,项目面临着开发困难、精度要求高等一系列难题。
  • 应用方案
三行科技借助飞桨开源深度学习平台的PaddleOCR工具轻松完成了审计报表(股票、债券市场公开披露的扫描版)的文字识别。首先,基于U-Net模型对表格线进行检测,划分出可见横竖线和不可见横竖线;然后,基于FastText进行科目标准化,解决报表科目表述不一致的问题;最后,通过CRNN解码过滤无效字符,进一步提升精度(如有印章可先利用Noise2Noise去除)。
  • 应用效果
三行科技借助PaddleOCR开发的文字识别算法,在文字检测召回率上较之前算法提升5%,检测速度提升30%,实现财务报表科目和金额的高效识别,成功完成了财务数据的结构化存储,为后续多项业务过程提供数据基础。
应用效果
连心医疗
基于CT/MRI多模态影像的鼻咽癌GTV勾画
  • 项目背景
肿瘤治疗中,医生需要亲自勾画病灶区域(即靶区)来进行精准放疗,这一步骤决定了放疗质量的60%。但这一工作通常需要基于不同部位的50-200张不等的CTMRI二维影像中勾画出三维立体靶区,不同的医生会因为主管评价标准的差别使得勾画范围的结果差异较大,给这一步骤增加了许多不确定性,导致诊疗效率低下。
  • 应用方案
连心医疗基于飞桨语义分割套件PaddleSeg中的U-Net语义分割网络开发了基于CT和MRI多模态影像的鼻咽癌病灶靶区自动勾画系统,基于放疗医生勾画的CT/MRI多通道影像建立数据集,采用图像裁剪和增强等预处理方法提升数据集的质量,采用假阴假阳的后处理抑制,最后采取边缘检测得到勾画结果。
  • 应用效果
项目完成后,系统的精度达到医生勾画水平,并可以快速自动地勾画出三维靶区,提供更精准的放疗规划方案,辅助放疗临床医生高效诊疗。
应用效果
更多案例
耕地地块提取
传统对遥感图像的处理,依赖于大量拥有遥感专业背景的人工使用专业软件进行分析。卫星遥感影像数据存在画幅巨大、肉眼分辨率低、对识别人员专业要求能力高等问题,且人工标注需要大量重复劳动,非常费时费力,枯燥无味。
中科赛诺(北京)科技有限公司基于飞桨的自动农耕地块提取系统,可快速自动获得农耕用地边境及面积,从而达到进行有效的估产并辅助相关其它农事活动。应用飞桨 Deeplab V3实现地块面积提取准确率达80%以上,对作物长势、作物分类、成熟期预测、灾害监测、估产等工作进行高效辅助,大大减少了传统人力的投入。
桃子分拣机
传统农业生产过程中,桃子采摘后需要人工根据其品质进行筛选,质量无法得到保证的同时还耗费大量的人工和时间成本
智能子分拣机集成了图像分类模型,将桃子智能分类模型训练、机械自动化采集样本数据,完成桃子分拣自动化。提升桃子分拣准确率至90%以上;节省90%人力成本,每年为桃农直接节省近3万元。(数据来源:内部测试结果,实际结果可能受测试环境影响而在一定范围内变化,仅供参考。节省费用估算公式为人工劳务单日费用*工人数-设备成本开销)
硕橙机器听诊大师
硕橙将飞桨用于机器设备噪声识别,实现了设备生产量的实时统计,并评估设备的运行状态。对于生产量统计,先将噪声分解为多个维度的机械运动特征量,然后截取一定长度的数据,送入一个深度神经网络,特征量波形识别为机械设备的动作,从而实时判断设备的生产量。
对于运行状态的评估,仍然是先将噪声分解为多个维度的机械运动特征量,然后根据前述生产量统计应用得到的生产周期,将一个生产周期内的全部特征量构建成一个在高维空间中的分布,并根据历史记录寻找绝大部分样本集中的区域包络面,最后使用One class SVM方法对每一次生产周期进行评分,实时给出整体运行状态评价。
3D智能抓取机器人
矩视智能研发的缺陷检测系统在飞桨的AI Studio环境下,将飞桨提供的图像检测模型与自主研发的算法相结合,对键槽轴心外观齿部冷锻伤类型缺陷进行检测,保证缺陷检测系统准确率的同时,大大提升了图像处理的速度。每齿轮检测时间<300ms/帧,连续运行100次,误判率≦1%。
瓷器及地板表面质量检测
北京奇想天外科技有限公司,智能硬件解决方案商,应用飞桨目标检测模型,在广东松发陶瓷股份有限公司的瓷器生产质检线上,实现了5类缺陷的检测,在15%误识率的基础上,实现了90%检出率,比传统人眼识别,效率提升了20%。
(数据来源:内部测试结果,实际结果可能受测试环境影响而在一定范围内变化,仅供参考)
精诺钢铁熔炼生产工艺优化
在合金熔炼的过程中,合金元素会根据炉内温度、熔炼时间等因素发生无法用机理进行判断和解释变化,传统合金熔炼环节大多由有经验的师傅进行补料,需要多次实验和调整,废料废时。
精诺数据基于百度深度学习平台飞桨,研发了IAPBOA算法,利用历史配料数据建模,实现智能化计算。通过机器学习优化企业个性化配料方案,最终达到生产质量和生产成本的有效平衡点,从而指导熔炼生产,减少对经验的依赖,达到提升熔炼效率、节省原材料的效果。
楼宇设备智能管理
楼宇设备工况运行调控依赖人工, 而运维专业水平不齐,运行效率不高,导致能源浪费、无法及时根据外界环境变化来调整系统输出,楼宇内用户体验不好。
百度科技园将基础运行积累的大数据与深度学习算法结合起来,提高了机电系统运行效率,完善日常保养策略,提供故障预警、保养提醒功能,实现智能运营。目标楼宇日均节电20%+,年节电约100万度,节约电费30%+,有效提升楼宇运营效率。
AI控烟
在2018年世界无烟日,百度科技园发起AI控烟公益项目,由百度工程师用飞桨的目标检测模型成功识别下沉广场的吸烟者,在广场大屏幕给吸烟者实时发送健康提示。该项目基于百度飞桨开源平台的深度学习能力,对数万张吸烟动作图片进行了43次深度学习模型训练,可实现对吸烟动作的识别,通过视频监控的数据从人群中识别出正在吸烟的人,将其图像提取并标注保存。
4. 智能零售
生鲜进货量智能预测
由于生鲜产品保质期极短,需要丰富的进货经验才能降低货物过期报损率,然而店长经验参差不齐,无法保证准确预估全部店铺的进货量。
通过利用商超生鲜的历史销售数据,从位置、时段、节假日、天气等维度,提取出多个影响销量的条件,使用DNN神经网络到建立销量预测模型,比店长预测更为准确,整体报损降低30%+、模型进货净利润较店长进货提升约20%。
智慧购物解决方案(以图搜商品)
随着消费互联网流量红利的逐渐殆尽,移动互联网的主战场转向产业互联网家居行业3D数字化进程高歌猛进,行业开始沉淀下了大量的与真实商品对应3D模型数据,如何应用真实商品的3D数据的多维度特点,来改善消费者的购物体验具有重要意义。但如今,线下实体店仍然占据部分销售额,线上流量无法直接转化成消费行为是行业中的一大痛点。如何将线上线下的优势结合,优化资源配置,快速实现线下家居实体业的进化,成为家装企业发展的重中之重。次元视界应用Faster R-CNN模型实现2D图像的特征提取,再生成3D模型,达到了模型轮廓识别准确率达到89%,FPR降低了32%,显著的提升了应用效果。
5.智能推荐
智能招聘——简历职位智能匹配系统
云脑科技使用飞桨搭建的Gated Model(GQM),是基于CNN、DSSM、C-DSSM等算法的文本匹配模型。GQM在上述模型架构的基础上,优化了全局语义特征的提取,以及查询文本于候选匹配文本的语义特征交互,进而达到更快速、单文本上下文特征提取范围更广、文本对语义特征交互优化、同时高准确匹配的效果。综合企业需求与求职者的简历数据,实现企业与求职者双方需求的高效率匹配。项目现运用于云脑的合作伙伴实习僧的项目中,实现面试邀约成功率提升5倍。(数据来源:内部估算结果,计算方式一定时间内使用简历职位智能匹配系统后面试邀约平均成功率除以使用简历职位智能匹配系统之前的面试邀约平均成功率)
智能零件分拣机
零部件的质量,决定了工业装备的整机性能。但是,由于小零件的数量庞大,人工执行质量检测与分拣的效率低、成本高,迫切需要引入智能机器对人力替代。在此背景下,领邦智能面向市场推出了智能零件分拣机。
领邦基于百度深度学习平台飞桨训练CNN分类网络模型,让分拣机能够自动学习良品和缺陷品的分类特征,并对工件图像实时做出自动判别与分类。智能分拣机能够高效、准确识别零件种类与问题,检测速度可达20ms/件。机器可以在精度上与人工检测持平,同时在质检速度上大幅提升。根据测算,一台检测机器可以代替十多位熟练质检工人,能够帮助企业降低15%的生产成本。另外,分拣机的应用具有较好的拓展性,可支持数十种形状各异、高精密的小零件分拣。
甲状腺结节图像智能识别与辅助诊断系统
整合医生专家的诊断逻辑,基于飞桨平台构建深度学习模型,对标注好的甲状腺结节图像进行训练,抽取图像特征,从而判定甲状腺结节的良恶性,实现甲状腺图像智能识别系统,辅助医生进行诊断。
智能医疗辅助诊断系统(AIMADS)
AIMADS可用于常见皮肤病脑肿瘤的辅助诊断,用户可通过在客户端上传患处图片到服务器,服务器端通过本团队设计的诊断算法在飞桨平台对上传数据进行分析,在 APP 中显示诊断结果。
8.趣味生活
猜拳机
2018年7月,小度猜拳手通过使用深度卷积神经网络技术训练出能够识别用户出拳结果的模型,该模型可以识别石头、剪刀、布的手势。在用户出拳过程中,系统会不断采集用户的手势图片,通过飞桨实时预判人的出拳概率。
9.社科类
全球濒危语言典藏--土家语翻译系统
当前学术界意识到了濒危语言问题的重要性,积极倡导各国语言学家对本国语言、尤其是濒危语言加以关注,并采取具体的行动进行口语记录、语言典藏。2003年英国伦敦大学开展了对全球濒危语言进行深度典藏的国际项目,2004年中国开始参与到项目之中,中国社会科学院民族学与人类学研究所的徐世璇教授作为中国参与国际濒危语言典藏项目的负责人人,负责包括土家语的保存等重要项目。社科院利用飞桨实现了针对土家语预料的标音及意译,算法准确率已经达到了约70%,达到人工标注水平,且效率提高了几个数量级。在当前全球濒危语言保护工作中起到了重要作用。
以上所有数据来源:内部测试结果,实际结果可能受测试环境影响而在一定范围内变化,仅供参考。
社区与生态
PPDE | 飞桨开发者技术专家计划 [26]
飞桨开发者技术专家计划(PaddlePaddle Developers Experts)是飞桨社区为开发者提供的荣誉认证体系,支持开发者践行开源理念,引领技术潮流,共建繁荣社区,通过技术成长与社区贡献进阶,开发者可以成长为PPDE、高级PPDE及资深PPDE,并且享受多样顶级权益:
  • 专享服务权益:专人技术支持,技术大赛辅导等,助力技术成长与项目落地
  • PPDE大礼包:PPDE成员专享的神秘礼包,包含一系列个人身份认证与礼品
  • 个人品牌打造:PPDE专属身份认证、网页展现、项目宣传及相关活动担任主讲
  • 官方活动主推:Wave Summit及百度其他技术峰会讲师邀约
  • 技术大咖交流:获得与技术大咖面对面交流的机会
  • PPDE Club:定期与飞桨产品技术团队面对面交流需求,对产品提出意见建议
  • 全球技术游学:赞助前往国际国内顶会,作为百度开发者代表进行交流
  • 顶级项目支持:赞助具有重大科研价值或社会公益价值的项目
PPDE计划迄今已有100多位成员,此计划面向全球应用飞桨的技术极客开源项目贡献者、高校教授、技术博主、畅销书作家等发出邀请,只要满足以下3项条件之一,即可提交申请:
技术成果:应用飞桨产出至少2篇优质技术文章或视频教程;或应用飞桨产出并开源至少4个优质项目;或在GitHub为飞桨至少提交过4次PR
开源实践:乐于为飞桨开源社区的发展贡献力量,成为至少2次线上/线下技术分享的主讲人,积极为其它成员答疑解惑
其它:包括不限于在实际场景中落地飞桨技术并开源项目、应用飞桨参加大赛取得优异成绩并将项目开源、写作飞桨应用实践相关畅销书籍、在高校开设飞桨相关课程
飞桨领航团 | 已覆盖29个省市,130+高校 [37]
飞桨开发者的兴趣社区,为开发者们提供丰富的本地技术沙龙、Meetup及线上交流平台。飞桨领航团已建立150个社群,覆盖29个省级行政区,133个高校。欢迎开发者们加入领航团,结实更多本地技术同好,共建开源社区,共享开源成果与快乐。
  • 官方学习资料:实时提供飞桨最新的学习资料及直播课程等
  • 最新技术资讯:实时提供产业落地案例、产品功能升级、产业动态等一手资讯
  • 线上线下活动:组织丰富的线上线下活动,包括黑客马拉松、圆桌论坛,技术大咖交流、开发者meetup等
  • 技术支持:为开发者的项目开发提供官方团队及社区的技术支持
PP SIG | 飞桨特别兴趣小组
通过开放的社区形式与全球的开发者共同构建一个开放、多元和架构包容的生态体系。目前已建立的PP SIG包括计算机视觉、推理部署、工具效率组件等多个技术方向等。
飞桨特别兴趣小组
飞桨博士会 | 100+博士已加入 [38]
中国深度学习俱乐部,助力会员交流前沿科技,拓展行业高端人脉
  • 核心开发者交流圈:飞桨博士会成员皆为博士及以上学历,具备深度学习多年研究和实践经验
  • 线下高端技术沙龙:定期举办,百度核心研发工程师主讲深度学习前沿技术,与会员研讨最新研发成果
  • 科研合作资源支持:博士会员如在科研中使用飞桨,可优先获得 GPU算力、飞桨研发团队技术支持等
  • 商业生态优先合作:博士会员所在科研院所或企业如有合作需求,可优先享有飞桨商业合作咨询服务、飞桨研发团队技术支持等特权
百度AI竞赛 | 以赛引才、以赛促用、以赛兴业
飞桨承办了80余场国内外大型AI赛事。赛题方向覆盖人工智能技术前沿领域,致力于打造全球领先的AI赛事,聚才兴业,推动智能经济发展。
飞桨开放多年办赛先进经验,提供一站式专业办赛服务支持,诚邀各机构、公司、院校等合作伙伴,共同举办具有影响力的AI赛事。
  • 专业办赛服务支持:开放丰富办赛经验,提供一站式比赛管理平台,包括赛事发布、在线组队、自动化评测及排名更新等功能,助力主办方实时监控比赛数据,掌握比赛动向。
  • GPU算力支持:飞桨AI Studio提供在线开发环境,比赛专属Tesla V100 GPU算力补贴,破除选手算力桎梏。
  • 百度系全栈流量曝光:专业赛事宣传服务,社群定向开发者邀约,最大化赛事影响力。
  • 技术支持及人员线上培训:飞桨技术专家坐镇指导,提供全流程办赛技术支持;资深比赛队员在线分享大赛经验。
AICA-首席AI架构师培养计划 | 闭门小班,为中国产业界培养高端复合型AI人才
专注于深度学习产业落地应用,与百度最有经验的AI专家闭门学习、研讨,助力企业跨越鸿沟
  • 顶尖师资:百度深度学习T10+架构师面对面深度交流,培育极其稀缺的产业+AI复合型人才
  • 案例剖析:剖析百度AI业务及生态伙伴企业中,业务与深度学习结合的典型案例,举一反三
  • 经验解锁:授课老师、指导专家、助教三师制全程指导,解锁百度核心业务中深度学习落地的关键技术
  • 产业创新:企业AI项目一对一研讨,助力企业形成AI方法论,解决实际业务问题,挖掘智能化新机遇
AI私享会 | 深入行业,定向研讨,产研专家交流碰撞的高端沙
聚合产业精英与AI技术专家,破解行业技术难题,洞察未来发现机遇
  • 高端圆桌:限量邀请领域内优质企业,与行业大咖面对面深度沟通
  • 行业聚焦:每场主题讨论所在行业面临典型挑战与机遇
  • 问题剖析:针对落地难题,各方技术专家深度解惑
  • 资源整合:产业上下游企业资源打通,共创行业AI新机遇
AI快车道 | 支持10000家企业智能化升级
详解行业场景AI应用所必需的深度学习技术方案,助力企业领跑新基建
  • 行业案例:汇聚行业场景真实案例,在多个案例的通用性和差异性中萃取行业技术经验
  • 技术详解:结合飞桨产业级AI开发工具,详细解读深度学习开发全流程的技术方法和性能优势
  • 即学即用:深度学习,简单开发,通过课程讲解+答疑交流+课件材料深入浅出的指导快速开发
  • 全国巡回:过去2年已完成8个城市30余场线下课程,2021将继续开展高频次的城市交流
飞桨技术伙伴计划 | 全方位赋能伙伴企业深度学习技术能力提升,共享AI未来
以技术赋能为宗旨,产业落地为目标,助力合作伙伴客户规模化落地
  • 联合研发:共同打造行业深度学习技术方案,提高项目交付质量
  • 专项支持:合作伙伴专人对接,重要项目技术专家专项支持
  • 官方推广:优秀伙伴及案例可获得飞桨官网等多平台展示推广机会
  • 业务支持:优质创业企业给予上下游产业资源、战略投资等方面的资源支持
教育生态
深度学习7日打卡营
通过7日短平快的在线打卡学习,帮助开发者快速掌握深度学习技术
  • 内容最新:结业最新技术与热点话题,开发最前沿的实战课程
  • 专业讲师:百度官方认证的深度学习布道师授课
  • 形式多样:直播、打卡、比赛、PK等多重激励,专治拖延症
飞桨官方深度学习集训营
通过3-4个月的系统学习,助力开发者零基础入行深度学习
  • 权威讲师:大佬坐镇,百度核心架构师全程直播教学
  • 系统课程:零基础入门到实战,涵盖CV、NLP、推荐系统等应用领域
  • 实战导向:全实战教学、手把手敲代码,首发百度特色实战案例
丰富在线实战课程
包含5000+小时AI深度学习实战课程,不同开发者轻松找到匹配的学习路径
  • 课程全面:内容覆盖Python、机器学习、深度学习等全体系的AI实战课程
  • 实战导向:视频+文档+代码,免安装的在线实训环境,免费GPU资源
  • 测评考试:部分课程包含测评考试功能,实时掌握自身学习成果
丰富在线实战课程
飞桨启航计划:携手高校、破浪前行
  • 预计总投入5亿元
  • 深度合作高校院所500所
  • 联合打造5000人专业教师队伍
  • 联合培养50万AI未来人才
AI人才产教融合培养方案
飞桨在人工智能技术以及行业深入探索,力争为高校提供一套涵盖教学体系教学大纲、教学方案、教材、教学教研产品等完整的、全流程、全体系的AI人才产教融合培养方案。着力为推进高校快速建立人工智能专业及人工智能人才培养和就业提供生态环境,包括教学、科研、人才拓展、应用场景等多个方面的服务体系,涵盖机器学习、计算机视觉、自然语言处理、语音识别等多个领域,将项目应用开发和教学科研紧密结合,打造覆盖人工智能全行业的高质量复合型、创新型、应用型人才
AI人才产教融合培养方案
高校教学支持计划
提供四位一体的课程共建方案,支持200+高校开设人工智能课程
  • 师资培训:新工科联盟第一个深度学习师资培训班,技能全方位提升
  • 开课礼包:全套课程体系、课件PPT、实践案例、教学视频、专业教材
  • 实践平台:免安装的实践环境,完善的班级管理功能,免费的GPU资源
  • 协同育人:支持高校实践创新、教学创新,基金累计发放超过200万元
飞桨高校深度学习师资培训班
在教育部指导下,百度飞桨与全国重点高校联合打造的深度学习师资培养计划
  • 师资培养:已开办15期师资培训班,培养了2000+名深度学习专业教师
  • 实践导向:高强度代码实践,教师技术水平72小时飞跃式提升
  • 教学研讨:开课思路与教学法研讨,从输入到输出,解锁高校AI教学新思路
企业师资入驻
派驻企业师资,融入企业育人实践,贯穿学生成长全过程。通过开设特色实践课程、提供高质量的实践及前沿指导,将产业理念、技术、资源整合到培养体系、课程及实训中,最大程度共享及优化配置产教资源,培养高素质和具有产业应用视角的创新人才
高校相关赛事
面向高校,飞桨组织开展了多项“国字头”重要赛事,以下赛事均已被列入中国高等教育学会全国普通高校大学生竞赛排行榜”,包含教育部高等学校自动化类专业教学指导委员会主办,清华大学承办的“全国大学生智能汽车竞赛”,由全国高等学校计算机教育研究会主办,浙江大学百度公司联合承办的“中国高校计算机大赛—人工智能创意赛”(简称C4), 由工业和信息化部、教育部、江苏省人民政府共同主办的 “中国软件杯”大学生软件设计大赛,以北京语言大学法人单位主办的“中国大学生计算机设计大赛”(简称4C)等。
此外,还有西安交通大学国际大数据竞赛、百度之星开发者大赛等热门赛事,每年均会吸引海内外多所名校学子共同参与!
AI Studio教育版
提供领先的教学管理与实训平台,深入促进实践型AI人才培养
  • 在线教学环境:云端集成免安装,在线联网,便捷易用
  • 免费算力支持:CPU/GPU 资源免费提供,降低高校开课门槛
  • 内置教学实验:丰富教学实验案例,从入门到进阶,一应俱全
  • 实用教学管理:完备实用的教学管理功能,助力专业课堂教学
深度学习工程师能力认证
2018年,百度联合深度学习技术及应用国家工程实验室中国软件行业协会,共同发布中国深度学习工程师能力评估标准。2019年3月,百度向社会开放“深度学习工程师”认证考试,并提供相应的学习解决方案。
2020年,为了助力深度学习工程师的职业发展,百度飞桨和Linux Foundation开源大学合作推出国内首个深度学习工程师联合认证。本次联合认证全称为 Certified Open Source Officer & Deep LearningEngineer Associate,从名称上可以看出,本次双认证不仅注重开发者在深度学习方面的技术能力,也对开发者的开源基本能力提出了一定的要求。现已开通人才招募“绿色通道”,通过认证的开发者将获得认证标签并被纳入AI专项人才库,百度AI技术岗位可以免笔试应聘,相关生态合作企业技术岗位也可优先录用。
国家工程实验室
2017年2月,国家发展和改革委员会正式批复,由百度牵头联合清华大学、北京航空航天大学中国电子技术标准化研究院中国信息通信研究院,共同筹建深度学习技术及应用国家工程实验室。飞桨依托深度学习技术与应用国家工程实验室,与国内多家科研机构及高校合作研发的深度学习技术,为深度学习研究者、企业和开发者提供功能丰富的开源深度学习平台。
WAVE SUMMIT深度学习开发者峰会
WAVE SUMMIT深度学习开发者峰会由深度学习技术及应用国家工程实验室与百度联合主办,会上,来自百度、英特尔、华为、清华大学、北京航空航天大学等公司及高校的科学家及人工智能专家共同探讨深度学习时代的技术方向及产业前景,同时,深度学习平台飞桨发布多项新特性及服务,为深度学习开发者提供利器。
亿元算力支持计划
2019年4月23日,在首届WAVE SUMMIT 2019深度学习开发者峰会上,百度宣布了AI Studio算力支持计划,开放价值近亿元人民币的免费算力资源,助力开发者成功。免费算力主要以两种模式提供,第一种是一人一卡模式,V100的训练卡包括16G的显存,可达2T的存储空间。另外一种是远程集群模式,飞桨提供高性能集群,供开发者免费使用,登陆AI Studio即可使用。 [27]
所获荣誉
2020年8月15日,百度和华为共同完成的项目"飞桨产业级深度学习技术与平台"荣获2019年度中国电子学会科学技术奖科技进步一等奖。 [3]
2020年9月,百度飞桨获2020年服贸会“科技创新服务示范案例”。 [4]