每周一篇原创,关注5G、物联网、人工智能,跟着我的【头号观点】坚持利用碎片时间学习
EasyDL是百度大脑推出的定制化AI训练及服务平台,支持面向各行各业有定制AI需求的企业用户及开发者使用。支持从数据管理与数据标注、模型训练、模型部署一站式AI开发流程,通过原始图片、文本、音频、视频类数据经过EasyDL加工、学习、部署可发布为公有云API、设备端SDK、本地化部署及软硬一体产品。
EasyDL产品从目标客户及应用场景的角度分为经典版、专业版、零售版两个核心产品。
经典版面向零算法基础或者追求高效率开发AI的企业用户,现已支持图像分类、物体检测、图像分割、文本分类、视频分类、声音分类六类模型类型定制。
专业版面向AI初学者或AI专业工程师推出的AI模型训练与服务平台,目前支持视觉及自然语言处理两大技术方向,内置百度海量数据训练的预训练模型,可灵活脚本调参,只需少量数据可达到优模型效果。
零售版专门面向零售场景的ISV、零售行业服务商等企业用户提供【商品识别场景】的AI服务获取方案,支持面向货架巡检、自助结算台、无人零售柜等商品检测场景提供定制商品检测训练平台及标准商品检测API两类服务。
图片来源于百度官网
EasyDL经典版是EasyDL在2017年11月中旬在国内率先推出的针对AI零算法基础或者追求高效率开发的企业用户及开发者推出的AI模型训练与服务平台,设计简约,极易理解,最快5分钟即可上手,10分钟完成模型训练。
适用人群
AI零算法基础或者追求高效率
产品特性
无需了解算法细节,5分钟即可上手,最快10分钟完成模型训练。内置百度自研AutoDL技术,只需少量数据就能训练出高精度模型。
共支持6种模型类型
图像分类:识别一张图中是否是某类物体/状态/场景。可以识别图片中主体单一的场景
物体检测:在一张图包含多个物体的情况下,定制识别出每个物体的位置、数量、名称。可以识别图片中有多个主体的场景
图像分割:对比物体检测,支持用多边形标注训练数据,模型可像素级识别目标。适合图中有多个主体、需识别其位置或轮廓的场景
文本分类:基于自建分类体系的机器学习方法,可实现文本自动分类
声音分类:识别出当前音频是哪种声音,或者是什么状态/场景的声音
视频分类:分析短视频的内容,识别出视频内人体行为动作,环境变化,或是物体位置/状态变化
EasyDL专业版是EasyDL在2019年10月下旬全新推出的针对AI初学者或者AI专业工程师的企业用户及开发者推出的AI模型训练与服务平台,支持视觉及自然语言处理两大技术方向,内置百度海量数据训练的预训练模型,可灵活脚本调参,只需少量数据可达到优模型效果。
适用人群
专业AI工程师且追求灵活、深度调参的企业或个人开发者
产品特性
预置百度百亿级数据规模的预训练模型,包括丰富的视觉模型及自然语言处理模型ERNIE,训练效果更突出。
对比经典版,支持代码级调整模型参数和模型结构,封装底层算法逻辑细节,代码行数更少,更易有算法基础的开发者上手。
支持从数据管理,模型训练到模型部署一站式AI服务
支持定制模型类型
支持视觉及自然语言处理两大技术方向
视觉:支持图像分类及物体检测两类模型训练
自然语言处理:支持文本分类及短文本匹配两类模型训练,内置百度百亿级数据所训练出的预训练模型ENNIE
ERNIE:预训练模型ERNIE(艾尼)是百度基于用户大数据训练的拥有当前业内最好效果的中文语义表示模型。ERNIE(艾尼)预训练模型,已累计学习10亿多知识,能够助力各NLP任务快速提升效果。平台内置了最新的ERNIE2.0,并提供了ERNIE2.0-base、ERNIE2.0-Large两个版本供用户选择。
四、EasyDL零售版
EasyDL零售版是专用于零售行业用户训练商品检测模型的模型训练平台,平台提供海量预置的商品图片,开放基于百度大规模零售数据的预训练模型、及数据增强合成技术,实现低成本获得高精度商品检测AI模型服务。
适合人群
有商品识别需求的零售行业的企业或服务商
产品特性
针对零售场景专项算法调优,结合图像合成与增强技术提升模型泛化能力,模型准确率可达97%+,保证模型在生产环境中具有高可用性
对货架巡检场景的业务场景提供了货架拼接SDK及API接口,功能强大,体验更优
定制商品检测API:训练定制化商品检测模型,平台提供海量预置商品图片,开放基于百度大规模零售数据的预训练模型、及数据增强合成技术,实现低成本获得高精度商品检测AI模型服务
标准商品检测API:无需训练即可直接使用的商品检测API,支持零售商超常见商品品类,接口返回商品名称、规格、品类及在图片中的位置。底层模型针对货架合规性检查场景专项调优,适应大型商超、便利店、街边店等多种复杂货架场景
货架拼接SDK:货架拼接服务支持将多个货架局部图片或视频,组合为完整货架图片。同时支持输出在完整货架图中的商品检测结果,包含SKU的名称和数量,适用于需要在长货架进行商品检测的业务场景
五、百度EasyDL产品优势
EasyDL提供围绕AI服务开发的端到端的一站式AI开发和部署平台,包括数据上传、数据标注、训练任务配置及调参、模型效果评估、模型部署,同时EasyDL面向不同用户提供了不同的训练平台,包括适用AI零基础或追求高效率开发的用户使用的经典版、适用AI初学者和AI专业用户使用的专业版、专为零售行业客户提供的零售版三种平台级方案,方便各类企业用户及个人开发者使用。
Step 1 创建模型
确定模型名称,记录希望模型实现的功能
Step 2 上传并标注数据
分类功能的模型:在相应的分类标签下上传图片、文本、音频或视频等未标注或已标注数据。其中未标注数据支持在线标注。检测功能的模型:上传数据后,需要在数据中标注出需要检测的具体目标
Step 3 训练模型并校验效果
选择算法、配置训练数据及其他任务相关参数完成训练任务启动。模型训练完毕后支持可视化查看模型评估报告,并通过模型校验功能在线上传数据测试模型效果
Step 4 发布模型
将效果满意的模型选择训练任务版本,发布为API/设备端SDK/本地化部署/软硬一体设备。
2、高精度训练效果
EasyDL基于基于Paddle Paddle飞桨深度学习框架构建而成,内置丰富百度用户百亿级大数据训练的成熟预训练模型,底层结合百度自研的AutoDL/AutoML技术,基于少量数据就能获得出色效果和性能的模型。
NLP预训练模型ERNIE
EasyDL专业版的自然语言处理训练任务预置ERNIE 2.0,预训练模型ERNIE(艾尼)是百度基于用户大数据训练的拥有当前业内最好效果的中文语义表示模型。ERNIE(艾尼)预训练模型,已累计学习10亿多知识,能够助力各NLP任务快速提升效果。
AutoDL
EasyDL训练图像分类模型时,支持选择AutoDL Transfer。AutoDL Transfer模型是百度研发的AutoDL技术之一,结合了模型网络结构搜索、迁移学习技术、并针对用户数据进行自动优化。与通用算法相比,训练时间较长,但更适用于细分类场景。例如,通用算法可用于区分猫和狗,但如果要区分不同品种的猫,则AutoDL效果会更好
3、丰富的服务部署方式
EasyDL模型训练阶段需要在线训练。训练完成后,可将模型部署在公有云服务器、私有本地服务器,封装成可离线运行的设备端SDK,或直接购买软硬一体方案,有效应对各种业务场景对模型部署要求。
(1)公有云API
训练完成的模型存储在云端,可通过独立Rest API调用模型,实现AI能力与业务系统或硬件设备整合
具有完善的鉴权、流控等安全机制,GPU集群稳定承载高并发请求
支持查找云端模型识别错误的数据,纠正结果并将其加入模型迭代的训练集,不断优化模型效果
(2)私有服务器部署
可将训练完成的模型部署在私有CPU/GPU服务器上,支持私有API和服务器端SDK两种集成方式
可在内网/无网环境下使用模型,确保数据隐私
(3)设备端SDK
训练完成的模型被打包成适配智能硬件的SDK,可进行设备端离线计算。有效满足业务场景中无法联网、对数据保密性要求较高、响应时延要求更快的需求
支持iOS、Android、Linux、Windows四种操作系统,基础接口封装完善,满足灵活的应用侧二次开发
(4)软硬一体方案
为进一步提升前端智能计算的用户体验,EasyDL推出前端智能计算-软硬一体方案。
将百度推出的高性能硬件与EasyDL图像分类/物体检测模型深度适配,可应用于工业分拣、视频监控等多种设备端离线计算场景,让离线AI落地更轻松。可以通过参考以下文档轻松完成软硬件集成:
经典版图像分类、经典版物体检测、专业版视觉-脚本调参
4、完善安全的数据服务
数据对于模型效果至关重要,在数据服务上,EasyDL除提供基础的数据上传、存储、标注外,额外提供线下采集及标注支持、智能标注、多人标注、云服务数据管理等多种数据管理服务,大幅降低企业用户及开发者的训练数据处理成本,有效提高标注效率。
(1)智能标注
智能标注为一套人机交互的协作标注方式,目前EasyDL物体检测训练任务支持智能标注,在手工标注少量数据后,系统会从数据集所有图片中筛选出最关键的图片并提示需要优先标注。通常情况下,只需标注数据集30%左右的数据即可训练模型。与标注所有数据后训练相比,模型效果几乎等同。
(2)协作标注
EasyDL基础版-物体检测模型支持多人标注模式,通过将数据集在线共享给团队成员,实现多人分工标注数据并汇总数据训练的模式,有效降低标注成本,提高线下协作标注效率。
(3)云服务数据闭环
当将EasyDL训练的模型以公有云形态部署在业务场景中时,通过开通云服务数据管理功能,可以将实际业务场景的数据及识别结果在平台中查看和管理,通过将识别错误的结果人工筛选后保存至数据集持续训练,有效长期提升模型效果。
(4)采集/标注支持
EasyDL在提供便捷的标注服务的同时,也联合百度众测及第三方数据标注合作伙伴,提供全面且高质量的训练数据采集、标注服务。
六、综评
百度的EasyDL平台,意图有点过于狭隘,只使用了自己的框架PaddlePaddle,同时文本预训练模型只放了自己的ERNIE(艾尼),相对华为来说第三方内容较少,生态包容心态不好,同时加上百度与中小企业竞争,其平台现在用得并不好。
免责声明:
本公众号为个人研究专题学习分享,非商业公众号无任何商业目的,如果文章内容有侵权或者非法信息,请立即与本号联系删除谢谢,联系方式:Neal@touhao.ai
以上就是本篇文章【百度ai系列:开放能力——EasyDL】的全部内容了,欢迎阅览 ! 文章地址:http://sicmodule.glev.cn/quote/11365.html 行业 资讯 企业新闻 行情 企业黄页 同类资讯 网站地图 返回首页 歌乐夫资讯移动站 http://sicmodule.glev.cn/mobile/ , 查看更多