资讯频道

百度开放全新机器人视觉解决方案

  10月26日电 继“Create with AI”百度AI开发者实战营首站活动在深圳圆满落幕后,“燎原”之火又将蔓延至蓉城天府之国——成都。10月26日,百度AI开发者实战营第二站走进成都,数名百度资深AI工程师详细介绍了百度机器人视觉技术、识图技术及应用、UNIT语言理解与交互技术以及百度深度学习平台PaddlePaddle,并与成都地区的开发者分享了不同领域的落地案例。

  上周,百度在深圳发布了名为“燎原”的AI开发者扶植计划,并正式启动AI加速器一期报名,目前已得到了广大开发者、创业者的积极关注与响应。成都站中,百度AI技术生态部技术经理谢永康进一步解读了“燎原计划”,该计划拟在2018年为百度招揽500多家生态合作伙伴,培养超过5000名人工智能人才,遴选60多家创业公司进入AI加速器,并投资其中的优秀者,通过技术、客户、营销等资源帮助开发者成功,共同构建AI全链条的行业生态。

  作为成都站的重要内容之一,百度机器人视觉负责人包英泽在演讲环节中着重介绍了百度AI开放平台最新上线的机器人视觉解决方案。他表示,“不同于市面上所有别的机器人视觉模组,百度机器人视觉是市面上唯一既有导航定位(SLAM),也有物体识别(人脸识别、物品识别、OCR识别)的机器人视觉SDK,并且是唯一软硬件都开源的视觉模组。”目前,百度机器人视觉已经在百度AI开放平台开放试用,开发者可体验这一软硬一体的机器人视觉技术解决方案。

blob.png

  百度机器人视觉解决方案采用硬件开源、软件开放的形式为开发者提供全方位一站式服务,包括硬件模组和机器人SDK两部分。硬件方面,百度自主研发的立体惯性相机模组配置了两个全局摄像头和一个传感器,开发者可根据需要调整双目的距离。机器人SDK提供视觉惯性SLAM、障碍物检测、平面2D建图等离线功能,以及人脸、文字、物体等云端识别功能。

blob.png

  通过百度机器人视觉解决方案,机器人可以更好地“看懂”这个世界,像人一样拥有观察感知能力。开发者可在自己的机器人产品中安装百度相机模组,模组输出的图像和传感器数据输入百度机器人视觉SDK。SLAM视觉惯性算法将为机器人提供高精度的实时定位;由双目图像经过深度神经网络获取的图像经过深度神经网络,可以为机器人提供准确完整的障碍物信息,让机器人安全自由地行走;同时,连接到百度云端API,机器人还拥有人脸识别、OCR(文字识别)、物体识别等功能。此前,担任北京汉光百货兰蔻专柜一日导购的“小度机器人”,运用的就是百度机器人视觉解决方案。

blob.png

百度机器人视觉对外合作方案

  机器人视觉解决方案外,百度AI开放平台新增了图像识别、图像搜索等AI视觉能力,百度识图技术负责人刘国翌为在场开发者介绍了百度识图技术及应用。百度图像识别能力包括通用识别、品牌logo识别、文字识别、动植物识别、菜品识别、车型识别与定损等,识图后台大量使用深度学习技术,能够对用户上传的图片进行精准识别,并检索后台近百亿图像数据返回相关信息。百度搜索技术是主要针对以图搜图、以图搜信息的需求实现的通用图像识别和检索系统。

  在展示区,借助百度人脸会场签到解决方案,参会者只需在报名时上传个人照片,即可“刷脸入场”。很多开发者看中了这个功能全面、操作简单、覆盖会议操作全流程的解决方案,当体验到它会议创建、报名、刷脸签到一站式管理的便捷,了解到它也已经免费提供给开发者使用时,纷纷翘起大拇指。在实战营的其他互动展区,开发者与百度语音、人脸识别、自然语言处理、AR、PaddlePaddle等百度AI技术亲密接触,也更进一步刷新了对百度AI开放平台的了解。

  在随后的演讲中,百度UNIT技术负责人孙珂、PaddlePaddle高级研发工程师刘毅冰,分别介绍了百度在相应领域的最新技术进展和开放能力。活动最后的Workshop环节,刘毅冰结合实际案例为开发者展示了PaddlePaddle丰富的算法服务,包括机器视觉、自然语言理解、推荐系统等,在场开发者大呼过瘾,表示这次活动“全程无尿点”。

  11月2日,百度AI开发者实战营将走进素有“人间天堂”之称的杭州,届时,百度资深AI工程师将详细解读百度人脸识别技术及应用方案、语音识别技术、百度AR技术与平台等,并与杭州地区的开发者进行面对面交流,相信这场活动也会给到场开发者留下浓墨重彩的一笔。目前,开发者已可以通过百度AI开放平台官网等渠道报名。


文章版权归西部工控xbgk所有,未经许可不得转载。