科技频道> 网事> 正文

2018百度AI开发者大会:吴中勤详解百度视觉语义化技术

2018-07-06 20:20 来源:中华网 
2018-07-06 20:20:01来源:中华网作者:责任编辑:战钊

  7月4日,“Baidu Create 2018”(百度AI开发者大会)上,百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰播放了一段无人超市中的视频。视频中,购物可以实现即拿即走,轻松便捷;购物车既可以为你指路,也可以乖乖跟随身后,服务十分到位。

  无人超市的背后,是百度视觉语义化技术的应用。当天下午的“百度大脑论坛”上,百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤对百度视觉语义化技术及其应用进行了详细的介绍。他表示,百度视觉技术团队通过领先的技术创新突破,实现了从看清向看懂的升级,成为新零售、视频媒体等各大场景应用的“福音”。

  百度视觉语义化技术是百度AI全新的视觉感知和理解能力,是一次质的飞跃。它以数据采集、光学传感器、嵌入式芯片、云端计算服务为底层依赖,通过人脸、物体检测、文字识别、场景分析的识别算法,以及动作监测、视频跟踪、事件分析的语义分析,输出智能分析与推理、可视化展现、检索查询系统等解决方案,能够被广泛应用在零售、视频媒体、金融、医疗、交通运输和营销等众多领域。

  百度视觉语义化技术实现“看懂”需要4个步骤,从识别人、物和场景,到捕捉行为和关系,然后形成时序化、数字化、结构化的语义知识,可进行智慧推理并在场景落地应用。

  例如在超市场景,当顾客进入超市时,基于百度视觉语义化可以首先通过人体识别和ReID确认顾客身份(会员/首次光顾),然后通过捕捉用户的浏览区域、停留时间以及选购商品等,分析用户偏好,进而实现顾客行为语义化分析。

  “百度的视觉语义化技术还提供软硬一体的解决方案,加速在零售场景中的落地。”吴中勤表示。

  除了零售行业,百度视觉语义化在视频分析和汽车保险智能定损领域也有出色表现。在车辆保险智能定损领域,该解决方案能适用90%乘用车型,囊括67类语义分割部件,拥有8种语义损伤类型,通过对车辆部件和损伤的像素级识别,能够对损伤部件形成准确的物理损伤描述,进而形成对应的维修逻辑和价格,输出合理的定损及理赔方案。

  吴中勤以正在如火如荼进行的世界杯赛事为例,展示了视觉语义化技术在视频分析领域的应用。有了这个技术,AI能够通过比赛对球场各种元素的识别,包括球员、足球、赛场区域等元素,以及行为动作的捕捉,如球员的射门、角球等动作,从而进行智能推理与应用,为用户提供精彩射门集锦、球员和球队表现分析、视频中事件智能检索甚至智能问答等功能,能大幅提升视频媒体分析的表现。

  事实上,要实现诸如智能零售、视频媒体分析这样的场景,背后依赖于强大算法和技术能力。值得一提的是,百度视觉技术在此领域首创Pyramidbox算法、Ubiquitous Reweighting Network算法以及Action Proposal Network、StNet和 Attention Clusters算法,在WIDER FACE人脸、WebVision大规模图像识别、ActivityNet视频理解等全球视觉竞赛中取得多项世界第一的好成绩,在识别人、识别物、捕捉关系三个技术领域均有业界最领先的技术积累。

  除了在算法上,百度视觉语义化技术与智能手机等硬件设备的结合,也有多项最新进展。据介绍,百度视觉语义化支持百度AR、百度OCR、场景识别、智能相册分类、拍照识图等解决方案,通过硬件+OS+算法的联动优化,为华为、VIVO、小米、三星、魅族等智能手机合作伙伴提供领先的技术服务。他还展示了华为P20手机上的AR(增强现实)萌宠功能。

  吴中勤进一步介绍了视觉语义化技术与机器人结合实现物理行动能力的进展。百度研发的基于深度增强学习的无地图避障算法,应用于机器人中,可以实现机器人在密集人流环境下的快速、动态地避障。而在当天的百度AI开发者大会会场,参会者均看到了搭载此项技术的机器人,在人群中灵活穿梭的身影。

  在软硬结合方面,吴中勤还重点介绍了基于百度视觉语义化还与新型传感器、AI芯片进行结合的进展,并发布了两款自主研发的智能视觉AI硬件底层模组:红外3D结构光模组BoteyeR及视觉智能AI相机模组Xeye。据介绍,BoteyeR模组通过业界领先的红外3D结构光和人脸算法,实现人脸活体识别的解决方案,可以有效解决在暗光和攻击等复杂场景下人脸认证困难的技术问题。Xeye AI相机模组打造了一个低成本、小型化、端上计算的智能物体识别跟踪相机,集成了众多终端计算的视觉感知能力,如人脸识别、物体识别、手势识别等,有效解决新零售、安防、智能家具等场景视觉技术应用的隐私、成本、计算开销等问题。

  增强现实有潜力成为下一代重要的交互平台,在视觉语义化技术基础之上,加入增强现实AR这样的元素,可以让人们感受到虚实结合的互动体验。吴中勤宣布重磅发布百度增强现实AR平台DuMix3.0版本。据吴中勤介绍,去年百度AI开发者大会,百度发布了百度增强现实AR平台DuMix1.0版本、去年年底的百度世界大会发布了DuMix 的第二个版本。在过去一年间,用户与百度AR创造出的虚拟形象,互动人次已经超过了十亿次。今天发布的DuMix3.0,重点聚焦在人体、人脸、肢体交互能力升级上,重大升级点包括高精度、真三维的人脸AR和高精度人体AR,把AR虚实结合的互动能力带到了新的高度,也让用户更便捷地体验到AR互动的魅力。在随后播放的视频中,参会者感受到了百度DuMix3.0多项精细逼真、高精度、真三维的AR交互能力,包括人脸编辑、3D虚拟装饰、肢体交互游戏等。

  “视觉语义化技术的应用范围非常广泛,通过在越来越多场景中的应用落地,和持续更新迭代,将真正实现机器设备从看清到看懂的跨越,”吴中勤表示,未来,百度视觉语义化将持续创新,携手开发者和合作伙伴推动AI技术的落地,通过助力开发者,实现开放共赢,共建更强大的AI生态,用科技让复杂的世界更简单。

[责任编辑:战钊]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有