24小时联系电话:185 8888 888

新闻
您现在的位置: 首页 > 新闻 > Google的Objectron使用AI跟踪2D视频中的3D对象
  • “酷”大脑研究的扭曲观念扼杀了心理治疗

    “酷”大脑研究的扭曲观念扼杀了心理治疗

    发布时间:2020/03/31

      ‘对于人类的每一个问题,总是存在着众所周知的解决方案-简洁,合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且,不乏任何试图探究其深度的简洁,合理和错误的答案。 在我职业生...

  • SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    发布时间:2020/03/31

      美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船,用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本,将作为第一批从NASA获得...

  • Spaces应用程序使人们可以参加VR中的Zoom会议

    Spaces应用程序使人们可以参加VR中的Zoom会议

    发布时间:2020/03/30

      一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。 该应用是根据最近发生的COVID-19大流行而开发的,该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...

  • 汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    发布时间:2020/03/30

      总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案,该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言,如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法),...

Google的Objectron使用AI跟踪2D视频中的3D对象

发布时间:2020/03/13 新闻 浏览次数:567

 
恰逢2020年TensorFlow开发者峰会拉开序幕,Google今天发布了一条管道-Objectron-在2D图像中发现物体并通过AI模型估算其姿势和大小。该公司表示,它对机器人技术,自动驾驶汽车,图像检索和增强现实具有影响-例如,它可以帮助工厂车间的机器人实时避免障碍。
跟踪3D对象是一个棘手的前景,尤其是在处理有限的计算资源(例如智能手机片上系统)时。由于缺乏数据以及物体的外观和形状的多样性,当仅有的可用图像(通常是视频)为2D时,情况会变得更加艰难。
然后,由Objectron支持的Google团队开发了一个工具集,该工具集允许注释者使用分屏视图显示2D视频帧来标记对象的3D边界框(即矩形边框)。在点云,相机位置和检测到的平面旁边,将3D边界框覆盖在其上方。注释者在3D视图中绘制了3D边界框,并通过查看2D视频帧中的投影来验证其位置,对于静态对象,他们只需在单个帧中注释目标对象即可。该工具使用AR会话数据中的地面真实摄像机姿势信息将对象的位置传播到所有帧。
为了补充现实世界的数据以提高AI模型预测的准确性,该团队开发了一种引擎,可将虚拟对象放置到包含AR会话数据的场景中。这样就可以使用摄像机的姿势,检测到的平面表面以及估计的照明来生成与场景匹配的光照在物理上可能的位置,从而产生高质量的合成数据,其中包含的渲染对象尊重场景的几何形状并无缝地适合真实背景。在验证测试中,综合数据的准确性提高了约10%。
更好的是,该团队表示,当前版本的Objectron模型足够轻巧,可以在旗舰移动设备上实时运行。借助LG V60 ThinQ,三星Galaxy S20 +和Sony Xperia 1 II等手机中的Adreno 650移动图形芯片,它能够每秒处理约26帧。
Objectron可在MediaPipe中使用,MediaPipe是用于构建跨平台AI管道的框架,该管道包括快速推理和媒体处理(如视频解码)。提供训练有素的识别鞋子和椅子的模型,以及端到端演示应用程序。
该团队表示,将来计划与研发社区共享其他解决方案,以刺激新的用例,应用程序和研究工作。此外,它打算将Objectron模型扩展到更多类别的对象,并进一步提高其在设备上的性能。