24小时联系电话:185 8888 888

商业
您现在的位置: 首页 > 商业 > Google发布了包含500万张图片和200,000个地标的人工智能培训数据集
  • 双十一购六点作业智能学习灯,从此辅导孩子学习高效又省力

    双十一购六点作业智能学习灯,从此辅导孩子学习高效又省力

    发布时间:2022/11/01

    现在的家长都很重视孩子的教育,市面上对于教育的辅助产品也很多,基础的学习机、学习台灯、点读机等等五花八门的产品让人看的眼花缭乱。马上双十一了,怎么选让家长很是头痛。在调研过市面上众多的智能学习产品...

  • 悦康爱力士与60余家大型线上、线下渠道签约完成 实现全渠道覆盖

    悦康爱力士与60余家大型线上、线下渠道签约完成 实现全渠道覆盖

    发布时间:2022/01/19

    1月18日,悦康药业(688658.SH)在广东省广州市举行爱力士®枸橼酸爱地那非上市发布会暨销售签约仪式,发布会现场,悦康药业与权威媒体、线上平台、OTC连锁药店、线下终端等60余家渠道商签署了合作协议。悦康药业表示,...

  • “平”地而起,2022中国企业数智市场报告即将发布

    “平”地而起,2022中国企业数智市场报告即将发布

    发布时间:2021/12/10

    点击报名:http://hdxu.cn/k1Wbb 数智化大潮风云际会,平台层产品尤为亮眼。 在即将举行的洞见2022中国企业服务市场年会上,海比研究院对外发布《2022中国企业数智服务市场趋势洞察报告》。报告基于桌面文献研究法、...

  • 《2021中国城市社区碳中和大梅沙行动宣言》在深圳发布

    《2021中国城市社区碳中和大梅沙行动宣言》在深圳发布

    发布时间:2021/10/26

    10月17日,以“助力双碳目标共建美好未来”为主题的2021大梅沙碳中和国际论坛在深圳万科国际会议中心成功举行。论坛现场发布《2021中国城市社区碳中和大梅沙行动宣言》,助力实现碳达峰、碳中和目标。 本次论坛由中...

  • “酷”大脑研究的扭曲观念扼杀了心理治疗

    “酷”大脑研究的扭曲观念扼杀了心理治疗

    发布时间:2020/03/31

      ‘对于人类的每一个问题,总是存在着众所周知的解决方案-简洁,合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且,不乏任何试图探究其深度的简洁,合理和错误的答案。 在我职业生...

  • SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    发布时间:2020/03/31

      美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船,用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本,将作为第一批从NASA获得...

  • Spaces应用程序使人们可以参加VR中的Zoom会议

    Spaces应用程序使人们可以参加VR中的Zoom会议

    发布时间:2020/03/30

      一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。 该应用是根据最近发生的COVID-19大流行而开发的,该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...

  • 汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    发布时间:2020/03/30

      总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案,该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言,如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法),...

Google发布了包含500万张图片和200,000个地标的人工智能培训数据集

发布时间:2019/05/05 商业 浏览次数:677

 
据悉,设计能够进行精确实例级地标识别的AI系统(即,将尼亚加拉大瀑布与任何瀑布区分开来)和检索图像(将图像中的对象与目录中该对象的其他实例匹配)是Google AI研究部门的长期追求。去年,它发布了Google-Landmarks,这是当时世界上最大的地标数据集,并举办了两场比赛(Landmark Recognition 2018和Landmark Retrieval 2018),其中有500多名机器学习研究人员参加。
今天,朝着更复杂的地标检测计算机视觉模型的目标迈出了重要的一步,谷歌开源的Google-Landmarks-v2,一个新的,更大的地标识别语料库,包含两倍的照片和七倍的地标。此外,它还在其机器学习社区Kaggle上推出了两项新挑战(Landmark Recognition 2019和Landmark Retrieval 2019),并发布了Detect-to-Retrieve的源代码和模型,这是一个区域图像检索框架。
Google AI软件工程师Bingyi Cao和Tobias Weyand写道:“实例识别和图像检索方法都需要更大的数据集,包括图像数量和各种标志,以便训练更好,更强大的系统。” “我们希望这个数据集能够帮助推进实例识别和图像检索方面的最新技术。”
根据Bingyi和Weyand的说法,Google-Landmarks-v2包含了超过500万张来自世界各地摄影师收集的20多万个不同地标的图像。有问题的照片标出了他们自己的图像 – 描绘了新天鹅堡,金门大桥,清水寺,哈利法塔,吉萨大狮身人面像,马丘比丘和其他着名景点 – 并提交了它们。然后,谷歌研究人员用来自维基媒体基金会维基媒体基金会的免费使用图像,声音和其他媒体的在线存储库来补充历史和鲜为人知的图像。
那么Detect-to-Retrieve框架的处理是什么? Cao和Weyand表示,已发布的模型 – 由原始地标数据集中的80,000个子集进行训练 – 利用来自物体检测模型的边界框来为包含感兴趣项目的图像区域提供“额外的权重”,从而显着提高准确性。
具有设计地标检测AI模型的任务的Landmark Recognition 2019和竞争对手使用AI系统查找显示目标地标的图像的Landmark Retrieval 2019都可以进入。两者都包括总额为50,000美元的现金奖励,Bingyi和Weyand表示将邀请获奖团队在今年晚些时候在加利福尼亚州长滩举行的2019年计算机视觉和模式识别会议的第二次地标识别研讨会上展示他们的方法。

姓 名:
邮箱
留 言: