2019Google物体挑战赛结果正式揭晓极链科技获得金牌

国内新闻 阅读(1455)

我想分享

最近,由谷歌主办的2019年谷歌对象挑战赛的结果正式公布。极地链技术人工智能的第一个团队只剩下两个月就赢得了金牌。

去年,在可可女士停止举办物体边界识别竞赛后,谷歌发布了第一次物体识别竞赛,有400多名研究人员和机器学习研究人员参加。 今年,谷歌作为ICCV工作室之一,推出了基于开放图像V5数据集的第二次对象竞争,测试集与第一次完全相同。

谷歌开放图像-物体检测跟踪棒COCO物体识别大赛,作为计算机视觉领域的“黄金标准”,吸引了大量团队在开放图像数据集上获得最低的错误率,今年吸引了560多个团队。 同时,深度学习技术的突破使图像识别任务取得了显着进展,甚至超过了人类的精度。

随着深层网络解决方案变得越来越深入和复杂,它们通常会受到可用培训数据量的限制 考虑到这一点,为了刺激图像分析和理解的进展,谷歌已经公开发布了开放图像数据集。 开放图像(Open Images)遵循PASCAL VOC、ImageNet和COCO的传统,现已达到前所未有的规模。

物体识别作为计算机视觉的一个热门分支,有着广泛的应用场景,从已经非常成熟的车牌识别和行人检测,到近年来新兴的无人驾驶所需要的各种目标识别。 随着需求的增加,人们对识别精度的要求也在不断提高。 在2018年ECCV开放图像研讨会上,谷歌团队解释了开放图像对象识别竞赛与其他类似竞赛的区别和挑战,即数据量大、标签类型多、数据分布不均、提供标签依赖信息和数据标签不完整 与COCO相比,这个数据集的多样性要大得多,对最先进的实例识别方法提出了更大的挑战。 基于这一数据集,谷歌呼吁全球计算机视觉领域的科学精英共同参与,朝着更复杂的地标检测计算机视觉模型迈出一大步。 这也是迄今为止最大和最详细的公共数据。

作为极地链中的明星平台之一,“金眼”通过对物体、场景等各种维度的识别,给用户带来丰富而准确的体验。 当然,物体识别在其中起着不可或缺的作用。 由于对前沿技术和算法的不断探索,我们还利用这次比赛来增强团队在对象识别方面的能力。

鉴于本次比赛中数据分布极不均匀,我们增加了少量标签的数据。 在算法框架的选择上,目前的两阶段目标识别算法与一阶段相比在精度上有明显优势,级联RCNN算法是目前各种目标竞赛的热门选择。 然而,级联级联级联也会导致速度降低,并且不适用于实际场景。 考虑到我们平台的实际应用场景,我们选择了速度更快、更经典的RCNN。 接下来是主干。目前,竞争的大量选择往往是更深、更复杂的算法,如ResNeXt101(32x48d)、SENet等,为Fackbook创造了84.5% (Top1)的ImageNet准确率。 但是这种模型有一个共同的特点,它非常庞大,而且它还大大增加了训练和测试的时间。 此外,为了达到更高的准确性,参与者更倾向于训练不同的框架和不同的主干算法,通常是6个或更多,并最终融合它们。 对整体效率和性能的影响也是可以想象的。 竞争是为了更好地提高算法或技术的实际着陆效果。 基于这一初衷,我们只选择了ResNeXt-101(64x4d)和ResNet-152,两个相对更平衡的主干。 在测试阶段,采用内部循环的多尺度测试和结果融合。 此外,我们使用软核模型对两种算法的结果进行融合,得到最终结果

最终,该队以0分的公开成绩和0分的个人成绩赢得了金牌。

极地链技术(Polar Chain Technology)作为全球视频联网-视频业务操作系统的构建者,坚持使用人工智能技术使视频中的信息成为可能,并将互联网信息、服务、购物、社交网络和游戏五种模式联系起来,从而使基于视频的新互联网经济和客户的价值翻倍。 此次谷歌人工智能开放图像-物体检测轨迹竞赛的实践,是极链技术“金眼”系统视频识别物体算法领域的一次优化,也旨在更好地支持视频联网的服务和启用。 未来,极地链将继续探索前沿领域的技术突破,推动人工智能生态系统持续快速发展。 近日,由谷歌主办的2019年谷歌对象挑战赛的结果正式公布,极地链科技人工智能的第一个团队仅剩下两个月就获得了金牌。

去年,在可可女士停止举办物体边界识别竞赛后,谷歌发布了第一次物体识别竞赛,有400多名研究人员和机器学习研究人员参加。 今年,谷歌作为ICCV工作室之一,推出了基于开放图像V5数据集的第二次对象竞争,测试集与第一次完全相同。

连续两年,作为计算机视觉领域“黄金标准”的谷歌开放图像-物体检测跟踪棒COCO物体识别竞赛吸引了大量团队参与,以获得开放图像数据集上最低的错误率。今年,它还吸引了560多个团队。 同时,深度学习技术的突破使图像识别任务取得了显着进展,甚至超过了人类的精度。

随着深层网络解决方案变得越来越深入和复杂,它们通常会受到可用培训数据量的限制 考虑到这一点,为了刺激图像分析和理解的进展,谷歌已经公开发布了开放图像数据集。 开放图像(Open Images)遵循PASCAL VOC、ImageNet和COCO的传统,现已达到前所未有的规模。

物体识别作为计算机视觉的一个热门分支,有着广泛的应用场景,从已经非常成熟的车牌识别和行人检测,到近年来新兴的无人驾驶所需要的各种目标识别。 随着需求的增加,人们对识别精度的要求也在不断提高。 在2018年ECCV开放图像研讨会上,谷歌团队解释了开放图像对象识别竞赛与其他类似竞赛的区别和挑战,即数据量大、标签类型多、数据分布不均、提供标签依赖信息和数据标签不完整 与COCO相比,这个数据集的多样性要大得多,对最先进的实例识别方法提出了更大的挑战。 基于这一数据集,谷歌呼吁全球计算机视觉领域的科学精英共同参与,朝着更复杂的地标检测计算机视觉模型迈出一大步。 这也是迄今为止最大和最详细的公共数据。

作为极地链中的明星平台之一,“金眼”通过对物体、场景等各种维度的识别,给用户带来丰富而准确的体验。 当然,物体识别在其中起着不可或缺的作用。 由于对前沿技术和算法的不断探索,我们还利用这次比赛来增强团队在对象识别方面的能力。

鉴于本次比赛中数据分布极不均匀,我们增加了少量标签的数据。 在算法框架的选择上,目前的两阶段目标识别算法与一阶段相比在精度上有明显优势,级联RCNN算法是目前各种目标竞赛的热门选择。 然而,级联级联级联也会导致速度降低,并且不适用于实际场景。 考虑到我们平台的实际应用场景,我们选择了速度更快、更经典的RCNN。 接下来是主干。目前,竞争的大量选择往往是更深、更复杂的算法,如ResNeXt101(32x48d)、SENet等,为Fackbook创造了84.5% (Top1)的ImageNet准确率。 但是这种模型有一个共同的特点,它非常庞大,而且它还大大增加了训练和测试的时间。 此外,为了达到更高的准确性,参与者更倾向于训练不同的框架和不同的主干算法,通常是6个或更多,并最终融合它们。 对整体效率和性能的影响也是可以想象的。 竞争是为了更好地提高算法或技术的实际着陆效果。 基于这一初衷,我们只选择了ResNeXt-101(64x4d)和ResNet-152,两个相对更平衡的主干。 在测试阶段,采用内部循环的多尺度测试和结果融合。 此外,我们使用软核模型对两种算法的结果进行融合,得到最终结果

最终,该队以0分的公开成绩和0分的个人成绩赢得了金牌。

极地链技术(Polar Chain Technology)作为全球视频联网-视频业务操作系统的构建者,坚持使用人工智能技术使视频中的信息成为可能,并将互联网信息、服务、购物、社交网络和游戏五种模式联系起来,从而使基于视频的新互联网经济和客户的价值翻倍。 此次谷歌人工智能开放图像-物体检测轨迹竞赛的实践,是极链技术“金眼”系统视频识别物体算法领域的一次优化,也旨在更好地支持视频联网的服务和启用。 未来,极地链将继续探索前沿领域的技术突破,推动人工智能生态系统持续快速发展。