用50张图训练,就能识别高仿山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军

日期:2023-02-17 16:10:20 / 人气:78

阿里AI最近拿到了一个“世界第一”:计算机视觉范畴顶会ECCV 2020 VIPriors应战赛分类赛道冠军。仅用50张图片训练,然后辨认特定类别的物体,阿里平安团队的算法击败了一切参赛对手。阿里的高效分类AI模型,可以处理戴口罩的人脸辨认成绩;还可以打假,辨认批发市场的高仿山寨货。训练数据50张图,可谓最难分类算法应战ECCV 2020 VIPriors应战赛最困难的一点,是1000个数据类别中,每个类别仅有50张图片作爲训练数据。参赛者的模型,必需能在这种训练数据极少的状况下,完成关于目的高精度辨认分类。翻开凤凰旧事,检查更多高清图片这样的难度,关于传统的AI模型来讲,简直是不能够的义务。由于它们普遍需求海量带标签训练数据作爲基石,才干保证AI模型的效果。但是数据的搜集和标注需求昂贵的人力本钱,需求从不同的角度、光照条件和地位拍摄、搜集几千甚至上万张图片并停止标注。依据招聘平台信息,北京地域,数据标注师的月薪普遍在5000-8000,无数据采集技艺的标注师月薪往往超越10000。而数据标注师的培训解说岗,工资则超越2万。ECCV 2020 VIPriors应战赛的初衷,就是鼓舞探究可以高效学习的AI神经网络,降低神经网络训练进程中的人力标注本钱和计算资源耗费,运用极少的训练数据,一块GPU也可以完成。在分类赛道上,竞赛数据基于ImageNet抽取,1000个类别,每个类别仅运用50张图像,训练集共5w张图片,规模仅爲Imagenet的1/26。竞赛规则模型只能train from scratch,不能运用额定的训练数据,不能运用预训练模型,不能运用迁移学习,排名以测试集上的Top-1 Accuracy爲准。戴口罩辨认+AI批发打假在竞赛中,面对50张训练图片的苛刻要求,阿里平安图灵实验室的智能算法团队从三个技术方向停止了打破:应用随机抽取的两张训练图像,运用数据加强并停止拼接,最大水平丰厚训练样本资源;设计共同的神经网络构造,参加明显性特征模块发掘样本的特点,提升分类功能;应用分层语义构造,让AI模型更好地发掘数据,完成更好的学习效果。这三点创新办法,同时与自监视无效结合,在学习更好的数据表征根底上,指点模型高效学习,取得更好的辨认才能。取得了冠军,这项高效AI方案有什麼实践使用呢?阿里平安图灵实验室资深算法专家薛晖引见,疫情时期,突发口罩佩戴成绩使得少量人脸门禁生效,很多小区需求摘下口罩刷脸,带来不用要的安康风险。而高效AI分类技术的使用大大降低了模型初始化的数据需求量,协助疾速训练好模型,处理了戴口罩的人脸辨认成绩。此外,这项AI技术还能用于打假,辨认山寨仿冒商品,并且曾经投入运用。关于批发场景,无论是线上还是线下,关于刚刚上新的某种商品,往往是样本数量较少,预训练义务和目的义务存在差别,预训练模型能够损害目的义务的精确率。而高效AI方案恰恰可以处理上述成绩。以某知名品牌运动鞋上新爲例,一段工夫内仅能取得该商品不同的配色以及商品几个不同角度的图片。在仅有大批商品展现图的状况下,经过高效AI方案,在新商品问世的极短工夫内就能完成新款商品辨认才能的掩盖,降低新商品被山寨和冒充的风险关于在网上购物的你我来说,这项技术使消费者大大降低了碰到真假难辨的高仿货几率。不必消费者本人入手部署算法去辨认商品,阿里平安的高效AI方案在平台端部署,在商品陈列阶段就尽量保证真品,防止呈现鱼龙混杂的状况。除了批发打假,在其他辨认类别多、每个类别样本数量很少的场景,比方知识产权商标辨认、通用商品辨认和动动物维护等等,阿里的高效AI方案都有用武之地。目前高效AI方案对内已使用到了阿里多个业务场景,如淘宝视频、淘宝直播、优酷等平台的知识产权维护,爲数字基建的平安建立提供样本参考,对外则经过绿网间接效劳大中小公司。阿里平安图灵实验室阿里平安图灵实验室是阿里巴巴从事平安范畴机器学习研发的顶级团队,专注于 CV、NLP 及 ML 范畴,团队所研发的 AI 技术被普遍用于阿里巴巴经济体的全球业务网络平安、数据平安、知识产权、新批发平安以及风控反作弊等业务场景。往年分类赛道共有来自全球的56位选手参与,最终,阿阿里平安的高效AI分类技术逾越三星、同济大学等国际外多支队伍的同类技术,勇夺冠军。“A visual inductive priors framework for data-efficient image classification”也曾经被ECCV 2020 Workshop VIPriors接纳。

作者:虚拟币彩票官网




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 虚拟币彩票官网 版权所有