加入收藏 | 设为首页 | 会员中心 | 我要投稿 南通站长网 (https://www.0513zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

全球超大的公开人脸数据集

发布时间:2021-03-25 16:27:39 所属栏目:外闻 来源:互联网
导读:就是由 芯翌科技 与 清华大学 自动化系智能视觉实验室合作,所推出的 WebFace 260M ,相关研究已被 CVPR 2021 接收。 并且,基于其所清洗的数据集 WebFace42M ,在最具挑战IJBC测试集上,也已经达到了SOTA水平。 而它所带来的全球之最还不止于此。 以这项数

就是由芯翌科技清华大学自动化系智能视觉实验室合作,所推出的 WebFace 260M,相关研究已被CVPR 2021接收。

并且,基于其所清洗的数据集 WebFace42M,在最具挑战IJBC测试集上,也已经达到了SOTA水平。

而它所带来的“全球之最”还不止于此。

以这项数据集为基础,芯翌科技在最新一期的NIST-FRVT榜单上,戴口罩人脸识别评测中斩获世界第一

全球之最的人脸数据集,长什么样?

WebFace260M这个数据集,是完全基于全球互联网公开人脸数据。

它的问世,一举打破了此前人脸数据集的规模:

不仅规模最大,也是首次在人脸ID数目和图片数,分别达到了400万2.6亿的规模。


 

  • 首先,利用名为MS1M的公开数据集训练一个“教师模型”,并对原始WebFace260M进行清洗。
  • 其次,利用一个“学生模型”,在上一步清洗过的图像上进行训练。
  • 最后,让“学生模型”切换为“教师模型”,并进行迭代,直到获得高质量的WebFace42M。

通过这种方式,在对WebFace260M进行清洗操作后,便得到了WebFace42M

据介绍,它是目前全球规模最大、可直接用于训练的干净人脸数据集:

包含200万ID、4200万图片。

关于WebFace260M和WebFace42M的“世界之最”,一张表格的数据对比,便可一目了然:

(编辑:南通站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读