2009年,斯坦福大学李飞飞教授带领团队发布ImageNet数据集,包含超过1400万张由人工标注的图像,涵盖21,841个类别。更重要的是,她组织了ImageNet大规模视觉识别挑战赛(ILSVRC),每年公开评测各方算法。这个数据集和竞赛成为深度学习时代最重要的催化剂——有了共同的测试标准,算法的进步变得清晰可测量,而巨量标注数据也让深层神经网络第一次真正有饭可吃。
【为什么重要?】
ImageNet解决了深度学习最缺乏的东西:大规模高质量标注数据和统一评测基准。没有ImageNet,AlexNet的革命可能推迟很多年。
【逻辑闭环】
解决了什么:提供了大规模有监督学习数据和客观评测标准,让研究者能横向比较算法优劣。局限是什么:ImageNet只有静态图像,无视频、音频、语言,标注成本极高,且仍需人类大量手工劳动。这些局限推动了后来自监督学习(无需人工标注)、弱监督学习和多模态数据集的发展——如果获取数据总要人工标注,AI将永远受限于人类注意力。
觉得有用?点个赞