Eji
「2022 年回头来看,几个高赞答主感觉十分低估 CLIP。不知道关注点怎么就在 zero-shot,大数据集上了。我觉得它涨了多少性能,用的方法多么朴素粗暴,这些完全不重要。我现在感觉 CLIP 是一个远超 best paper 的工作,以前看不出来说明我们水平不行。CLIP 为 CV 研究者打开了一片非常非常广阔的天地,原因在于 CLIP 真的把自然语言级别的抽象概念带到计算机视觉里了。当然肯定有其它类似工作,但 CLIP 跨过了奇点。CLIP 夸大了它在 zero-shot 上的贡献吗?我相信 21 年的一众 paper 刷新了大家以往对于 zero-shot 的认知。"zero shot 效果堪比 ResNet50",这话误导了太多人。」
Eji
Eji
載入新的回覆