您的位置:首页 >企业 >

今日热搜:最大CLIP!LAION发布CLIP的扩增定律

2022-12-23 12:01:10    来源:


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

关键词:

相关阅读

精彩放送

行动教育董秘回复:截至2022年12月20日,公司的股东人数为6,093户

天天百事通!青海西宁:多区对特殊群体送“健康防疫礼包”,开通“就医通道”

百事通!龙磁科技(300835)12月20日主力资金净卖出1372.90万元

沃特股份:公司部分产品可用于医疗行业。目前相关占比较低|通讯

焦点观察:电气风电: 全资子公司公开转让风电项目公司股权的进展公告

全球速读:辽宁vs天津大名单:郭艾伦继续缺阵 天津仅8人报名

漩涡中的快钱:POS机费率引不满 押金套现问题何解

工行信阳分行成功发放首笔“保交楼”配套融资4000万元_动态

沃特股份:公司部分产品可用于医疗行业。目前相关占比较低|通讯

焦点观察:电气风电: 全资子公司公开转让风电项目公司股权的进展公告

全球速读:辽宁vs天津大名单:郭艾伦继续缺阵 天津仅8人报名

漩涡中的快钱:POS机费率引不满 押金套现问题何解

工行信阳分行成功发放首笔“保交楼”配套融资4000万元_动态

农民工在工地死亡赔偿包括哪些方面?

环球视讯!广东新增本土确诊病例24例、本土无症状感染者13例

环球聚焦:预订一空!年夜饭上新!厨师还能上门烹饪 你感兴趣吗?

环球要闻:中科信息(300678)12月16日主力资金净卖出969.75万元

新中港董秘回复:公司没有发生过因环保超标接受处罚的情况