全球快讯:最大CLIP!LAION发布CLIP的扩增定律
2022-12-23 00:11:01


(资料图片仅供参考)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

全球快讯:最大CLIP!LAION发布CLIP的扩增定律

2022-12-23

南卫股份最新公告:控股股东李平拟减持不超过6%|全球新要闻

2022-12-22

《阿凡达2:水之道》国内票房突破5亿:40亿预期已无可能 世界热推荐

2022-12-22

环球视点!胡润研究院:外商投资百强企业去年中国区销售额共7.6万亿元

2022-12-21

合兴股份(605005)12月21日主力资金净卖出254.43万元|世界看点

2022-12-21

华盛昌:公司正在积极推进血氧仪产品的国内医疗注册认证相关事宜

2022-12-21

基于.NetCore开发博客项目 StarBlog - (21) 开始开发RESTFul接口

2022-12-20

【世界聚看点】爱柯迪董秘回复:公司将根据实际情况及发展战略,积极开拓市场,不断增强获取新老客户订单、提升市场份额的能力

2022-12-20

当前短讯!工银瑞信中证创新药产业ETF净值下跌3.90% 请保持关注

2022-12-20

安博通: 股东集中竞价减持数量过半暨减持进展公告_观速讯

2022-12-19

全球今亮点!白猫贷网贷逾期2个月多久上征信系统

2022-12-19

天天快播:交通运输部要求全面恢复道路客运服务

2022-12-19

招联好期贷逾期12天会上征信吗

2022-12-18

全球头条:赵樱子回应红毯“假晕事件”:已连续工作超四十个小时,体力不支

2022-12-17

环球看点!新版1000元人民币图片 「中央银行关金2000元纸币」

2022-12-17

当前热讯:环球信贷集团(01669)向繁景授出两项总金额为733.30万港元的有抵押贷款

2022-12-16

外媒:英欧央行均加息50个基点 称很可能还会有更多加息_天天即时看

2022-12-16

买房贷款利率上浮多少 「买房利率上浮有多少」

2022-12-16

郎酒t8多少钱一瓶 「郎牌特曲t8有38度的吗」 当前信息

2022-12-15

年内A股市场披露158起重大重组计划

2022-12-15