Vision & Language Pretrained Model 总结2024.4.21: 添加CoCa, 并修改对WPA的描述. 2024.4.23: 增加了BLIP-2的部分描述. Vision & Language Pretraining 总结本文只是以总结的形式梳理了近期比较有代表性的VL2023-07-18 深度学习MM VLP