D4wn
首页
归档
分类
标签
关于
BLIP2
经典多模态论文,引入了 Q-Former,使用已有的单模态大模型构建多模态模型。
2026-06-02
AI
#Multi Model
BLIP
多模态经典论文,使用了 ITC,ITM,LM 损失。
2026-06-02
AI
#Multi Model
CogVideo
基于自回归的视频生成。
2026-06-02
AI
#Video
T5
一个基于 Encoder-Decoder 的统一NLP框架。
2026-06-02
AI
#Multi Model
Swin Transformer
经典论文阅读—SwinTransformer
2026-06-02
AI
#Others
Hunyuan Video
对混元 Video 的解读。
2026-05-30
AI
#World Model
WAN
Wan论文阅读
2026-05-30
AI
#Video
1
2
3
4
…
21
搜索
×
关键词
博客在允许 JavaScript 运行的环境下浏览效果更佳