D4wn
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
  •   
  •   

BLIP2

经典多模态论文,引入了 Q-Former,使用已有的单模态大模型构建多模态模型。
2026-06-02
AI
#Multi Model

BLIP

多模态经典论文,使用了 ITC,ITM,LM 损失。
2026-06-02
AI
#Multi Model

CogVideo

基于自回归的视频生成。
2026-06-02
AI
#Video

T5

一个基于 Encoder-Decoder 的统一NLP框架。
2026-06-02
AI
#Multi Model

Swin Transformer

经典论文阅读—SwinTransformer
2026-06-02
AI
#Others

Hunyuan Video

对混元 Video 的解读。
2026-05-30
AI
#World Model

WAN

Wan论文阅读
2026-05-30
AI
#Video
1234…21

搜索

Github 联系我
载入天数... 载入时分秒...
总访问量 次 总访客数 人
本网站由 提供CDN加速/云存储服务