D4wn
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
  •   
  •   

EALGE-3 解读

EAGLE-3 改变了训练范式,移除了特征约束,进而增强了表达能力,推理速度进一步提升。
2026-03-10
AI
#Speculative Decoding

EAGLE-2 解读

EAGLE-2 在 EAGLE-1 的基础上引入了Contex-Aware Draft Token Tree,可以实时调整树的形状。
2026-03-10
AI
#Speculative Decoding

EAGLE-1 解读

Speculative Decoding 领域的 Sota 工作之一:EAGLE解读。
2026-03-10
AI
#Speculative Decoding

Qwen3.5 解读—Gated Delta Networks

Qwen3.5 引入了一种基于 Delta Rule 的门控线性注意力机制来解决长序列面临的复杂度问题。
2026-03-09
AI
#LLM

Linux 如何多线程下载

使用Aria2进行简单的服务器多进程下载。
2026-03-08
Techs
#Linux 使用

Bad News 灵隐寺的十八籽断了

睡了一觉发现25年在杭州灵隐寺求的十八籽断了,owo 好意外。
2026-03-07
生活
#生活

Hello My New Blog

时隔两年,重启博客!
2026-03-05
#照片
123…10

搜索

Github 联系我
载入天数... 载入时分秒...
总访问量 次 总访客数 人
本网站由 提供CDN加速/云存储服务