EAGLE-2 解读EAGLE-2 在 EAGLE-1 的基础上引入了Contex-Aware Draft Token Tree,可以实时调整树的形状。 2026-03-10 AI #Speculative Decoding
Qwen3.5 解读—Gated Delta NetworksQwen3.5 引入了一种基于 Delta Rule 的门控线性注意力机制来解决长序列面临的复杂度问题。 2026-03-09 AI #LLM