Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: long-context
此标签下有10条笔记。
2026年5月12日
LLM推理加速方法综合指南(2025)
llm-inference
inference-optimization
acceleration
kv-cache
quantization
speculative-decoding
long-context
2026年5月12日
LongRoPE:非均匀位置插值的长上下文扩展
longrope
rope
long-context
positional-encoding
context-extension
llm
2026年5月11日
LLM推理优化
llm
inference-optimization
kv-cache
quantization
speculative-decoding
long-context
2026年5月08日
UltraLong-8B:从128K到4M上下文训练
long-context
llm-training
context-extension
nvidia
2026年5月08日
稀疏注意力的Trade-offs:Transformer大语言模型实证研究
sparse-attention
transformer
llm
long-context
efficiency
kv-cache
2026年5月08日
TTT-E2E:端到端测试时训练的长上下文语言建模
ttt
e2e
long-context
test-time-training
meta-learning
sliding-window-attention
2026年5月05日
长上下文视频世界模型
world-models
video-generation
long-context
ssm
video-prediction
2026年5月04日
SAMBA混合注意力状态空间模型
ssm
mamba
hybrid-architecture
language-model
long-context
2026年5月03日
视频扩散世界模型
world-models
video-diffusion
autoregressive
long-context
2026年5月01日
稀疏注意力与长度外推
attention
sparse-attention
length-extrapolation
transformer
long-context