Metaphor

标签: vision-language-model

此标签下有5条笔记。

  • 2026年5月18日

    N3D-VLM 原生3D定位视觉语言模型

    • multimodal-learning
    • 3d-scene-understanding
    • spatial-reasoning
    • vision-language-model
  • 2026年5月18日

    Emu3 原生多模态统一模型

    • multimodal-learning
    • vision-language-model
    • unified-model
    • autoregressive
  • 2026年5月18日

    Show-o2 统一多模态模型

    • multimodal-learning
    • vision-language-model
    • unified-model
    • flow-matching
  • 2026年5月18日

    Video-3D LLM 场景理解

    • multimodal-learning
    • 3d-scene-understanding
    • video-understanding
    • vision-language-model
  • 2026年5月05日

    C-TTA:连续测试时适应

    • test-time-adaptation
    • vision-language-model
    • continuous-adaptation
    • prototype-updating

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community