Metaphor

标签: vlm

此标签下有7条笔记。

  • 2026年4月30日

    多模态学习索引

    • multimodal
    • vision-language
    • deep-learning
    • clip
    • llm
    • vlm
  • 2026年5月16日

    VLM-3R与指令对齐的3D重建

    • 3d-vision
    • vlm
    • instruction-following
    • reconstruction
  • 2026年5月16日

    商业VLM模型技术分析

    • multimodal
    • vlm
    • gpt-4v
    • gemini
    • claude
    • gemma
    • vision-language
  • 2026年5月16日

    多模态评估基准

    • multimodal-evaluation
    • benchmark
    • vlm
    • vision-language
    • vqa
    • captioning
  • 2026年5月16日

    VLM架构分类体系

    • vlm
    • multimodal
    • vision-language
    • architecture
    • llava
    • minigpt
    • instructblip
  • 2026年5月06日

    VLWM视觉语言世界模型

    • world-models
    • vlm
    • planning
  • 2026年5月06日

    WM-ABench:VLM内部世界模型原子评估

    • world-models
    • vlm
    • evaluation

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community