Metaphor

标签: multimodal

此标签下有5条笔记。

  • 2026年4月30日

    多模态学习

    • multimodal
    • vision-language
    • deep-learning
    • clip
    • llm
  • 2026年4月30日

    CLIP:对比语言-图像预训练

    • clip
    • multimodal
    • contrastive-learning
    • vision-language
    • zero-shot
  • 2026年4月30日

    LLaVA:大型多模态模型

    • llava
    • multimodal
    • vision-language
    • instruction-tuning
    • llm
  • 2026年4月30日

    多模态模型综述

    • multimodal
    • gpt-4v
    • gemini
    • vision-language
    • survey
  • 2026年4月30日

    视觉-语言预训练

    • vision-language
    • pretraining
    • multimodal
    • vlp
    • blip

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community