GitHub topics: qwen-vl

Repositories

gokayfem/awesome-vlm-architectures

Famous Vision Language Models and Their Architectures

Language: Markdown - Size: 2.26 MB - Last synced at: 5 days ago - Pushed at: 2 months ago - Stars: 804 - Forks: 42

janelu9/EasyLLM

Running Large Language Model easily.

Language: Python - Size: 220 MB - Last synced at: 7 days ago - Pushed at: 24 days ago - Stars: 8 - Forks: 0

zjysteven/lmms-finetune

A minimal codebase for finetuning large multimodal models, supporting llava-1.5/1.6, llava-interleave, llava-next-video, llava-onevision, llama-3.2-vision, qwen-vl, qwen2-vl, phi3-v etc.

Language: Python - Size: 13 MB - Last synced at: 27 days ago - Pushed at: 2 months ago - Stars: 284 - Forks: 29

reidbarber/webmarker

Mark web pages for use with vision-language models

Language: TypeScript - Size: 677 KB - Last synced at: about 1 month ago - Pushed at: about 1 month ago - Stars: 30 - Forks: 3

autodistill/autodistill-qwen-vl

Qwen-VL base model for use with Autodistill.

Language: Python - Size: 6.84 KB - Last synced at: 3 months ago - Pushed at: about 1 year ago - Stars: 0 - Forks: 0

Related Keywords

qwen-vl 5 llava 2 multimodal 2 vision-language-model 2 awesome 1 large-multimodal-models 1 llava-next 1 multimodal-large-language-models 1 vision-language 1 visual-instruction-tuning 1 claude 1 computer-use 1 computer-using-agent 1 cua 1 gemini 1 gpt4o 1 gpt4v 1 llms 1 operator 1 playwright 1 prompt 1 prompt-engineering 1 set-of-mark 1 som 1 autodistill 1 zero-shot-object-detection 1 awesome-list 1 blip 1 clip 1 cogvlm 1 image-encoder 1 internlm 1 kosmos 1 text-encoder 1 vlm 1 deepseek 1 deepspeed 1 fine-tuning 1 llama 1 megatron-lm 1 npu 1 pretrain 1 qwen 1 finetuning 1 foundation-models 1 instruction-tuning 1 large-language-model 1

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Repos