시각 인식

비전 언어 모델(VLMs)의 한계는 어디일까요?

BlindTest를 통해 VLM의 시각적 인식 한계를 밝히는 연구.

0