TCS Xplore Java Coding Questions

FRAMES-VQA: Benchmarking Fine-Tuning Robustness across Multi-Modal Shifts in Visual Question Answering

Abstract: Visual question answering (VQA) systems face significant challenges when adapting to real-world data shifts, especially in multi-modal contexts. While robust fine-tuning strategies are ...

IEEE

Adaptive Momentum Mixture-of-Experts for Continual Visual Question Answering

Multimodal large language models (MLLMs) have attracted considerable attention for their impressive capabilities in understanding and generating visual-language content, particularly in tasks such as ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

FRAMES-VQA: Benchmarking Fine-Tuning Robustness across Multi-Modal Shifts in Visual Question Answering

Adaptive Momentum Mixture-of-Experts for Continual Visual Question Answering

Trending now