Nanjing University

university

https://github.com/pzy2000

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

yifanzhang114 submitted a paper about 6 hours ago

OmniVideo-100K: A Dataset for Audio-Visual Reasoning through Structured Scripts and Evidence Chains

zgzaacm submitted a paper 3 days ago

HYDRA-X: Native Unified Multimodal Models with Holistic Visual Tokenizers

BradyFU submitted a paper about 2 months ago

PersonaVLM: Long-Term Personalized Multimodal LLMs

View all activity

Papers

OmniVideo-100K: A Dataset for Audio-Visual Reasoning through Structured Scripts and Evidence Chains

HYDRA-X: Native Unified Multimodal Models with Holistic Visual Tokenizers

View all Papers

NJU 's papers 5

Submitted by

Yi-Fan Zhang

OmniVideo-100K: A Dataset for Audio-Visual Reasoning through Structured Scripts and Evidence Chains

NJU

Nanjing University

Submitted by

Guozhen Zhang

HYDRA-X: Native Unified Multimodal Models with Holistic Visual Tokenizers

NJU

Nanjing University

Submitted by

Chaoyou Fu

PersonaVLM: Long-Term Personalized Multimodal LLMs

NJU

Nanjing University

Submitted by

Chen Yang

Flowing Backwards: Improving Normalizing Flows via Reverse Representation Alignment

NJU

Nanjing University

Submitted by

wangshuai

UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions

NJU

Nanjing University