qingyang zhang's picture

3 12 2

qingyang zhang

qingyangzhang

·

https://qingyangzhang.github.io

AI & ML interests

LLM Reasoning

Recent Activity

authored a paper about 2 months ago

P1: Mastering Physics Olympiads with Reinforcement Learning

upvoted a paper about 2 months ago

P1: Mastering Physics Olympiads with Reinforcement Learning

authored a paper 3 months ago

Provable Dynamic Fusion for Low-Quality Multimodal Data

View all activity

Organizations

None yet

commented 2 papers 8 months ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published May 18, 2025 • 19 •

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published May 18, 2025 • 19 •