Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2412.15115

AI Paper of the Day

A collection of papers that I think are interesting, one added each day

about 20 hours ago

Can Large Language Models Understand Context?

Paper • 2402.00858 • Published Feb 1, 2024 • 24
OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1, 2024 • 85
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 152
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity

Paper • 2401.17072 • Published Jan 30, 2024 • 25

2026 - Reading AI Research Papers with Ajinkya

Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

Paper • 2511.22699 • Published Nov 27, 2025 • 239
A Survey on Diffusion Language Models

Paper • 2508.10875 • Published Aug 14, 2025 • 34
Scalable Diffusion Models with Transformers

Paper • 2212.09748 • Published Dec 19, 2022 • 18
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Paper • 2403.03206 • Published Mar 5, 2024 • 71

Reverse-Engineered Reasoning for Open-Ended Generation

Paper • 2509.06160 • Published Sep 7, 2025 • 149
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377

Qwen Technical Report

Paper • 2309.16609 • Published Sep 28, 2023 • 38
Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26, 2025 • 72
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 153

A very long nameA very long nameA very long nameA very long

A very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very

nvidia/OpenMathReasoning

Viewer • Updated May 27, 2025 • 5.68M • 14.3k • 447
zwhe99/DeepMath-103K

Viewer • Updated May 29, 2025 • 103k • 6k • 353
microsoft/bitnet-b1.58-2B-4T

Text Generation • Updated Dec 17, 2025 • 15.9k • 1.31k
Running

Featured

843

Qwen3 Demo

📊

843

Chat with AI and see its reasoning

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377

Language Models - Essential Research Papers

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 115
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 19
LLaMA: Open and Efficient Foundation Language Models

Paper • 2302.13971 • Published Feb 27, 2023 • 21
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 250

text-generation

KurniaKadir/hrmy

Text Generation • Updated Aug 14, 2025
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377
Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems

Paper • 2504.01990 • Published Mar 31, 2025 • 303

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27, 2024 • 627
meta-llama/Llama-4-Scout-17B-16E-Instruct

Image-Text-to-Text • Updated May 22, 2025 • 202k • • 1.23k
keras-io/GauGAN-Image-generation

Updated Jul 5, 2024 • 15 • 5

AI Paper of the Day

A collection of papers that I think are interesting, one added each day

about 20 hours ago

Can Large Language Models Understand Context?

Paper • 2402.00858 • Published Feb 1, 2024 • 24
OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1, 2024 • 85
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 152
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity

Paper • 2401.17072 • Published Jan 30, 2024 • 25

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377

2026 - Reading AI Research Papers with Ajinkya

Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

Paper • 2511.22699 • Published Nov 27, 2025 • 239
A Survey on Diffusion Language Models

Paper • 2508.10875 • Published Aug 14, 2025 • 34
Scalable Diffusion Models with Transformers

Paper • 2212.09748 • Published Dec 19, 2022 • 18
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Paper • 2403.03206 • Published Mar 5, 2024 • 71

Language Models - Essential Research Papers

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 115
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 19
LLaMA: Open and Efficient Foundation Language Models

Paper • 2302.13971 • Published Feb 27, 2023 • 21
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 250

Reverse-Engineered Reasoning for Open-Ended Generation

Paper • 2509.06160 • Published Sep 7, 2025 • 149
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377

text-generation

KurniaKadir/hrmy

Text Generation • Updated Aug 14, 2025
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377
Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems

Paper • 2504.01990 • Published Mar 31, 2025 • 303

Qwen Technical Report

Paper • 2309.16609 • Published Sep 28, 2023 • 38
Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26, 2025 • 72
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 153

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377

A very long nameA very long nameA very long nameA very long

A very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very long nameA very

nvidia/OpenMathReasoning

Viewer • Updated May 27, 2025 • 5.68M • 14.3k • 447
zwhe99/DeepMath-103K

Viewer • Updated May 29, 2025 • 103k • 6k • 353
microsoft/bitnet-b1.58-2B-4T

Text Generation • Updated Dec 17, 2025 • 15.9k • 1.31k
Running

Featured

843

Qwen3 Demo

📊

843

Chat with AI and see its reasoning

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 377
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27, 2024 • 627
meta-llama/Llama-4-Scout-17B-16E-Instruct

Image-Text-to-Text • Updated May 22, 2025 • 202k • • 1.23k
keras-io/GauGAN-Image-generation

Updated Jul 5, 2024 • 15 • 5

Previous
1
2
3
...
7
Next

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs