AgentCPT

university

https://chaoscodes.github.io/

AI & ML interests

None defined yet.

Recent Activity

chaoscodes updated a model 3 days ago

AgentCPT/Qwen3-4B_thinking_agent_sft_nemotron_tool_calling_v2_lr1e-5_epoch_1_ctx_16384_bs_256

chaoscodes published a model 3 days ago

AgentCPT/Qwen3-4B_thinking_agent_sft_nemotron_tool_calling_v2_lr1e-5_epoch_1_ctx_16384_bs_256

chaoscodes updated a model 7 days ago

AgentCPT/qwen-8b-agent-sft

View all activity

chaoscodes

updated a model 3 days ago

AgentCPT/Qwen3-4B_thinking_agent_sft_nemotron_tool_calling_v2_lr1e-5_epoch_1_ctx_16384_bs_256

4B • Updated 3 days ago • 8

chaoscodes

published a model 3 days ago

AgentCPT/Qwen3-4B_thinking_agent_sft_nemotron_tool_calling_v2_lr1e-5_epoch_1_ctx_16384_bs_256

4B • Updated 3 days ago • 8

chaoscodes

updated 2 models 7 days ago

AgentCPT/qwen-8b-agent-sft

8B • Updated 7 days ago • 6

AgentCPT/qwen-4b-agent-sft

4B • Updated 7 days ago • 5

chaoscodes

published 2 models 7 days ago

AgentCPT/qwen-8b-agent-sft

8B • Updated 7 days ago • 6

AgentCPT/qwen-4b-agent-sft

4B • Updated 7 days ago • 5

zhenting

authored 6 papers over 1 year ago

Quantifying Generalization Complexity for Large Language Models

Paper • 2410.01769 • Published Oct 2, 2024 • 13

QTSumm: A New Benchmark for Query-Focused Table Summarization

Paper • 2305.14303 • Published May 23, 2023

FOLIO: Natural Language Reasoning with First-Order Logic

Paper • 2209.00840 • Published Sep 2, 2022

Weakly Supervised Two-Stage Training Scheme for Deep Video Fight Detection Model

Paper • 2209.11477 • Published Sep 23, 2022

ReasTAP: Injecting Table Reasoning Skills During Pre-training via Synthetic Reasoning Examples

Paper • 2210.12374 • Published Oct 22, 2022

Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers

Paper • 2408.06195 • Published Aug 12, 2024 • 73

chaoscodes

authored a paper about 2 years ago

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4, 2024 • 95