Anna4242 (D)

spaces 1

Multitool

📈

models 25

datasets 22

Anna4242/td-env

Viewer • Updated May 3 • 7.68M • 26

Anna4242/grpo-training-plots

Viewer • Updated Nov 29, 2025 • 1.41k • 14

Anna4242/tool-n1-combined-3-6-9-hop-corrected

Viewer • Updated Nov 10, 2025 • 8.12k • 10

Anna4242/TritonBench_G_v1

Viewer • Updated Nov 8, 2025 • 184 • 26

Anna4242/TritonBench_T_v1

Viewer • Updated Nov 8, 2025 • 166 • 14

Anna4242/toucan-multiturn-output

Viewer • Updated Nov 4, 2025 • 20 • 5

Anna4242/bfcl-v4-memory-verifiers-new

Preview • Updated Oct 29, 2025 • 6 • 1

Anna4242/tool-n1-sft-combined-standardized

Viewer • Updated Sep 18, 2025 • 321k • 26

Anna4242/tool-n1-sft-dataset-original-backup

Viewer • Updated Sep 18, 2025 • 5.5k • 9

Anna4242/tool-n1-sft-unique-splits

Viewer • Updated Sep 16, 2025 • 8.11k • 12

View 22 datasets

D

AI & ML interests

Organizations

spaces 1

Multitool

models 25

Anna4242/qwen25-7b-multihop-grpo-checkpoint-200

Anna4242/qwen25-7b-singlehop-grpo-checkpoint-200

Anna4242/qwen25-3b-instruct-grpo-merged

Anna4242/qwen25-3b-base-grpo

Anna4242/qwen25-7b-full-sft-multihop

Anna4242/qwen25-3b-full-sft-multihop

Anna4242/qwen25-7b-sft-grpo-checkpoint-200

Anna4242/qwen25-3b-original-sft-ep1-grpo-checkpoint-200

Anna4242/Qwen2.5-7B-Instruct-onlyrl-step-1000

Anna4242/Qwen2.5-7B-Instruct-Singlehop-SFT

datasets 22

Anna4242/td-env

Anna4242/grpo-training-plots

Anna4242/tool-n1-combined-3-6-9-hop-corrected

Anna4242/TritonBench_G_v1

Anna4242/TritonBench_T_v1

Anna4242/toucan-multiturn-output

Anna4242/bfcl-v4-memory-verifiers-new

Anna4242/tool-n1-sft-combined-standardized

Anna4242/tool-n1-sft-dataset-original-backup

Anna4242/tool-n1-sft-unique-splits

D

AI & ML interests

Organizations

spaces 1

Multitool

models 25 Sort: Recently updated

datasets 22 Sort: Recently updated

models 25

datasets 22