18 4 10

Weijie Xu

weijiejailbreak

AI & ML interests

None yet

Recent Activity

liked a model 1 day ago

skdrx/gemma2-2b-it-falsereject

liked a dataset 1 day ago

Locutusque/FalseReject-sharegpt

new activity 2 days ago

AmazonScience/FalseReject:Update README.md

View all activity

Organizations

None yet

liked a model 1 day ago

skdrx/gemma2-2b-it-falsereject

3B • Updated 3 days ago • 7 • 1

liked a dataset 1 day ago

Locutusque/FalseReject-sharegpt

Viewer • Updated 23 days ago • 14.6k • 95 • 1

New activity in AmazonScience/FalseReject 2 days ago

Update README.md

#3 opened 2 days ago by

weijiejailbreak

liked 4 datasets 6 days ago

New activity in openai/gpt-oss-120b 9 days ago

gpt-oss is actually good. even on less common benchmark

🤝 👍 5

#109 opened 9 days ago by

weijiejailbreak

liked a dataset 16 days ago

weijiejailbreak/r1-1776-jailbreak

Viewer • Updated Mar 17 • 36 • 79 • 5

liked a dataset 28 days ago

sata-bench/sata-bench

Viewer • Updated Jun 3 • 1.6k • 151 • 7

upvoted 3 papers about 1 month ago

LOOM-Scope: a comprehensive and efficient LOng-cOntext Model evaluation framework

Paper • 2507.04723 • Published Jul 7 • 10

AutoTriton: Automatic Triton Programming with Reinforcement Learning in LLMs

Paper • 2507.05687 • Published Jul 8 • 26

FalseReject: A Resource for Improving Contextual Safety and Mitigating Over-Refusals in LLMs via Structured Reasoning

Paper • 2505.08054 • Published May 12 • 2

updated a collection about 2 months ago

Group_Bias_Eval_LLM

Collection

Generated Questions for group fairness evaluation • 2 items • Updated Jun 23

updated 2 datasets about 2 months ago

weijiejailbreak/bias_eval_advice_format

Viewer • Updated Jun 23 • 216 • 36 • 1

weijiejailbreak/bias_eval_suggestion_format

Viewer • Updated Jun 23 • 419 • 33 • 1

updated a collection 2 months ago

Group_Bias_Eval_LLM

Collection

Generated Questions for group fairness evaluation • 2 items • Updated Jun 23

published 2 datasets 2 months ago

weijiejailbreak/bias_eval_suggestion_format

Viewer • Updated Jun 23 • 419 • 33 • 1

weijiejailbreak/bias_eval_advice_format

Viewer • Updated Jun 23 • 216 • 36 • 1

liked a dataset 2 months ago

nvidia/Nemotron-Personas

Viewer • Updated Jun 9 • 100k • 15.3k • 170

Weijie Xu

AI & ML interests

Recent Activity

Organizations

weijiejailbreak's activity

Update README.md

gpt-oss is actually good. even on less common benchmark