🧪 PhysInOne Benchmark Leaderboard

PhysInOne Benchmark — Visual Physics Learning & Reasoning in One Suite. 来自 vLAR Group / HK PolyU。

参与方式

  1. 你自己的 Hugging Face 上创建一个 dataset(建议 public),按下方约定结构上传你的 scene 级 ZIP。
  2. 在「Submit」标签页填写:展示名 / 任务 / user_dataset(形如 username/repo)。
  3. 系统会把任务排入队列,后台 Worker 逐 scene 异步评测;可在「Queue」标签页看进度。

榜单更新频率较低,请使用每个任务下的「🔄 刷新」按钮主动拉取。

给定历史视频帧,预测未来帧。评测 PSNR / SSIM / LPIPS。

Expected scene layout:

<scene_id>.zip
└── frames/
    ├── 0001.png
    └── ...

预测物体物理属性(质量、摩擦系数等)。评测 MAE(越低越好)。

Expected scene layout:

<scene_id>.zip
└── prediction.json   # {"mass": float, "friction": float, ...}