AI – Rui's Blog

GraspDiffusion

https://yj7082126.github.io/graspdiffusion/ https://openaccess.thecvf.com/content/WACV2026/html/Kwon_GraspDiffusion_Synthesizing_Realistic_Whole-body_Hand-Object_Interaction_WACV_2026_paper.html WACV 2026; Cited by 9...

HOI-Page

https://craigleili.github.io/projects/hoipage/ https://github.com/craigleili/HOI-PAGE ICML 2026; Cited by 0 Lei Li, Angela Dai; Technical University of Munich Introduction Background 以往的4D生成方法通常将人体和...

InterDreamer

https://sirui-xu.github.io/InterDreamer/ NeurIPS 2024 Cited by 63 Sirui Xu† Ziyin Wang† University of Illinois Urbana-Champaign Introduction Background Text2Motion 技术在大规模运动捕捉数据及对应文本标注上训练的扩...

TeSMo

Introduction Background 同时包含运动、文本描述和交互场景的数据集数量有限，以往的T2M方法仅关注孤立的人物动作而未考虑环境因素 Related Work 先预测根路径，再基于场景和预测路径生成全身运动在3D场景中往往无法避开障碍物...

Motion-Master

Introduction Background 粗糙的小数据集无法捕捉运动细节与语义多样性，即使是大规模数据集上训练的方法也难以泛化至复杂的文本指令，尤其是组合指令现有运动表征无法兼顾局部关节精度和全局轨迹一致性，在大规模训练中会愈发严...

Motion-Streamer

Introduction Background 传统 Diffusion 模型生成质量高，但通常是“非增量”的，即生成视频之前必须预先设定好帧数 AR / GPT 类模型像语言模型一样预测下一个 Token，可以无限生成。但它们通常依赖离散化的非因果 Token（如 VQ-VAE ...

PULSE

Method 1. Motion Imitator 即预训练“运动模仿器”，目标是训练一个能完美复刻人类动作的网络。输入：机器人当前的状态 $s$（各个关节的角度、速度等），以及一段来自 AMASS 数据集的未来参考动作序列 $q^*$（如接下来 0.5s 内真人...

DDPM

参考文献 Transformer DDPM IDDPM DDIM PGCU PGCU 常见生成模型 DDPM 工作原理扩散模型通过定义一个前向过程，将数据逐步添加噪声直至变为纯噪声。然后学习一个反向过程，从纯噪声开始逐步去噪还原数据。反向过...