GraspDiffusion
https://yj7082126.github.io/graspdiffusion/ https://openaccess.thecvf.com/content/WACV2026/html/Kwon_GraspDiffusion_Synthesizing_Realistic_Whole-body_Hand-Object_Interaction_WACV_2026_paper.html WACV 2026; Cited by 9...
https://yj7082126.github.io/graspdiffusion/ https://openaccess.thecvf.com/content/WACV2026/html/Kwon_GraspDiffusion_Synthesizing_Realistic_Whole-body_Hand-Object_Interaction_WACV_2026_paper.html WACV 2026; Cited by 9...
https://craigleili.github.io/projects/hoipage/ https://github.com/craigleili/HOI-PAGE ICML 2026; Cited by 0 Lei Li, Angela Dai; Technical University of Munich Introduction Background 以往的4D生成方法通常将人体和...
https://sirui-xu.github.io/InterDreamer/ NeurIPS 2024 Cited by 63 Sirui Xu† Ziyin Wang† University of Illinois Urbana-Champaign Introduction Background Text2Motion 技术在大规模运动捕捉数据及对应文本标注上训练的扩...
Introduction Background 同时包含运动、文本描述和交互场景的数据集数量有限,以往的T2M方法仅关注孤立的人物动作而未考虑环境因素 Related Work 先预测根路径,再基于场景和预测路径生成全身运动 在3D场景中往往无法避开障碍物...
Introduction Background 粗糙的小数据集无法捕捉运动细节与语义多样性, 即使是大规模数据集上训练的方法也难以泛化至复杂的文本指令,尤其是组合指令 现有运动表征无法兼顾局部关节精度和全局轨迹一致性,在大规模训练中会愈发严...
Introduction Background 传统 Diffusion 模型生成质量高,但通常是“非增量”的,即生成视频之前必须预先设定好帧数 AR / GPT 类模型像语言模型一样预测下一个 Token,可以无限生成。 但它们通常依赖离散化的非因果 Token(如 VQ-VAE ...
Method 1. Motion Imitator 即预训练“运动模仿器”,目标是训练一个能完美复刻人类动作的网络。 输入:机器人当前的状态 $s$(各个关节的角度、速度等),以及一段来自 AMASS 数据集的未来参考动作序列 $q^*$(如接下来 0.5s 内真人...
参考文献 Transformer DDPM IDDPM DDIM PGCU PGCU 常见生成模型 DDPM 工作原理 扩散模型通过定义一个前向过程,将数据逐步添加噪声直至变为纯噪声。 然后学习一个反向过程,从纯噪声开始逐步去噪还原数据。 反向过...