Motion-Master
Introduction Background 粗糙的小数据集无法捕捉运动细节与语义多样性, 即使是大规模数据集上训练的方法也难以泛化至复杂的文本指令,尤其是组合指令 现有运动表征无法兼顾局部关节精度和全局轨迹一致性,在大规模训练中会愈发严...
Introduction Background 粗糙的小数据集无法捕捉运动细节与语义多样性, 即使是大规模数据集上训练的方法也难以泛化至复杂的文本指令,尤其是组合指令 现有运动表征无法兼顾局部关节精度和全局轨迹一致性,在大规模训练中会愈发严...
Introduction Background 传统 Diffusion 模型生成质量高,但通常是“非增量”的,即生成视频之前必须预先设定好帧数 AR / GPT 类模型像语言模型一样预测下一个 Token,可以无限生成。 但它们通常依赖离散化的非因果 Token(如 VQ-VAE ...
Method 1. Motion Imitator 即预训练“运动模仿器”,目标是训练一个能完美复刻人类动作的网络。 输入:机器人当前的状态 $s$(各个关节的角度、速度等),以及一段来自 AMASS 数据集的未来参考动作序列 $q^*$(如接下来 0.5s 内真人...