您好,非常棒的文章,也非常感谢您的及时开源。对论文中的一些细节有些疑问想请教下作者: 1. 如图2(c)所示,预测y坐标时需要x的输出作为输入的一部分,这里的Sequence Predictor是自回归吗? 若是自回归的话,其与DETR等模型非自回归的生成对比速度是否会降低很多呢? 2. 图2(c)中的位姿估计任务是接在在目标检测后面做的吗?若不是的话,DETR是否也能既做目标检测也能位姿估计呢? 3. 理解的不到位地方请您海涵,期待您的解惑。