TextCraft: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Text
论文原文: https://arxiv.org/abs/2211.01427
其实这个思路不困难,就是整理本身有的东西,本身有的东西包括:
现在想要获得:
想到clip:
所以只需要利用这个共用特征控制生成3d点云,就可以在训练的阶段用“视图和3d模型对”训练,在预测阶段用文字输入生成3d点云。
总体网络图
因篇幅问题不能全部显示,请点此查看更多更全内容