最近,Meta开源了Sapiens模型,专门用于处理人体视觉任务

最近,Meta开源了Sapiens模型,专门用于处理人体视觉任务
2024年08月26日 09:26 量子位
#Meta开源人体视觉模型#最近,Meta开源了Sapiens模型,专门用于处理人体视觉任务。在展示的视频中,依次展示了四项任务:人体2D姿态估计、身体部位分割、深度估计和表面法线预测。相信大家对面三项任务都很熟悉,而第四项法线图(Normal图),它的每个像素包含表面法线的三个分量,这些分量代表了表面在该点的方向。通过法线图,模型能够模拟光照和阴影效果,使得纹理的细节更加真实和立体。另外,Sapiens通过自监督预训练,并在超过3亿张自然场景中的人体图像上进行微调,使其能够在1024x1024的高分辨率下进行推理。实验结果显示,Sapiens不仅在多个基准测试中超越了现有模型,还展现了卓越的泛化能力,即使在缺少标注数据的情况下,也能提供高精度的输出。感兴趣的小伙伴可以点击以下链接——抱抱脸:GitHub:论文链接:

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部