#英伟达最新视觉压缩工具#英伟达最近发布了新的视觉压缩工具——Cosmos Tokenizer,它能帮助我们在保持图像和视频高质量效果的同时实现显著的压缩率。(视频1)尤其是对于需要处理大量视觉数据的企业和研究机构来说,有了它,AI模型训练和视频流媒体处理的效率都可以大大提升了。这款工具的特点在于它采用了统一的架构来处理图像和视频,而且支持连续型和离散型多种压缩方式。与现有技术相比,它的处理速度上提升了2-12倍,同时还保持了更小的模型体积(图2)。在实际测试中,Cosmos Tokenizer能够处理长达8-10秒的1080p高清视频,在各项基准测试中都优于现有方案。而且在视频质量评估上,它比现有技术提升了4分贝的峰值信噪比(PSNR),可以生成更清晰的画面效果。(图3)为了全面评估工具的效果,研究团队还特别整理了一个叫做TokenBench的测试数据集,涵盖了从自动驾驶到机器人操作等多个领域的视频内容。测试结果显示,在各种场景下,Cosmos Tokenizer都能保持出色的压缩效果和视觉质量。Cosmos Tokenizer的源代码和预训练模型也已经公开,感兴趣的朋友可以查看更多介绍。更多介绍:代码:暂时无法在飞书文档外展示此内容