#ai探索计划# 宝藏开源文生图模型: Stable Diffusion 3 Stability AI 发布了开源文生图模型 Stable Diffusion 3 Medium,在图像质量上有显著提升。1、Stability AI基本信息:成立于2019年,公司创始人兼首席执行官为埃马德·莫斯塔克,总部位于英国伦敦。产品服务:提供人工智能模型产品包括成像、语言、代码和音频等,旗下产品有Stable Diffusion、Stable Diffusion XL、Stable Cascade、Stable Video Diffusion、Stable Audio、Stable Zero123等。企业荣誉:2023年10月,其音频产品被《时代周刊》评为2023年最佳发明之一;同年11月24日,公司入选“首期《财富》全球人工智能创新者50强榜单”。2、Stable Diffusion 3架构与参数:采用先进的多模态扩散变换器(MMD IT)架构,基于DIT框架,支持8亿到80亿个参数等不同规模。性能提升:分辨率可达2048×2048,相比Stable Diffusion 2分辨率提升168%,图像失真降低81%,质量指标提高72%,在排版和提示遵循方面超越DALL-E 3、Midjourney V6和Ideogram V1等。技术创新:使用3个文本编码器,分别是OpenAI的CLIP L/14、OpenCLIP BigG/14、T5-V1.1-XXL;采用整流流采样,能更快速地从噪声生成清晰图像。商业应用:允许商业使用,但需加入会员计划付费使用。#ai创造营#