首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源 - 果核剥壳

5月14日消息,今日,腾讯旗下混元文生图大模型(混元DiT,Diffusion Models with Transformers)宣布全面开源。

目前已在Hugging Face、Github上发布,包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

据媒体报道,腾讯混元文生图负责人卢清林表示,混元DiT开源的价值有两方面。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

一方面这是业内首个中文原生DiT架构,弥补了开源社区的空白,另一方面混元DiT为全面开放,与现网版本完全一致。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

据介绍,此次开源的混元DiT采用了与Sora同样的背后关键技术——DiT架构,还支持256字中文理解,不仅支持文生图,也可作为视频等多模态视觉生成的基础。

腾讯方面表示,为了构建混元DiT设计了Transformer结构、文本编码器和位置编码,构建了完整的数据管道,用于更新和评估数据,为模型优化迭代提供帮助。

为了实现细粒度的文本理解,还训练了多模态大语言模型来优化图像的文本描述。

最终,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

如果您喜欢本站,点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你: 下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件,加群提示为修改者自留,非本站信息,注意鉴别

(3)
上一篇 2024年5月14日 下午3:45
下一篇 2024年5月15日 上午9:34

相关推荐

发表回复

评论问题之前,点击我,能帮你解决大部分问题

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(1条)

  • ikochina
    ikochina 2024年5月15日 下午5:12
    Firefox 127.0 Firefox 127.0 Windows 10 x64 Edition Windows 10 x64 Edition

    这个可以有,就是不知道效果咋样