“图片”的搜索结果
AniPortrait - 腾讯开源的照片对口型视频生成框架
AniPortrait是一个由腾讯开源的照片对口型视频生成框架,类似于此前阿里推出的EMO,能够通过音频和一张参考肖像图片生成高质量的动画。
Stable Video 3D (SV3D) - 多视角合成和3D生成模型,由Stability AI推出
Stable Video 3D(简称SV3D)是由Stability AI公司开发的一项先进的3D技术,能够从单张图片生成高质量的新视角视图和3D网格。该模型在之...
VLOGGER - 谷歌推出的图像到合成人物动态视频的模型
VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主...
DUSt3R - 从任意图像集合中重建3D场景的框架
DUSt3R是由来自芬兰阿尔托大学和Naver欧洲实验室的研究人员推出的一个3D重建框架,旨在简化从任意图像集合中重建三维场景的过程,而无需...
LayerDiffusion - AI生成具有透明度的图像的框架
LayerDiffusion是由来自斯坦福大学的研究人员提出的一种利用大规模预训练的潜在扩散模型生成透明图像的技术,可以帮助用户生成单个透明...
Stable Diffusion 3 - Stability AI推出的新一代图像生成模型
Stable Diffusion 3 是由 Stability AI 开发的一款先进的文本到图像生成模型,是 Stable Diffusion 系列模型的最新迭代,旨在通过文本提...
SDXL-Lightning - 字节跳动推出的文本到图像生成模型
SDXL-Lightning是由字节跳动的研究团队推出的一种基于扩散模型的文本到图像生成技术,旨在解决传统扩散模型在图像生成速度和计算成本上...
VideoPoet - 谷歌推出的AI视频生成模型
VideoPoet是由谷歌的研究团队开发的一种基于大模型的AI视频生成方案,支持从文本、图像或视频输入中合成高质量的视频内容,并生成匹配的...
Vary-toy:开源的小型视觉多模态模型
Vary-toy是一个小型的视觉语言模型(LVLM),由来自旷视、国科大、华中大的研究人员共同提出,旨在解决大型视觉语言模型(LVLMs)在训练...
DemoFusion - 免费开源的图像分辨率超清增强框架
DemoFusion是一个旨在低成本进行高分辨率图像生成的技术框架,通过扩展现有的开源生成人工智能模型(如Stable Diffusion),使得这些模...