Real-ESRGAN:腾讯推出的开源图像分辨率提升模型
Real-ESRGAN(Real-World Blind Super-Resolution with Pure Synthetic Data)是由腾讯的研究团队推出的一个深度学习模型,专门用于处理和提升低分辨率图像到...
DDColor - 阿里推出的AI图像上色框架,将黑白图片变彩色
DDColor是阿里达摩院的研究人员推出的一个开源的AI图像着色框架,可以一键将黑白图片上色变为全彩图像。该方法通过使用双解码器架构(像素解码器和颜色解码器...
Screenshot to Code - AI将截图转换为网页代码的开源项目
Sscreenshot to Code是一个开源的项目,利用人工智能技术(GPT-4V 和 DALL·E 3)将用户的屏幕截图转换为前端网页代码。项目的核心功能是自动化网页设计的编码...
VideoCrafter2 - 腾讯推出的高质量视频生成模型
VideoCrafter2是一个由腾讯AI实验室开发的视频生成模型,旨在克服高质量视频数据获取的局限性,训练出能够生成高质量视频的模型。该模型的核心思想是将视频的...
InstantID - 高保真的个性化图像合成框架
InstantID是一种基于扩散模型的图像生成技术,它专注于实现零次(zero-shot)身份保留(Identity-Preserving)的个性化图像合成。这项技术允许用户仅使用一张...
AnyText - 阿里开源的视觉图像文字生成和编辑模型
AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素...
Motionshop - 阿里推出的AI角色动画项目,可替换视频人物为3D
Motionshop是阿里巴巴智能计算研究院推出的一个AI角色动画框架,可将视频中的人物角色替换为3D化身,同时不改变视频中的其他场景和人物。该框架利用视频处理...
MagicVideo-V2:字节跳动推出的AI视频生成模型
MagicVideo-V2 是字节跳动公司团队开发的一款AI视频生成模型,通过将文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块集成到一个端到端的视频...
I2VGen-XL:阿里推出的图像到视频生成模型
I2VGen-XL 是阿里巴巴达摩院推出的一款开源的图像到视频的生成模型,通过创新的级联扩散方法,将文本视频数据与视频结构解耦,同时利用静态图像作为关键指导...
FaceChain - 阿里推出的人物写真和个人形象生成框架
FaceChain是阿里巴巴达摩院推出的一个开源的人物写真和个人数字形象的AI生成框架(类似于免费开源版的妙鸭相机),用户仅需要提供最少一张照片即可生成独属于...