AI项目与框架
AutoDev - 微软推出的AI编程和程序开发智能体框架
AutoDev是由微软的研究人员推出的一个AI编程和程序开发智能体框架,专门设计用于自主规划和执行复杂的软件工程任务,如代码编写、调试、测试和版本控制等。Au...
Follow-Your-Click - 腾讯等开源的图像到视频模型,可生成局部动画
Follow-Your-Click是一个由来自腾讯公司(混元团队)联合清华大学和香港科技大学的研究人员共同研发的图像到视频(Image-to-Video,简称I2V)生成模型,允许...
ComflowySpace - 免费开源且简单易用的ComfyUI整合工具
ComflowySpace是一款专为简化和增强AI图像及视频生成工具使用体验而设计的开源软件,基于ComfyUI和Stable Diffusion,旨在提供一个更加用户友好和高效的工作...
Pix2Gif - 微软推出的静态图像转动态GIF的扩散模型
Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型,专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散过程来实现图像...
Transformer Debugger - OpenAI开源的理解和分析大模型内部的工具
Transformer Debugger (TDB) 是由 OpenAI 的对齐团队(Superalignment)开发的一款工具,旨在帮助研究人员和开发者更深入地理解和分析 Transformer 模型的内...
ELLA - 腾讯推出的扩散模型适配器,可增强语义对齐
ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的研究人员推出的一种新型方法,旨在提升文本到图像生成模型在处理复杂文本提...
PixArt-Σ - 华为推出的可生成4K高清图像的文生图模型
PixArt-Σ是由来自华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一个基于扩散Transformer架构(DiT)的文生图模型,专门设计用于从文本提示直...
Moondream - 开源的轻量级AI视觉语言模型,可在本地快速运行
Moondream是一个免费开源的小型的人工智能视觉语言模型,虽然参数量小但可以提供高性能的视觉处理能力,可在本地计算机甚至移动设备或 Raspberry Pi 上运行,...
AtomoVideo - 阿里推出的高保真图像到视频生成框架
AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(I2V)生成框架,旨在从输入的静态图像生成高质量的视频内容。该框架能够保持生成视频与给定参...
ResAdapter - 字节推出的扩散模型分辨率适配器
ResAdapter是由字节跳动的研究人员推出的一种为扩散模型(如Stable Diffusion)设计的分辨率适配器,允许这些图像生成模型生成具有任意分辨率和宽高比的图像...