AI基础设施初创公司Lumino获280万美元Pre-seed轮融资
总部位于美国加利福尼亚州旧金山的人工智能训练云平台基础设施初创公司 Lumino 宣布在Pre-seed轮融资中筹集了280万美元。投资者包括 Longhash Ventures、Ince...
Stable Video 3D (SV3D) - 多视角合成和3D生成模型,由Stability AI推出
Stable Video 3D(简称SV3D)是由Stability AI公司开发的一项先进的3D技术,能够从单张图片生成高质量的新视角视图和3D网格。该模型在之前发布的Stable Video...
VLOGGER - 谷歌推出的图像到合成人物动态视频的模型
VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主要功能在于使用人工智...
Open-Sora - 开源的类Sora架构的视频生成模型和复现方案
Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规模图像预训练、大...
Grok-1 - 马斯克旗下xAI开源的大模型,参数量3140亿
Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最大的开源大语言...
AutoDev - 微软推出的AI编程和程序开发智能体框架
AutoDev是由微软的研究人员推出的一个AI编程和程序开发智能体框架,专门设计用于自主规划和执行复杂的软件工程任务,如代码编写、调试、测试和版本控制等。Au...
Follow-Your-Click - 腾讯等开源的图像到视频模型,可生成局部动画
Follow-Your-Click是一个由来自腾讯公司(混元团队)联合清华大学和香港科技大学的研究人员共同研发的图像到视频(Image-to-Video,简称I2V)生成模型,允许...
ComflowySpace - 免费开源且简单易用的ComfyUI整合工具
ComflowySpace是一款专为简化和增强AI图像及视频生成工具使用体验而设计的开源软件,基于ComfyUI和Stable Diffusion,旨在提供一个更加用户友好和高效的工作...
Pix2Gif - 微软推出的静态图像转动态GIF的扩散模型
Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型,专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散过程来实现图像...
Transformer Debugger - OpenAI开源的理解和分析大模型内部的工具
Transformer Debugger (TDB) 是由 OpenAI 的对齐团队(Superalignment)开发的一款工具,旨在帮助研究人员和开发者更深入地理解和分析 Transformer 模型的内...