AI工具
VLOGGER – 谷歌推出的图像到合成人物动态视频的模型 | AI工具集
VLOGGER是什么 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主要功能...
Open-Sora – 开源的类Sora架构的视频生成模型和复现方案 | AI工具集
Open-Sora是什么 Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规...
Grok-1 – 马斯克旗下xAI开源的大模型,参数量3140亿 | AI工具集
Grok-1是什么 Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最...
AutoDev – 微软推出的AI编程和程序开发智能体框架 | AI工具集
AutoDev是什么 AutoDev是由微软的研究人员推出的一个AI编程和程序开发智能体框架,专门设计用于自主规划和执行复杂的软件工程任务,如代码编写、调试、测试和...
Follow-Your-Click – 腾讯等开源的图像到视频模型,可生成局部动画 | AI工具集
Follow-Your-Click是什么 Follow-Your-Click是一个由来自腾讯公司(混元团队)联合清华大学和香港科技大学的研究人员共同研发的图像到视频(Image-to-Video,...
ComflowySpace – 免费开源且简单易用的ComfyUI整合工具 | AI工具集
ComflowySpace是什么 ComflowySpace是一款专为简化和增强AI图像及视频生成工具使用体验而设计的开源软件,基于ComfyUI和Stable Diffusion,旨在提供一个更加...
Pix2Gif – 微软推出的静态图像转动态GIF/视频的扩散模型 | AI工具集
Pix2Gif是什么 Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型,专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散...
Transformer Debugger – OpenAI开源的理解和分析大模型内部的工具 | AI工具集
Transformer Debugger是什么 Transformer Debugger (TDB) 是由 OpenAI 的对齐团队(Superalignment)开发的一款工具,旨在帮助研究人员和开发者更深入地理解...
ELLA – 腾讯推出的扩散模型适配器,可增强语义对齐 | AI工具集
ELLA是什么 ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的研究人员推出的一种新型方法,旨在提升文本到图像生成模型在处理...
星火公文写作助手 – 科大讯飞推出的AI公文写作工具 | AI工具集
星火公文写作助手是科大讯飞基于星火认知大模型推出的一款AI公文写作工具,该助手提供写作前的素材筹备、写作中的稿件撰写、写作后的审核校对,辅助公文写作...