AI工具

VLOGGER – 谷歌推出的图像到合成人物动态视频的模型 | AI工具集

VLOGGER是什么 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型，专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主要功能...

8个月前

Open-Sora是什么 Open-Sora是由Colossal-AI团队开源的视频生成模型，旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构，通过三个阶段训练：大规...

8个月前

Grok-1是什么 Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型，是一个混合专家（MoE）模型，拥有 3140 亿参数，使其成为目前参数量最...

8个月前

AutoDev是什么 AutoDev是由微软的研究人员推出的一个AI编程和程序开发智能体框架，专门设计用于自主规划和执行复杂的软件工程任务，如代码编写、调试、测试和...

8个月前

Follow-Your-Click是什么 Follow-Your-Click是一个由来自腾讯公司（混元团队）联合清华大学和香港科技大学的研究人员共同研发的图像到视频（Image-to-Video，...

8个月前

ComflowySpace是什么 ComflowySpace是一款专为简化和增强AI图像及视频生成工具使用体验而设计的开源软件，基于ComfyUI和Stable Diffusion，旨在提供一个更加...

8个月前

Pix2Gif是什么 Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型，专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散...

8个月前

Transformer Debugger是什么 Transformer Debugger (TDB) 是由 OpenAI 的对齐团队（Superalignment）开发的一款工具，旨在帮助研究人员和开发者更深入地理解...

8个月前

ELLA是什么 ELLA（Efficient Large Language Model Adapter，高效的大模型适配器）是由腾讯的研究人员推出的一种新型方法，旨在提升文本到图像生成模型在处理...

8个月前

星火公文写作助手是科大讯飞基于星火认知大模型推出的一款AI公文写作工具，该助手提供写作前的素材筹备、写作中的稿件撰写、写作后的审核校对，辅助公文写作...

8个月前