Pix2Gif – 微软推出的静态图像转动态GIF/视频的扩散模型 | AI工具集

Pix2Gif是什么 Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型,专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散...

Transformer Debugger – OpenAI开源的理解和分析大模型内部的工具 | AI工具集

Transformer Debugger是什么 Transformer Debugger (TDB) 是由 OpenAI 的对齐团队(Superalignment)开发的一款工具,旨在帮助研究人员和开发者更深入地理解...

ELLA – 腾讯推出的扩散模型适配器,可增强语义对齐 | AI工具集

ELLA是什么 ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的研究人员推出的一种新型方法,旨在提升文本到图像生成模型在处理...

星火公文写作助手 – 科大讯飞推出的AI公文写作工具 | AI工具集

星火公文写作助手是科大讯飞基于星火认知大模型推出的一款AI公文写作工具,该助手提供写作前的素材筹备、写作中的稿件撰写、写作后的审核校对,辅助公文写作...

PIXART-Σ – 华为推出的可生成4K高清图像的文生图模型 | AI工具集

PixArt-Σ是什么 PixArt-Σ是由来自华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一个基于扩散Transformer架构(DiT)的文生图模型,专门设计用...

Moondream – 开源的轻量级AI视觉语言模型,可在本地快速运行 | AI工具集

Moondream是什么 Moondream是一个免费开源的小型的人工智能视觉语言模型,虽然参数量小(Moondream1仅16亿,Moondream2为18.6亿)但可以提供高性能的视觉处理...

EMO – 阿里推出的AI肖像视频生成框架

EMO – 阿里推出的AI肖像视频生成框架

AtomoVideo – 阿里推出的高保真图像到视频生成框架 | AI工具集

AtomoVideo是什么 AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(Image-to-Video, I2V)生成框架,旨在从输入的静态图像生成高质量的视频内...

ResAdapter – 字节推出的扩散模型的分辨率适配器 | AI工具集

ResAdapter是什么 ResAdapter是由字节跳动的研究人员推出的一种为扩散模型(如Stable Diffusion)设计的分辨率适配器,允许这些图像生成模型生成具有任意分辨...

ScreenAI – 谷歌推出的可读屏AI视觉模型,可理解UI和信息图表 | AI工具集

ScreenAI是什么 ScreenAI是一个由谷歌的研究人员推出的可读屏AI视觉语言模型,专门设计用于理解和处理用户界面(UI)和信息图表。该模型基于PaLI架构结合了视...
1787980818292