AI工具

ELLA – 腾讯推出的扩散模型适配器,可增强语义对齐 | AI工具集

ELLA是什么 ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的研究人员推出的一种新型方法,旨在提升文本到图像生成模型在处理...

星火公文写作助手 – 科大讯飞推出的AI公文写作工具 | AI工具集

星火公文写作助手是科大讯飞基于星火认知大模型推出的一款AI公文写作工具,该助手提供写作前的素材筹备、写作中的稿件撰写、写作后的审核校对,辅助公文写作...

PIXART-Σ – 华为推出的可生成4K高清图像的文生图模型 | AI工具集

PixArt-Σ是什么 PixArt-Σ是由来自华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一个基于扩散Transformer架构(DiT)的文生图模型,专门设计用...

Moondream – 开源的轻量级AI视觉语言模型,可在本地快速运行 | AI工具集

Moondream是什么 Moondream是一个免费开源的小型的人工智能视觉语言模型,虽然参数量小(Moondream1仅16亿,Moondream2为18.6亿)但可以提供高性能的视觉处理...

EMO – 阿里推出的AI肖像视频生成框架

EMO – 阿里推出的AI肖像视频生成框架

AtomoVideo – 阿里推出的高保真图像到视频生成框架 | AI工具集

AtomoVideo是什么 AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(Image-to-Video, I2V)生成框架,旨在从输入的静态图像生成高质量的视频内...

ResAdapter – 字节推出的扩散模型的分辨率适配器 | AI工具集

ResAdapter是什么 ResAdapter是由字节跳动的研究人员推出的一种为扩散模型(如Stable Diffusion)设计的分辨率适配器,允许这些图像生成模型生成具有任意分辨...

ScreenAI – 谷歌推出的可读屏AI视觉模型,可理解UI和信息图表 | AI工具集

ScreenAI是什么 ScreenAI是一个由谷歌的研究人员推出的可读屏AI视觉语言模型,专门设计用于理解和处理用户界面(UI)和信息图表。该模型基于PaLI架构结合了视...

LayerDiffusion – AI生成具有透明度的图像的框架 | AI工具集

LayerDiffusion是什么 LayerDiffusion(现已更名为LayerDiffuse)是由来自斯坦福大学的研究人员 Lvmin Zhang(即ControlNet的作者张吕敏)和 Maneesh Agrawal...

DUSt3R – 从任意图像集合中重建3D场景的框架 | AI工具集

DUSt3R是什么 DUSt3R(Dense and Unconstrained Stereo 3D Reconstruction,密集无约束立体三维重建)是由来自芬兰阿尔托大学和Naver欧洲实验室的研究人员推...
1787980818292