标签:AI项目和框架

Whisper-Medusa – aiOla推出的开源AI语音识别模型 | AI工具集

Whisper-Medusa是什么 Whisper-Medusa是aiOla推出的开源AI语音识别模型,结合了OpenAI的Whisper技术与aiOla的创新,Whisper-Medusa引入了多头注意力机制,实...

Tora – 阿里推出的AI视频生成框架 | AI工具集

Tora是什么 Tora是阿里推出的AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术,将文本、视觉和轨迹条件融合,生成高质量且符合物理世界动态的视频内容...

Stable Fast 3D – Stability AI推出的AI新模型,0.5秒将图片转为3D

Stable Fast 3D是什么 Stable Fast 3D(SF3D)是Stability AI推出的一种创新3D网格重建技术,能在0.5秒内从单张图片生成高质量的3D模型。Stable Fast 3D采用...

FLUX.1 – Stable Diffusion创始团队推出的开源AI图像生成模型 | AI工具集

FLUX.1是什么 FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型。包含三种变体:顶级性能的FLUX.1 [p...

Diffree – OpenGVLab推出的AI贴图框架 | AI工具集

Diffree是什么 Diffree是由OpenGVLab推出的AI贴图框架,能根据用户的文字描述,在图片中自动找到合适的位置添加新对象。通过智能掩码预测,无需手动绘制,即...

GPT-4o Long Output模型 – OpenAI最新推出的超长输出模型

GPT-4o Long Output模型是什么 GPT-4o Long Output模型是OpenAI最新推出的超长输出AI模型,支持高达64k tokens的长文本输出,相当于约200页小说。相较于原GPT...

Llama3.1 – Meta最新发布的最强开源AI模型 | AI工具集

Llama3.1是什么 Llama 3.1是Meta最新发布的开源AI模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参数量成为目前最大的开源模型之一。Llama 3.1支...

LivePortrait – 快手推出的开源人像动画生成框架 | AI工具集

LivePortrait是什么 LivePortrait是快手推出的开源人像动画生成框架,专注于高效、可控地将驱动视频的表情和姿态迁移至静态或动态人像,创造出富有表现力的视...
12