AI工具

Steve AI – AI视频生成的平台,支持多模态数据转化为多种视频风格 | AI工具集

Steve AI是什么 Steve AI 是一个基于云端的AI视频生成平台,能将文本、博客、网页或音频内容快速转化为高质量的视频和动画。平台基于先进的AI技术,用户即使...

JoyHallo – 京东推出音频驱动视频生成的数字人模型 | AI工具集

JoyHallo是什么 JoyHallo 是京东开源的数字人模型,专为普通话设计,能根据音频生成逼真的说话视频。特别适合处理普通话的复杂口型和语调,具有跨语言生成视...

AMD-135M – AMD推出的首款小型语言模型 | AI工具集

AMD-135M是什么 AMD-135M是AMD推出的首款小型语言模型(SLM),为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型架构,在AMD Instinct MI250加速器上...

HouseCrafter – 东北大学和 Stability AI推出2D转换3D室内场景的技术

HouseCrafter 是由东北大学和 Stability AI 推出的先进技术,将二维平面图自动转换成三维室内场景。基于一个网络规模图像训练的2D扩散模型,生成一致的多视图...

I2VEdit – AI视频编辑技术,基于扩散模型实现首帧编辑引导 | AI工具集

I2VEdit是什么 I2VEdit是一个先进的视频编辑框架,通过图像到视频的扩散模型实现首帧引导的视频编辑。用户只需编辑视频的第一帧,I2VEdit能自动将编辑效果应...

Oryx – 腾讯联合清华和南洋理工大学推出的多模态大语言模型 | AI工具集

Oryx是什么 Oryx是由清华大学、腾讯和南洋理工大学联合推出的多模态大型语言模型(MLLM),基于两项核心创新来处理视觉数据,预训练的OryxViT模型和动态压缩...

NeMo – 英伟达推出的用于构建、定制和部署生成式AI模型 | AI工具集

NeMo是什么 NeMo 是由 NVIDIA 提供的端到端云原生框架,用于构建、定制和部署生成式 AI 模型。支持大型语言模型(LLMs)、多模态模型、语音识别和文本转语音...

GarDiff – AI虚拟试穿技术,生成高保真试穿图像保留服装细节 | AI工具集

GarDiff是一种创新的虚拟试穿技术,通过使用CLIP和VAE编码来提取服装的外观先验,结合服装聚焦适配器和高频细节增强算法,生成高保真且细节丰富的试穿图像。...

新CCI 3.0 – 智源研究院发布的大规模的中文互联网语料库

新CCI 3.0 – 智源研究院发布的大规模的中文互联网语料库

MemFree – 开源的混合AI搜索引擎,支持多模态搜索和提问 | AI工具集

MemFree是什么 MemFree是一款开源的混合AI搜索引擎,通过整合多种AI模型和搜索引擎,提供高效、多样化的搜索体验。可以用文本、图像、文件和网页等多种方式进...