AI工具 | 第 119 页 | AIGC跨境工具导航

HMoE – 腾讯混元团队提出的新型神经网络架构 | AI工具集

HMoE是什么 HMoE（混合异构专家模型）是腾讯混元团队提出的新型神经网络架构，旨在提升大型语言模型的性能和计算效率。通过引入不同尺寸的专家来处理不同复杂...

3个月前

LLaVA-OneVision是字节跳动推出开源的多模态AI模型，LLaVA-OneVision通过整合数据、模型和视觉表示的见解，能同时处理单图像、多图像和视频场景下的计算机视...

3个月前

ColorAI是什么 ColorAI 是一个AI智能配色工具，能根据用户的创意和设计理念自动生成配色方案。工具不仅提供配色方案，还能解释为什么这些颜色适合用户的创意...

3个月前

MUMU是什么 MUMU是一种多模态图像生成模型，通过结合文本提示和参考图像来生成目标图像，从而提高生成的准确率和质量。MUMU模型的架构基于SDXL的预训练卷积UN...

3个月前

Video-LLaVA2是什么 Video-LLaVA2是由北京大学ChatLaw课题组推出的开源多模态智能理解系统，通过创新的时空卷积（STC）连接器和音频分支，提升了视频和音频理...

3个月前

LM Studio是什么 LM Studio 是一个本地大语言模型 (LLM) 应用平台，开源、傻瓜、一站式部署本地大模型。包括但不限于Llama、MPT、Gemma等，LM Studio 提供了...

3个月前

3个月前

VFusion3D是什么 VFusion3D 是由 Meta 和牛津大学的研究人员共同推出的AI生成3D模型项目，能从单张图片或文本描述中生成高质量的3D对象。VFusion3D 通过微调...

3个月前

auto-video-generator是什么 auto-video-generator是AI自动解说视频生成器，能实现一键生成解说视频。用户只需输入主题，系统便自动撰写脚本、合成语音、生成...

3个月前

Qwen2-VL是什么 Qwen2-VL是阿里巴巴达摩院开源的视觉多模态AI模型，具备高级图像和视频理解能力。Qwen2-VL支持多种语言，能处理不同分辨率和长宽比的图片，实...

3个月前