AI工具

HMoE – 腾讯混元团队提出的新型神经网络架构 | AI工具集

HMoE是什么 HMoE(混合异构专家模型)是腾讯混元团队提出的新型神经网络架构,旨在提升大型语言模型的性能和计算效率。通过引入不同尺寸的专家来处理不同复杂...

LLaVA-OneVision – 字节跳动推出的开源多模态AI模型 | AI工具集

LLaVA-OneVision是字节跳动推出开源的多模态AI模型,LLaVA-OneVision通过整合数据、模型和视觉表示的见解,能同时处理单图像、多图像和视频场景下的计算机视...

ColorAI – AI智能配色工具,根据创意自动生成配色方案 | AI工具集

ColorAI是什么 ColorAI 是一个AI智能配色工具,能根据用户的创意和设计理念自动生成配色方案。工具不仅提供配色方案,还能解释为什么这些颜色适合用户的创意...

MUMU – 文本和图像驱动的多模态生成模型 | AI工具集

MUMU是什么 MUMU是一种多模态图像生成模型,通过结合文本提示和参考图像来生成目标图像,从而提高生成的准确率和质量。MUMU模型的架构基于SDXL的预训练卷积UN...

Video-LLaVA2 – ChatLaw推出的开源多模态智能理解系统 | AI工具集

Video-LLaVA2是什么 Video-LLaVA2是由北京大学ChatLaw课题组推出的开源多模态智能理解系统,通过创新的时空卷积(STC)连接器和音频分支,提升了视频和音频理...

LM Studio – 开源、傻瓜、一站式部署本地大模型 (LLM) 的应用平台

LM Studio是什么 LM Studio 是一个本地大语言模型 (LLM) 应用平台,开源、傻瓜、一站式部署本地大模型。包括但不限于Llama、MPT、Gemma等,LM Studio 提供了...

新edge-tts – 开源的AI文字转语音项目

新edge-tts – 开源的AI文字转语音项目

VFusion3D – Meta联合牛津大学推出的AI生成3D模型项目 | AI工具集

VFusion3D是什么 VFusion3D 是由 Meta 和牛津大学的研究人员共同推出的AI生成3D模型项目,能从单张图片或文本描述中生成高质量的3D对象。VFusion3D 通过微调...

auto-video-generator – AI自动解说视频生成器 | AI工具集

auto-video-generator是什么 auto-video-generator是AI自动解说视频生成器,能实现一键生成解说视频。用户只需输入主题,系统便自动撰写脚本、合成语音、生成...

Qwen2-VL – 阿里巴巴达摩院开源的视觉多模态AI模型 | AI工具集

Qwen2-VL是什么 Qwen2-VL是阿里巴巴达摩院开源的视觉多模态AI模型,具备高级图像和视频理解能力。Qwen2-VL支持多种语言,能处理不同分辨率和长宽比的图片,实...