AI工具
Tripo 2.0 – VAST推出的3D模型生成平台,迅速完成纹理和材质的创建 | AI工具集
Tripo 2.0是什么 Tripo 2.0 是 VAST 公司推出的一款创新的 3D 模型生成服务,融合 DiT 和 U-Net 模型的复合架构,能快速生成具有丰富细节和高质量材质的 3D ...
cogvlm2-llama3-caption – 智普AI开源的视频标注模型,生成文本描述 | AI工具集
cogvlm2-llama3-caption是什么 cogvlm2-llama3-caption模型是一个基于CogVLM2架构的视频描述生成模型。模型用于理解视频内容,自动生成描述视频内容的文本标...
Gummy – 通义推出的端到端语音翻译大模型,能实时流式生成结果 | AI工具集
Gummy是什么 Gummy是通义实验室在2024年云栖大会上推出的端到端语音翻译大模型。模型能实时流式生成语音识别与翻译结果,支持包括中文、英语、粤语、日语、韩...
Ovis1.6 – 阿里国际AI团队推出的多模态大模型,超过闭源GPT-4o-mini | AI工具集
Ovis1.6是什么 Ovis1.6是阿里国际AI团队推出的多模态大模型,在多模态权威综合评测基准OpenCompass上取得了优异的成绩,特别是在30亿参数以下的模型中综合得...
RapidPages – AI驱动的集成开放环境,实时生成UI组件和CSS代码 | AI工具集
RapidPages是什么 RapidPages 是一个开源的集成开发环境(IDE),专注于基于AI技术快速生成 React 和 Tailwind CSS 的 UI 组件。基于自然语言处理,支持用户...
CogVideoX-5B-I2V – 智谱 AI 开源的文本到视频生成模型
CogVideoX-5B-I2V是什么 CogVideoX-5B-I2V 是智谱 AI 开源的文本到视频生成模型,基于 3D 因果变分自编码器和专家自适应 LayerNorm 技术,根据文本提示生成高...
Draw an Audio – 中科院联合美团推出的视频生成音频系统
Draw an Audio 是中国科学院自动化研究所和美团点评的研究人员推出的视频生成音频系统。根据视频内容自动生成匹配的声音效果,类似于电影制作中的 Foley 艺术...
Void – 开源的AI辅助编码工具,代码自动补全和智能建议 | AI工具集
Void是什么 Void 是基于 Visual Studio Code 构建的开源文本编辑器,集成AI技术增强编程体验。Void支持代码自动补全、内联编辑、AI 驱动的代码搜索,直接与大...
DressPlay – AI虚拟试衣应用,支持图片和视频换装 | AI工具集
DressPlay是什么 DressPlay 是一款基于AI术的虚拟试衣应用,支持用户通过上传照片来试穿各种服装。应用基于AI算法分析用户的身材和姿势,将服装图像自然地贴...
Insighto.ai – AI通信平台,AI代理能自动接听和拨打电话处理消息 | AI工具集
Insighto.ai是什么 Insighto.ai 是一个先进的人工智能通信平台,专注于通过语音和聊天提供对话式AI服务。支持多语言和24/7不间断的个性化客户支持,能跨多种...