AI工具
UniEdit – 免训练调优的统一视频编辑框架 | AI工具集
UniEdit是什么 UniEdit是由浙江大学、微软研究院和北京大学的研究人员推出的一个创新的视频编辑框架,允许用户在不需要进行模型微调的情况下,对视频的运动和...
TextDiffuser-2 – 微软等推出的AI图像文本渲染融合框架 | AI工具集
TextDiffuser-2是什么 Text-Diffuser 2是由来自微软研究院、香港科技大学和中山大学的研究人员最新推出的一个基于扩散模型的文本渲染方法,旨在解决图像扩散...
Snap Video – Snapchat公司推出的AI视频生成模型 | AI工具集
Snap Video是什么 Snap Video是由Snap(社交媒体Snapchat所属的公司)研究团队开发的一个AI视频生成模型,目标是通过文本描述来合成视频,即用户可以输入一段...
MeloTTS – MyShell AI推出的多语言文本到语音转换工具 | AI工具集
MeloTTS是什么 MeloTTS 是一个由 MyShell AI 开发的开源的高质量多语言文本转语音(TTS)库,能够将文本转换成自然流畅的语音输出,支持多种语言,包括但不限...
StarCoder 2 – BigCode推出的第二代开源代码大模型 | AI工具集
StarCoder 2是什么 StarCoder 2是由BigCode项目(Hugging Face和ServiceNow支持)联合Nvidia的团队开发的新一代大型代码语言模型,使用来自 The Stack v2 数...
ChatMusician – 可理解和生成音乐的大模型 | AI工具集
ChatMusician是什么 ChatMusician是由Multimodal Art Projection Research Community、Skywork AI和香港科技大学的研究人员推出的,一个开源的用于理解和生成...
OpenCodeInterpreter – 开源的代码解释器,可生成和执行代码 | AI工具集
OpenCodeInterpreter是什么 OpenCodeInterpreter是一个开源的代码解释器系统,旨在通过利用大模型结合代码生成、执行和迭代精炼的能力,可以辅助开发者在软件...
Mistral Large – Mistral AI发布的一款先进的大语言模型
Mistral Large是什么 Mistral Large是由法国人工智能公司Mistral AI开发的一款先进的大型语言模型(LLM),具备顶级的推理能力,能够处理复杂的多语言推理任...
GPT-SoVITS – 开源的声音克隆项目,只需少量数据即可合成声音 | AI工具集
GPT-SoVITS是什么 GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿不哭推出,该语音合成工具结合了GPT(Generative Pre-trained Transf...
YOLOv9 – 新一代高效的实时目标检测系统 | AI工具集
YOLOv9是什么 YOLOv9是一个由台北中研院和台北科技大学等机构的研究团队推出的新一代先进的目标检测系统,是YOLO(You Only Look Once)算法系列的最新版本。...