AI工具
Chameleon – Meta推出的图文混合多模态开源模型 | AI工具集
Chameleon是什么 Chameleon 是 Meta(Facebook 的母公司)的人工智能研究团队 FAIR(Facebook AI Research)发布的一个能理解和生成任意序列的图像和文本的混...
Adaptive获1900万美元A轮融资,为建筑业提供AI驱动的财务自动化平台
Adaptive获1900万美元A轮融资,为建筑业提供AI驱动的财务自动化平台
去中心化AI基础设施平台Mira获900万美元种子轮融资
去中心化AI基础设施平台Mira获900万美元种子轮融资
生成式AI平台Vectara获2500万美元A轮融资,为企业提供RAG解决方案
生成式AI平台Vectara获2500万美元A轮融资,为企业提供RAG解决方案
Wanderboat – 硅谷初创公司UTA AI推出的AI旅行助手 | AI工具集
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,...
FunAudioLLM – 阿里巴巴通义团队推出的开源语音大模型 | AI工具集
FunAudioLLM是什么 FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个模型。SenseVoice擅长多语言语音识别和情感辨...
EchoMimic – 阿里推出的开源数字人项目,赋予静态图像以生动语音和表情 | AI工具集
EchoMimic是什么 EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目,赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标志点,创造出高度逼真的...
字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费
字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费
Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型 | AI工具集
Moshi是什么 Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交...
Fish Speech – 开源的高效文本到语音合成TTS工具 | AI工具集
Fish Speech是什么 Fish Speech是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持中文、英文和日文。通过约15万小时的多语种数据训练,实现了接近...