AI工具
GaussianEditor – 一种3D编辑算法,支持快速且精确地修改3D场景 | AI工具集
GaussianEditor是什么 GaussianEditor 是一种基于高斯飞溅(Gaussian Splatting)的3D编辑算法,支持用户快速而精确地修改3D场景。通过高斯语义跟踪和分层高...
Lingo – 西湖心辰推出的端到端语音大模型,媲美GPT-4o | AI工具集
Lingo是什么 Lingo 是西湖心辰推出的国内首个端到端语音大模型,在技术上具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比 GPT-4o 更出色的中...
Sapiens – Meta推出的AI视觉模型,能理解图片和视频中的人类动作 | AI工具集
Sapiens是什么 Sapiens是Meta实验室推出的AI视觉模型,专为理解图片和视频中的人类动作设计。支持二维姿势预估、身体部位分割、深度估计和表面法线预测等任务...
mPLUG-Owl3 – 阿里巴巴推出的先进通用多模态大模型 | AI工具集
mPLUG-Owl3是什么 mPLUG-Owl3是阿里巴巴推出的通用多模态AI模型,专为理解和处理多图及长视频设计。在保持准确性的同时,显著提升了推理效率,能在4秒内分析...
TrackGo – 先进的可控AI视频生成技术 | AI工具集
TrackGo是一种先进的可控AI视频生成技术,通过用自由形状的遮罩和箭头,为用户提供了一种灵活而精确的机制来控制视频中对象的运动。技术的核心是TrackAdapter...
AskHackers – 面向开发者的AI搜索工具 | AI工具集
AskHackers是什么 AskHackers是一个面向开发者的AI搜索工具,专注于技术领域的问答。通过分析Hacker News的评论区,基于AI技术自动生成问题的答案,为用户提...
GPT Pilot – AI编程工具,让95%的开发者实现自动写代码 | AI工具集
GPT Pilot是什么 GPT Pilot 是一款AI编程工具,通过模仿人类开发者的工作流程,帮助从零开始构建应用程序。能编写代码、调试程序、与用户讨论问题,并请求代...
Bark – Suno AI 推出的开源文本到音频模型
Bark是什么 Bark是Suno AI 推出的开源文本到音频模型,能生成逼真的多语言语音和多种音频类型,包括音乐、背景噪音等,同时支持非语言交流如笑声和哭泣。Bark...
MARS5-TTS – 开源的AI声音克隆工具,支持140+语言 | AI工具集
MARS5-TTS是什么 MARS5-TTS是CAMB.AI推出开源的AI声音克隆工具,有突破性逼真的韵律,支持140多种语言支持。还能处理复杂韵律场景,如体育解说和动漫AI配音等...
WatermarkRemover – 在线AI背景去除工具 | AI工具集
WatermarkRemover是什么 WatermarkRemover是在线AI背景去除工具,支持PNG、JPEG等多种图片格式。WatermarkRemover通过智能识别技术,快速去除图片背景,同时...