AI工具

办公小浣熊2.0 – 商汤科技推出的AI办公助手，一站式创作空间 | AI工具集

办公小浣熊2.0是什么办公小浣熊2.0是商汤科技推出的AI办公助手，是办公小浣熊的升级版，办公小浣熊2.0采用“浣熊三步法（PAW）”——规划（Plan）、分析（Analyz...

1个月前

SOLAMI是什么 SOLAMI是创新的VR端3D角色扮演AI系统，是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动，基于社交视觉-语言-...

1个月前

O1-CODER是什么 O1-CODER是北京交通大学研究团队推出的开源项目，旨在复制OpenAI的O1模型，专注于编码任务。O1-CODER结合强化学习（RL）和蒙特卡洛树搜索（MC...

1个月前

GLM-4V-Flash是什么 GLM-4V-Flash 是智谱AI推出的首个免费多模态模型API，GLM-4V-Flash 模型拥有图像描述生成、图像分类、视觉推理、视觉问答（VQA）以及图像...

1个月前

NVILA是什么 NVILA是NVIDIA推出的系列视觉语言模型，能平衡效率和准确性。模型用“先扩展后压缩”策略，有效处理高分辨率图像和长视频。NVILA在训练和微调阶段...

1个月前

MEMO是什么 MEMO（Memory-Guided EMOtionaware diffusion）是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架，用在生成具有身份一致性...

1个月前

SNOOPI是什么 SNOOPI是创新的文本到图像生成框架，基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB（适当指导 – SwiftBrush）和NASA（负向...

1个月前

clone-voice是什么 Clone-voice是开源的声音克隆工具，基于深度学习技术分析和模拟人类声音，实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在...

1个月前

One Shot, One Talk是什么 One Shot, One Talk是先进的图像生成技术，能从单张图片中生成具有个性化细节的全身动态说话头像，支持逼真的动画效果，包括自然的...

1个月前

Aurora是什么 Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像，擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像（如米老鼠...

1个月前