拍试卷 – AI试卷识别处理软件,具备高清扫描、手写擦除、试卷还原等功能
拍试卷 – AI试卷识别处理软件,具备高清扫描、手写擦除、试卷还原等功能
VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型
VITRON是什么 VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像和...
讯飞星火 -科大讯飞推出的AI智能助手
讯飞星火 -科大讯飞推出的AI智能助手
MMedAgent – 专为医疗领域设计的多模态AI智能体,管理多种医疗任务 | AI工具集
MMedAgent是什么 MMedAgent是专为医疗领域设计的多模态AI智能体,通过整合各种开源医疗模型来管理多种医疗任务。系统包括一个指令调整的多模态大型语言模型(...
TANGOFLUX – 英伟达联合新加坡科技设计大学开源的文本到音频生成模型 | AI工具集
TANGOFLUX是什么 TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA共同推出的。模型拥有约5.15亿参数,能在单个A40 GPU上仅用3.7...
TITAN – 哈佛医学院研究推出的多模态全切片病理基础模型 | AI工具集
TITAN是什么 TITAN是哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能在无需微调或临床标签的情况下提取通...
什么是视频扩散模型(Video Diffusion Models, VDM) – AI百科知识
视频扩散模型(Video Diffusion Models, VDM)是一种用于视频生成的扩散模型,在生成模型研究中是一个重要的里程碑。该模型是标准图像扩散架构的自然扩展,并...
VideoMaker – 浙大联合腾讯和华为推出的零样本定制视频生成框架 | AI工具集
VideoMaker是什么 VideoMaker是浙江大学、腾讯和华为诺亚方舟实验室共同开发的创新项目,基于视频扩散模型(VDM)的零样本定制视频生成框架。与传统方法不同...
AI搜 – 百度推出的桌面端 AI 搜索引擎
AI搜是什么 AI搜是百度基于文心大模型打造的桌面端AI搜索引擎。整合了百度搜索引擎、百度健康、百度律临、百度文库、百度教育等多个内容生态,确保搜索结果的...
PanoDreamer – 单张图像生成连贯360° 3D场景的新方法 | AI工具集
PanoDreamer是什么 PanoDreamer是能够从单张图像生成连贯的360° 3D场景的新方法。这种方法不同于现有技术,它将问题构建为单图像全景和深度估计的两个优化任...