VideoPhy – UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试 | AI工具集
VideoPhy是什么 VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否遵循现实世界的物理规则...
PixVerse V3.5 – 爱诗科技推出的最新版AI视频生成工具,支持1080p高清画质 | AI工具集
PixVerse V3.5是什么 PixVerse V3.5是爱诗科技推出的AI视频生成工具的最新版本,在性能和功能上都有显著提升。能在最快5秒内生成视频,显著增强了运动控制力...
什么是TTS(Text To Speech) – AI百科知识
TTS(Text To Speech)技术,即文本转语音技术,是一种将文本信息转换为语音信号的技术。这项技术使计算机能够模仿人类的说话过程,将文字以语音的形式输出。...
cc:Monet – AI财务助手,快速识别处理发票、员工费用申报和审批流程 | AI工具集
cc:Monet是什么 cc:Monet是AI财务助手,旨在简化企业的财务流程。通过先进的人工智能技术,能快速处理发票、员工费用申报和审批流程,提供有价值的商业洞察。...
什么是思维树(Tree of Thought, ToT) – AI百科知识
思维树(Tree of Thought, ToT)是一种用于增强大型语言模型(LLM)推理能力的框架。它通过模拟人类解决问题时的认知策略,使LLM能够以结构化的方式探索多种...
DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架 | AI工具集
DynamicControl是什么 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架...
琅琊 – 中国科学院海洋研究所自主研发的海洋大模型1.0版本 | AI工具集
琅琊是什么 琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本,专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科...
Mind GPT-3o – 理想汽车推出的多模态端到端大模型 | AI工具集
Mind GPT-3o是什么 Mind GPT-3o是理想汽车推出的多模态端到端大模型,融合语音、视觉和语言理解技术,实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使...
Qwen-Agent – 阿里通义开源的 Agent 应用开发框架
Qwen-Agent是什么 Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用...
LowCodeEngine – 阿里开源的低代码开发框架 | AI工具集
LowCodeEngine是什么 LowCodeEngine是阿里巴巴开源的低代码开发框架,基于提供拖拽、配置等简单操作,让开发者快速构建复杂的系统页面。框架以强大的定制能力...