博客 | 第 37 页 | AIGC跨境工具导航

VideoPhy – UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试 | AI工具集

VideoPhy是什么 VideoPhy是UCLA和谷歌研究研究院联合推出的，首个评估视频生成模型物理常识能力的基准测试，能衡量模型生成的视频是否遵循现实世界的物理规则...

3周前

PixVerse V3.5是什么 PixVerse V3.5是爱诗科技推出的AI视频生成工具的最新版本，在性能和功能上都有显著提升。能在最快5秒内生成视频，显著增强了运动控制力...

3周前

TTS（Text To Speech）技术，即文本转语音技术，是一种将文本信息转换为语音信号的技术。这项技术使计算机能够模仿人类的说话过程，将文字以语音的形式输出。...

3周前

cc:Monet是什么 cc:Monet是AI财务助手，旨在简化企业的财务流程。通过先进的人工智能技术，能快速处理发票、员工费用申报和审批流程，提供有价值的商业洞察。...

3周前

思维树（Tree of Thought, ToT）是一种用于增强大型语言模型（LLM）推理能力的框架。它通过模拟人类解决问题时的认知策略，使LLM能够以结构化的方式探索多种...

3周前

DynamicControl是什么 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型（MLLM）推理能力的文本生成图像（T2I）任务新框架...

3周前

琅琊是什么琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本，专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科...

3周前

Mind GPT-3o是什么 Mind GPT-3o是理想汽车推出的多模态端到端大模型，融合语音、视觉和语言理解技术，实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使...

3周前

Qwen-Agent是什么 Qwen-Agent是基于通义千问模型（Qwen）的开源Agent开发框架，支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用...

3周前

LowCodeEngine是什么 LowCodeEngine是阿里巴巴开源的低代码开发框架，基于提供拖拽、配置等简单操作，让开发者快速构建复杂的系统页面。框架以强大的定制能力...

3周前