AI工具

StereoCrafter – 腾讯开源将任意2D视频转为立体3D视频的框架 | AI工具集

StereoCrafter是什么 StereoCrafter是腾讯AI Lab和ARC Lab共同推出的创新框架，能将单目视频（2D视频）转换为立体3D视频，满足日益增长的3D内容需求。StereoC...

2周前

Large Motion Model是什么 Large Motion Model（LMM）是统一的多模态运动生成模型，是新加坡南洋理工大学S-Lab和商汤科技研究团队共同推出的。LMM能处理包括...

2周前

VideoPhy是什么 VideoPhy是UCLA和谷歌研究研究院联合推出的，首个评估视频生成模型物理常识能力的基准测试，能衡量模型生成的视频是否遵循现实世界的物理规则...

2周前

PixVerse V3.5是什么 PixVerse V3.5是爱诗科技推出的AI视频生成工具的最新版本，在性能和功能上都有显著提升。能在最快5秒内生成视频，显著增强了运动控制力...

2周前

TTS（Text To Speech）技术，即文本转语音技术，是一种将文本信息转换为语音信号的技术。这项技术使计算机能够模仿人类的说话过程，将文字以语音的形式输出。...

2周前

cc:Monet是什么 cc:Monet是AI财务助手，旨在简化企业的财务流程。通过先进的人工智能技术，能快速处理发票、员工费用申报和审批流程，提供有价值的商业洞察。...

2周前

思维树（Tree of Thought, ToT）是一种用于增强大型语言模型（LLM）推理能力的框架。它通过模拟人类解决问题时的认知策略，使LLM能够以结构化的方式探索多种...

2周前

DynamicControl是什么 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型（MLLM）推理能力的文本生成图像（T2I）任务新框架...

2周前

琅琊是什么琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本，专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科...

2周前

Mind GPT-3o是什么 Mind GPT-3o是理想汽车推出的多模态端到端大模型，融合语音、视觉和语言理解技术，实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使...

2周前