AI工具
StereoCrafter – 腾讯开源将任意2D视频转为立体3D视频的框架 | AI工具集
StereoCrafter是什么 StereoCrafter是腾讯AI Lab和ARC Lab共同推出的创新框架,能将单目视频(2D视频)转换为立体3D视频,满足日益增长的3D内容需求。StereoC...
Large Motion Model – 商汤科技联合南洋理工推出的统一多模态运动生成模型
Large Motion Model是什么 Large Motion Model(LMM)是统一的多模态运动生成模型,是新加坡南洋理工大学S-Lab和商汤科技研究团队共同推出的。LMM能处理包括...
VideoPhy – UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试 | AI工具集
VideoPhy是什么 VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否遵循现实世界的物理规则...
PixVerse V3.5 – 爱诗科技推出的最新版AI视频生成工具,支持1080p高清画质 | AI工具集
PixVerse V3.5是什么 PixVerse V3.5是爱诗科技推出的AI视频生成工具的最新版本,在性能和功能上都有显著提升。能在最快5秒内生成视频,显著增强了运动控制力...
什么是TTS(Text To Speech) – AI百科知识
TTS(Text To Speech)技术,即文本转语音技术,是一种将文本信息转换为语音信号的技术。这项技术使计算机能够模仿人类的说话过程,将文字以语音的形式输出。...
cc:Monet – AI财务助手,快速识别处理发票、员工费用申报和审批流程 | AI工具集
cc:Monet是什么 cc:Monet是AI财务助手,旨在简化企业的财务流程。通过先进的人工智能技术,能快速处理发票、员工费用申报和审批流程,提供有价值的商业洞察。...
什么是思维树(Tree of Thought, ToT) – AI百科知识
思维树(Tree of Thought, ToT)是一种用于增强大型语言模型(LLM)推理能力的框架。它通过模拟人类解决问题时的认知策略,使LLM能够以结构化的方式探索多种...
DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架 | AI工具集
DynamicControl是什么 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架...
琅琊 – 中国科学院海洋研究所自主研发的海洋大模型1.0版本 | AI工具集
琅琊是什么 琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本,专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科...
Mind GPT-3o – 理想汽车推出的多模态端到端大模型 | AI工具集
Mind GPT-3o是什么 Mind GPT-3o是理想汽车推出的多模态端到端大模型,融合语音、视觉和语言理解技术,实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使...