AI工具 | 第 166 页 | AIGC跨境工具导航

VideoPrism – 谷歌研究团队推出的通用视频编码器 | AI工具集

VideoPrism是什么 VideoPrism是一个由谷歌研究团队开发的通用视频编码器，旨在通过一个单一的预训练模型来处理多种视频理解任务。该模型能够从视频中提取丰富...

9个月前

ScreenAgent是什么 ScreenAgent是一个由吉林大学人工智能学院的研究团队开发的计算机控制智能体，该智能体是基于视觉语言模型（VLM）构建的，能够与真实计算...

9个月前

ConsiStory是什么 ConsiStory是由NVIDIA和特拉维夫大学的研究人员共同开发的一种无需训练的文本生成图像的方法，可以实现让图像在保持风格和主题不变的情况下...

9个月前

Stable Diffusion 3是什么 Stable Diffusion 3 是由 Stability AI 开发的一款先进的文本到图像生成模型，是 Stable Diffusion 系列模型的最新迭代，旨在通过...

9个月前

SDXL-Lightning是什么 SDXL-Lightning是由字节跳动的研究团队推出的一种基于扩散模型的文本到图像生成技术，旨在解决传统扩散模型在图像生成速度和计算成本上...

9个月前

VideoPoet是什么 VideoPoet是由谷歌的研究团队开发的一种基于大模型的AI视频生成方案，支持从文本、图像或视频输入中合成高质量的视频内容，并生成匹配的音频...

9个月前

9个月前

Boximator是什么？ Boximator是由字节跳动的研究团队开发的一种视频合成技术，旨在生成丰富且可控的运动，以增强视频合成的质量和可控性。该技术通过引入两种...

9个月前

9个月前

Depth Anything是什么？ Depth Anything是由来自Tiktok、香港大学和浙江大学的研究人员推出的一个为单目深度估计（Monocular Depth Estimation, MDE）设计的...

9个月前