博客 | 第 190 页 | AIGC跨境工具导航

Open NotebookLM – 开源的PDF转播客AI工具，能自定义语气 | AI工具集

Open NotebookLM 是一个开源的AI工具，基于最新的开源AI模型，如Llama 3.1 405B、MeloTTS和Bark，将PDF文档转换成播客形式的音频内容。工具适合将书面信息转...

4个月前

Pixcap是什么 Pixcap 是一个在线3D设计工具，使设计师和营销人员能轻松创建独特的3D渲染和设计。用户从3D元素中选择并混合搭配，基于AI提示快速生成设计。适...

4个月前

Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型，基于20万小时的人工转录英语数据训练而成。模型在长语音识别领域表现卓越，适合处理如播客和财...

4个月前

Transkriptor是什么 Transkriptor 是一款强大的在线音频和视频转录工具，基于先进的AI技术将语音内容转换成文本。工具支持100多种语言，处理各种格式的音频和...

4个月前

Playground v3（PGv3）是由Playground Research推出的最新文本到图像模型，基于深度融合的大型语言模型（LLM）技术，实现在图形设计任务上超越人类设计师的能...

4个月前

Inverse Painting是什么 Inverse Painting 是一种AI技术，由华盛顿大学的研究人员推出，能逆向重现绘画过程。通过分析艺术家的绘画视频，学习绘画技巧和顺序...

4个月前

TinyVLA是一种面向机器人操控的视觉-语言-动作（VLA）模型，由华东师范大学和上海大学团队推出。针对现有VLA模型的不足，如推理速度慢和需要大量数据预训练，...

4个月前

IFAdapter是什么 IFAdapter是一种新型的文本到图像生成模型，由腾讯和新加坡国立大学共同推出。提升生成含有多个实例的图像时的位置和特征准确性。传统模型在...

4个月前

SoCreate是什么 SoCreate 是一款创新的编剧软件，结合生成式 AI 图像和视觉工具颠覆传统的编剧方式。软件提供易用的模板，帮助用户快速创建符合行业标准的剧...

4个月前

Soundful是什么 Soundful是一个基于人工智能技术为视频、直播、播客等内容创作者提供免版税背景音乐生成服务的平台。用户可以轻松选择音乐风格、主题，设置节...

4个月前