Open NotebookLM – 开源的PDF转播客AI工具,能自定义语气 | AI工具集

Open NotebookLM 是一个开源的AI工具,基于最新的开源AI模型,如Llama 3.1 405B、MeloTTS和Bark,将PDF文档转换成播客形式的音频内容。工具适合将书面信息转...

Pixcap – AI驱动的在线3D设计工具,独特的3D元素混合搭配设计 | AI工具集

Pixcap是什么 Pixcap 是一个在线3D设计工具,使设计师和营销人员能轻松创建独特的3D渲染和设计。用户从3D元素中选择并混合搭配,基于AI提示快速生成设计。适...

Reverb ASR – Rev公司开源的自动语音识别和说话人分离模型 | AI工具集

Reverb ASR是Rev公司推出的开源自动语音识别和说话人分离模型,基于20万小时的人工转录英语数据训练而成。模型在长语音识别领域表现卓越,适合处理如播客和财...

Transkriptor – 在线AI语音转文本工具,支持各种格式音频视频转录 | AI工具集

Transkriptor是什么 Transkriptor 是一款强大的在线音频和视频转录工具,基于先进的AI技术将语音内容转换成文本。工具支持100多种语言,处理各种格式的音频和...

Playground v3 – Playground Research推出超越人类设计师的文本到图像模型

Playground v3(PGv3)是由Playground Research推出的最新文本到图像模型,基于深度融合的大型语言模型(LLM)技术,实现在图形设计任务上超越人类设计师的能...

Inverse Painting – 华盛顿大学推出逆向重现绘画过程的AI技术 | AI工具集

Inverse Painting是什么 Inverse Painting 是一种AI技术,由华盛顿大学的研究人员推出,能逆向重现绘画过程。通过分析艺术家的绘画视频,学习绘画技巧和顺序...

TinyVLA – 华东师范和上海大学推出面向机器人操控VLA模型 | AI工具集

TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不足,如推理速度慢和需要大量数据预训练,...

IFAdapter – 腾讯和新加坡国立大学联合推出的文本到图像生成模型 | AI工具集

IFAdapter是什么 IFAdapter是一种新型的文本到图像生成模型,由腾讯和新加坡国立大学共同推出。提升生成含有多个实例的图像时的位置和特征准确性。传统模型在...

SoCreate – AI编剧软件,支持图片视觉融入剧本 | AI工具集

SoCreate是什么 SoCreate 是一款创新的编剧软件,结合生成式 AI 图像和视觉工具颠覆传统的编剧方式。软件提供易用的模板,帮助用户快速创建符合行业标准的剧...

Soundful – AI驱动的音乐生成服务平台 | AI工具集

Soundful是什么 Soundful是一个基于人工智能技术为视频、直播、播客等内容创作者提供免版税背景音乐生成服务的平台。用户可以轻松选择音乐风格、主题,设置节...