Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以...
Kohya_ss 是公认推荐训练 Stable Diffusion 模型的可视化工具,尤其在 windows 平台支持比较好,经过尝试在 linux 直接使用可能会遇到各种环境原因的问题,创建虚拟环境使用 conda 创建虚拟环境,避免在 kohya_ss 安装过程,重新安装的 pytorc...
Tabby 简介Tabby是一个自托管的AI编码助手,提供了一个开源的、可本地部署的GitHub Copilot替代品。Tabby拥有以下几个特点: 1. 自托管:Tabby是一个自托管的解决方案,不需要依赖于第三方云服务或DBMS,用户可以完全掌控和管理自己的数据和代码。2. 开源:Ta...
上篇文章《[[AIGC 实战(环境篇) - EXSI 8.0 Debian安装RTX3060显卡驱动|AIGC 实战(环境篇) - EXSI 8.0 Debian安装RTX3060显卡驱动]]》详细解释了怎么在 exsi 8.0 虚拟中安装 debian 系统,并配置相应 N 卡驱动。本篇记录如何部...
经过 SDXL0.9 和 SDXL Beta 的迭代,终于 SDXL1.0 正式版发布了!之前使用 AIGC 生成图片,一般都是生成 512512 的图,然后再进行放大,以达到高清出图的要求。但是这里有个问题是底模其实都是海量的 512512 图片训练出来的,所以出图效果上经常不如人意,在细节上...
Github:GitHub - ddean2009/MoneyPrinterPlus: AI一键批量生成各类短视频,自动批量混剪短视频,自动把视频发布到抖音,快手,小红书,视频号上,赚钱从来没有这么容易过! 支持本地语音模型chatTTS,fasterwhisper,GPTSoVITS,支持云语音:...
[!quote] 背景CosyVoice,这一由阿里通义实验室于七月初发布的开源语音合成大模型,展现了在自然语言合成领域的独特实力。它不仅支持包括中文、英文、日语、粤语和韩语在内的五种不同语言,更在多音色和丰富情感的语音生成方面设立了新的标杆。CosyVoice令人称赞的一个特点是其...
1 - ComfyUI 介绍最强大、模块化的稳定扩散 GUI 和后端。该用户界面将允许您使用基于图形/节点/流程图的界面设计和执行高级稳定扩散管道。2 - ComfyUI Github 地址https://github.com/comfyanonymous/ComfyUI3 - 部...
1、在安装 win11 时,如果提示以下信息,则表示虚拟机的 TMP 不可用,可通过修改注册表的方式跳过验证,点击对话框左上方的 " 后退 " 按钮2、按下 Shift+F10 组合键调出管理员 cmd 窗口3、添加注册表信息有两种方法,一是直接在控制台输入注册表信息,二是打开注册表窗口...
使用 Exsi 8.0 搭建 Debian 系统,目的是为 搭建 Stable Diffusion 等 AIGC 工具,并通用软件路由 Openwrt 的 ddns 与 端口转化,实现局域网及外网内均可使用。所需工具:exsi 8.0debian 12 的 isoExsi 设置...