1. 智谱清影
智谱清影是智谱AI推出的AI视频生成工具,能根据用户输入的文本或上传的图片快速生成视频内容。在文生视频方面,只需输入文本描述,清影能自动生成相应的视频,支持10秒、4K、60帧的高清视频输出。基于CogVideoX模型,能理解文本中的语义、情感、意图和上下文,构建视频场景、生成角色动作,设计情节发展。清影还提供多种视频风格选项和背景音乐,增强视频的视觉效果和沉浸感。
🚀功能亮点
- 快速生成视频:用户输入文本描述后,清影能在30秒内生成一段10秒长的4K、60帧高清视频。
- 文本解析能力:清影的AI能解析自然语言文本,理解其中的语义、情感、意图和上下文,从中提取关键信息,如主题、场景、角色、动作等,用于指导视频生成。
- 视频内容创作:根据文本描述构建视频场景,创造虚拟角色,为其分配动作和表情,设计视频的情节发展。
- 风格与效果定制:可以选择不同的视频风格,如现实主义、卡通、抽象等,进行色彩调整、滤镜应用、特效添加等,增强视频的视觉效果。
- 细节处理:确保视频中角色的动作流畅且自然,为视频添加背景音乐和音效,增强沉浸感。
- 电影级效果:支持10秒时长和任意比例视频,提供4K、60帧高清视频输出。
- 模型能力全面提升:CogVideoX模型能理解复杂prompt,保持人物等主体的连贯性,效果更逼真。
- 自带音效:引入CogSound模型,能自动根据视频内容生成匹配的音效。
- 添加背景乐:清影支持给视频添加背景音乐,提供多种风格的音乐选择。
- 全民免费使用:清影的基础功能对所有用户免费开放,支持API调用,方便开发者和企业使用。
🌐官网地址:智谱清影
2. 即梦AI
即梦AI是字节推出的一站式AI创作平台,文生视频功能主要分为图片生视频和文本生视频两大类。在提示词输入框内详细描述视频内容,选择视频模型,视频风格,时长和视频比例等参数。即可自动生成连贯,视觉冲击力强的视频内容。
🚀功能亮点
- 生成速度快且质量高:即梦AI更新了全新的视频生成模型2.0版本,如视频S2.0,更快的生成速度同时兼顾高品质效果;视频S2.0 Pro,更合理的动效,更生动自然的运镜。视频生成速度领先国内业界,仅需60秒即能生成时长5秒的高质量AI视频。
- 精准响应提示词:视频P2.0 Pro能精准响应提示词,支持生成多镜头,用户可通过详细描述视频内容、动作方式等,生成符合期望的视频。
- 故事创作模式:根据用户输入的关键词或主题,即梦AI能自动生成富有创意的故事,用户可根据这个故事进行进一步的视频创作。
- 多风格选择:在文本生视频时,有写实、卡通、油画等多种风格可供选择,不同风格会带来截然不同的视觉效果。
🌐官网地址:即梦AI
3. 讯飞绘镜
讯飞绘镜是科大讯飞推出的AI文生视频创作平台,能将用户输入的文本描述自动转换成视频内容,如短剧、预告片、音乐视频等。用户只需输入创意描述,平台能自动生成脚本和分镜画面,将静态分镜转化为动态视频。讯飞绘镜提供7类视频生成模型供用户选择,AI智能生成的动作与故事脉络紧密契合,即使不输入提示词,也能推动情节自然发展。
🚀功能亮点
- 高效创作流程:仅需4步即可实现从创意描述到完整视频生成的全流程。用户输入创意后,平台能自动生成脚本和分镜画面,将静态分镜转化为动态视频,提供镜头编排、对白补充、音乐添加等功能,让视频更具表现力。
- 脚本生成专业:基于讯飞星火大模型,将创意扩写为脚本,采用6种经典叙事模式来保障内容的生动有趣。
- AI绘分镜智能:讯飞星火大模型将脚本划分为合理视频场景,进一步拆分为专业分镜,生成的分镜描述和画面一起呈现,用户可随心调整,支持分镜自动补充,确保镜头叙事完整流畅。
- 视频生成多样:提供7类视频生成模型供用户选择,AI智能生成的动作与故事脉络紧密契合,即使不输入提示词,也能推动情节自然发展。还提供对比预览模式,创作者可对比单个分镜的不同模型生成效果,准确选择最佳素材。
- 视觉风格丰富:定制12种风格各异的视觉风格,用户快速选择适合的风格,仅需简洁描述,无需在众多工具与资源间徘徊,一站搞定创意素材。
🌐官网地址:讯飞绘镜
4. 通义万相
通义万相是阿里推出的AI视频生成工具,2.1版本在视频生成方面有重大突破,文字视频生成功能首次实现了中文文字视频生成功能,用户可输入文字描述,生成带有相应文字特效的视频。同时支持中英文文字特效生成,可通过简短的文字描述生成具有电影级效果的文字和动画。通义万相2.1还支持多种视频特效选项,增强视觉表现力。
🚀功能亮点
- 首创中文文字生成:通义万相2.1是业界首个实现中文文字视频生成的模型,解决了以往AI视频生成中难以攻克的汉字生成难题。能生成具有电影级效果的文字和动画。
- 复杂运动处理出色:在大幅度复杂运动、物理规律遵循等方面有显著提升,能稳定展现复杂人物运动,如仰卧起坐、旋转等动作,避免出现肢体扭曲、违背物理定律的情况 。
- 艺术表现力强:具备强大的影视质感与艺术风格转换能力,可一键生成具有高级质感、多种风格的视频,支持5种不同的长宽比,能匹配电视、电脑、手机等不同终端设备 。
- 支持中英文文字特效生成:支持中文文字生成,能同时支持中英文文字特效生成,满足广告设计、短视频等领域的创作需求 。
- 长文本指令遵循能力提升:能准确理解各种不同的想法、元素或者风格,将其组合在一起,创造出全新的视频内容 。
- 多种视频特效选项:提供多种视频特效选项,如过渡、粒子效果、模拟等,增强视觉表现力 。
- 多种比例支持:支持16:9、9:16、3:4等多种视频比例生成,提供更多样的创作空间。
🌐官网地址:通义万相
5. 可灵AI
可灵AI是快手推出的AI创意生产力平台,在文生视频方面,支持用户通过文本描述生成高质量的视频内容,视频质量可达1080P,能生成长达3分钟的创意视频。精确捕捉3D动画中毛发的细节,具备一键续写功能,可以延长视频运动延续时间。可灵AI采用了先进的3D时空注意力机制,使视频中的运动更加自然流畅,模拟物理世界的效果更加逼真。
🚀功能亮点
- 3D时空联合注意力机制:可灵AI基于这种机制,能更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时符合运动规律。
- 长达2分钟的视频生成:得益于高效的训练基础设施和推理优化,可灵AI能生成长达2分钟的视频,帧率达到30fps。
- 模拟物理世界特性:基于自研模型架构及强大建模能力,可灵AI能模拟真实世界的物理特性,生成符合物理规律的视频。
- 强大的概念组合能力:基于对文本-视频语义的深刻理解和Diffusion Transformer架构,可灵AI能将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的场景。
- 电影级的画面生成:可灵AI支持1080p高清视频输出,满足用户对高质量视频的需求。
- 视频续写功能:可灵AI提供了视频续写功能,可以为已生成的视频提供便捷的一键续写和连续多次续写,将视频最长可延伸至约3分钟。
- 高分辨率输出:可灵AI支持1080p高清视频输出,且帧率可达30fps,满足用户对高质量视频的需求。
- 自由宽高比支持:可以根据自己的需求设置视频的宽高比,使生成的视频更加符合应用场景。
🌐官网地址:可灵AI
6. 腾讯混元文生视频
腾讯混元文生视频是腾讯推出的AI视频生成模型,能根据文本提示生成相应的视频内容。模型拥有130亿参数量,是目前市场上最大的视频开源模型之一。用户只需输入一句话,系统能自动转化为视频,支持中英文双语输入,提供多种视频尺寸和清晰度选项。在画质、物体运动、镜头切换等方面表现出色,能理解和遵循复杂的提示词,生成具有大片质感的视频。
🚀功能亮点
- 超写实质感:混元视频在视觉效果上呈现出非常高的真实感,在光影、色彩和细节处理上,几乎没有任何AI视频常见的抖动或瑕疵。
- 高语义一致:混元视频能精准地理解复杂的语义指令,能处理具体的场景和细节。
- 运动画面流畅:混元支持镜头切换功能,用户可以自主控制镜头角度的变化,比如从广角镜头切换到特写镜头,增强画面的张力和视觉效果。
- 多语言支持:混元视频支持中英文双语输入,能理解和生成对应语言的视频。
- 高清画质与镜头切换:生成的视频具有高清画质,能实现流畅的镜头切换,增强视频的动态感和连贯性。
- 物体运动和场景模拟:模拟物体运动和场景变化,生成自然和符合物理规律的视频。
- 多镜头生成:能根据文本提示生成多个镜头,实现镜头之间的自然切换。
- 多动作生成:支持生成同一个主体的多个连贯动作,提供更丰富的视频内容。
- 氛围感营造:能根据提示词营造特定的氛围和风格,增强视频的情感表达。
- 遵循复杂提示词:对复杂的提示词有较好的遵循能力,能生成用户预期的画面。
🌐官网地址:腾讯混元文生视频
7. 跃问视频
跃问视频是阶跃星辰推出的AI视频生成工具,用户只需输入简洁的文字描述,能一键生成最长10秒的高质量视频。还提供多种主题,涵盖城市、科幻、自然等,用户可按需选择。工具的描述优化功能可一键优化输入内容,让生成的视频更精准贴合需求。
🚀功能亮点
- 一键生成高效便捷:用户只需输入文字描述或选择主题,可一键生成最长10秒的视频,降低了视频制作的门槛,提高了创作效率。
- 多样化创意主题丰富:提供城市、科幻、自然、跑车、美食等多种视频主题,满足用户多样化的视频创作需求,能够适应不同场景和风格的创作。
- 灵感切换打破瓶颈:通过“换一批”按钮,用户可以快速查看其他创意视频,打破创作瓶颈,获取更多灵感,激发创意。
- 视频描述优化提升质量:具备视频描述优化功能,用户在输入提示词之后,AI可以自动一键优化生成的视频描述,使视频内容更精准、更具吸引力和传播力。
- 高质量视觉效果呈现:基于先进的AI技术和图像合成技术,生成的视频内容质量高、画面流畅、色彩丰富,能呈现出极具吸引力的动态画面。
- 美学风格表现突出:在美学风格方面,尤其是在中国风题材上表现尤为突出,能精准理解和生成符合古诗意境的内容。
- 运动控制性能优异:展现了优异的运动控制性能,能生成符合物理运动规律的视频
🌐官网地址:跃问视频
8. Etna
Etna是七火山科技推出的AI文生视频工具,能根据文本描述生成8至15秒的4K高清视频内容,帧率高达60fps。基于先进的Diffusion模型架构,融合时空卷积和注意力层,具备出色的时空理解能力,能处理视频数据中的时间连续性。Etna在大规模视频数据集上进行训练,使用了包括LDS大规模训练、HPO超参数优化和DPO微调等深度学习技术策略,确保了强大的性能和生成能力。
🚀功能亮点
- 文本到视频生成:Etna能根据用户提供的简短文本描述自动生成相应的视频内容,实现从文本到视频的转换。
- 高清晰度视频输出:支持生成高达4K分辨率(3840*2160)的视频,确保画面细腻逼真。
- 流畅的帧率:视频帧率高达60fps,视频播放流畅自然。
- 时空理解能力:通过时空卷积和注意力层,Etna能理解处理视频中的时间连续性,生成连贯的视频叙事。
- 先进的技术架构:基于Diffusion架构,结合时空卷积和注意力层,Etna在语言模型和图像模型中插入了先进的深度学习技术。
- 大规模数据集训练:Etna在一个大规模的视频数据集上进行训练,有助于提高模型的生成质量和多样性。
🌐官网地址:Etna
9. Video Ocean
Video Ocean是基于人工智能技术的视频生成工具,文生视频功能,支持用户输入文本描述来生成视频内容。能准确理解用户的意图,转化为视觉元素。支持复古风格的黑白电影场景,或现代都市中的浪漫邂逅,Video Ocean能以惊人的细节和真实感呈现出来。可以自定义人物和场景,生成逼真的短视频内容,甚至创造超现实画面,如让一只熊猫在舞台上拉小提琴。
🚀功能亮点
- 逼真内容生成:Video Ocean能根据输入的文字描述生成逼真的短视频内容,支持自定义人物和场景,创意可以即刻呈现。
- 超现实画面创造:平台具备创造超现实画面的潜力,例如让一只熊猫在舞台上优雅地拉着小提琴,或者让番茄在生菜叶上享受冲浪的乐趣,解锁创意的无限可能。
- 电影级视觉体验:Video Ocean能一键创造电影级视觉体验,捕捉类似《沙丘》般的电影质感,穿越狂野的西部世界,或展现巾帼不让须眉的刚毅如松等场景。
- 指令响应:用户可以通过简单的指令来生成视频,如让照片中的人物做出特定动作或表情,Video Ocean能根据这些指令生成相应的视频。
- 个性化视频故事:用户可以基于特定的主题或故事线,基于Video Ocean的工具创作独特的视频故事,满足各种创意需求。
- 人物一致性处理:Video Ocean确保视频中人物形象的一致性,使视频内容连贯自然,维持视频叙事的连贯性。
🌐官网地址:Video Ocean
10. 艺映AI
艺映AI是MewXAI团队推出的AI视频创作工具,特别擅长文生视频(Text to Video)功能。只需输入描述性文本,AI能自动生成相应的视频内容,适合快速制作短视频。支持多种视频参数设置,如风格、比例、时长等,满足不同创作需求。通过简单的文字描述,用户可以创作出故事短片或文学类视频,将文本故事转化为视觉形式。艺映AI的文生视频功能,从想象到具象的创作过程变得更加便捷和高效。
🚀功能亮点
- 文本到视频的转换:用户只需输入描述性文本,AI自动生成相应的视频内容。适合快速制作短视频,将文本故事转化为视觉形式。
- 多样化的视频风格:艺映AI支持多种视频生成方式,视频风格多样且效果稳定,用户可以根据需求选择不同的风格。
- 简单的操作流程:用户在指定界面输入文字,系统根据文字内容生成相应的视频动画,操作简单快捷。
- 视频参数设置:在文生视频功能中,可以选择视频的一些参数,比如风格、比例、时长等,从而实现个性化的视频创作。
- 多平台支持:艺映AI支持手机和电脑多平台账号同步,视频创作不受设备限制。
🌐官网地址:艺映AI
11. 白日梦
白日梦是光魔科技推出的AI视频创作平台,基于自然语言处理技术,支持用户输入文本内容,快速生成视频,最长可生成6分钟的视频。平台的核心功能包括文生视频、动态画面、AI角色生成,保持人物和场景的一致性。适合创作儿童绘本和连环画,提供简单易用的创作工具,让创意快速转化为可视化的视频内容。白日梦支持多种视频风格,如国风仙侠、AI短剧、萌宠星球等,满足不同用户的创作需求。
🚀功能亮点
- 文本到视频转换:用户只需输入文字描述,AI能理解其内容,自动生成视频,最长可生成6分钟的视频,无需用户具备视频制作技能。
- 动态画面生成:白日梦AI能快速生成动画效果或动态插图,帮助用户轻松实现创意视觉化。
- AI角色生成:提供强大的AI角色生成工具,可以根据自己的需求创建独特的角色形象,适用于各类创作场景。
- 人物/场景一致性:在创作过程中,保持人物和场景的一致性至关重要。白日梦AI通过先进的算法,确保每个创作细节都能完美契合。
- 多样化视频创作风格:白日梦AI支持多种视频风格,如新国漫国风、赛博朋克、鬼故事和日式可爱等,满足不同场景的需求。
- 自动化分镜生成:白日梦AI可以提供的视频脚本内容自动生成视频分镜,AI会智能分析文本,设计出合理的镜头切换和场景过渡,适应故事的叙事需求。
🌐官网地址:白日梦
12. Viva
Viva是智象未来推出的免费在线AI创意视觉设计平台,在视频生成方面具有强大的功能。Viva支持文本到视频(Text to Video)和图像到视频(Image to Video)的转换,用户只需输入文字描述或上传图片,Viva AI自动生成相应的动态视频。Viva还提供视频增强功能,能将视频质量提升至4K高清,确保每一帧都清晰动人。Viva的视频生成参数包括5秒的视频长度、支持16:9等多种比例以及24帧的视频帧率。
🚀功能亮点
- 文本到视频(Text to Video):Viva支持根据文本提示生成视频,用户只需输入描述性的文本,Viva自动生成相应的动态视频。
- 视频4K高清:Viva能将视频质量提升至4K高清,确保视频的每一帧都清晰动人。
- 自动优化提示词(Magic Prompt):Viva提供了一个自动优化提示词的功能,帮助用户生成更丰富、更具体的提示词,以改善视频生成的效果。
- 视频增强:除了生成视频,Viva提供了视频增强功能,可以强化初始视频的细节,生成4K分辨率的超清视频。
- 多种视频参数设置:Viva支持多种视频参数设置,如视频长度、比例和运动强度等,提供更多的创作灵活性。
🌐官网地址:Viva
13. Stable Video
Stable Video是Stability AI推出的AI视频生成工具,能根据用户提供的文本描述或静态图像生成高质量的视频内容。在文生视频方面,Stable Video支持用户输入文本提示,AI将根据文字描述生成相应的视频。用户可以输入描述性文案,选择合适的视频宽高比和风格,系统将根据这些参数来生成视频。提供了多种风格和运动参数,Stable Video还提供了图生视频功能,即从静态图像动态化生成视频。
🚀功能亮点
- 文本到视频的生成能力:用户可以输入描述性文案,选择合适的视频宽高比和风格,系统将根据这些参数来生成视频。
- 丰富的风格选择:Stable Video提供了多种预设风格,包括3D模型、胶片电影、动漫、电影化、漫画书、数字艺术等,满足不同用户的个性化需求。
- 高分辨率和帧率支持:Stable Video支持多种分辨率和帧率的输出,满足用户在不同场景下的需求。
- 帧插值技术:在帧数较少的情况下,Stable Video可以使视频看起来更加平滑。
- 3D场景生成:Stable Video支持3D场景生成,支持沿着指定的相机路径创建3D视频,能生成更具空间感的视频。
- 精细的摄像机控制功能:通过LoRA控制摄像机,用户可以精确控制摄像机的位置和角度,实现更加精细的视频创作。
🌐官网地址:Stable Video
14. Haiper
Haiper是原Google DeepMind和TikTok的华人工程师/科学家创立的AI视频生成器,旨在简化视频创作流程。支持文生视频(从文本生成视频)、图生视频(从图像生成视频)和视频重绘等功能。Haiper AI通过输入简短的文字提示描述,能理解用户想法,转化为视频内容,无需复杂的视频编辑技巧。Haiper还支持多种风格的视频生成,如电影、水彩、赛博朋克、印象派、卡通动画、蒸汽朋克等,满足不同用户的审美需求和创意表达。Haiper AI目前支持生成2秒或4秒的视频,后续可能会推出扩展视频时长的功能。
🚀功能亮点
- 文本到视频生成:用户可以通过输入简短的文字提示描述,Haiper AI能理解用户的想法,转化为视频内容。
- 多种风格的视频生成:Haiper支持如电影、水彩、赛博朋克、印象派、卡通动画、蒸汽朋克等多种风格的视频生成,满足不同用户的审美需求和创意表达。
- 视频生成时长选择:Haiper提供视频时长的选择,用户可以根据自己的需求选择生成2秒或4秒的视频内容。
- 免费无限使用:Haiper目前完全免费,不限生成次数,用户可以同时多个任务生成。
- 视频尺寸和风格的选择:用户可以根据需要选择视频的尺寸(如9:16或16:9)和风格。
🌐官网地址:Haiper
15. 奇绘馆 AI视频
奇绘馆AI视频是创新的AI视频创作平台,能将文本或图片转换成高质量的视频内容。在文生视频方面,用户只需输入简单的文字描述,奇绘馆AI视频基于AI技术将描述转换成视频画面,实现从文字到视频的直接转换。文生视频功能支持多种视频风格,包括漫画风格、动态模糊效果等,满足不同用户的创作需求。可以轻松地为社交媒体、小说推文、AI短片等多种场景创作生动的视频内容。
🚀功能亮点
- 文本到视频的直接转换:用户只需输入简单的文字描述,奇绘馆AI视频基于AI技术将这些描述转换成视频画面,实现从文字到视频的直接转换。
- 自然语言处理技术:基于先进的自然语言处理技术,精准捕捉和演绎用户输入的文字内容,转化为生动的视频场景,无论是故事叙述还是情感表达,能呈现出令人惊艳的视觉效果。
- 高质量视频输出:采用业界领先的AI技术,如Pika、Sora、Runway Gen3等,确保生成的视频画质清晰,细节丰富。
- 多样化风格支持:奇绘馆AI视频支持多种视频风格,包括漫画风格、动态模糊效果等,满足不同用户的创作需求。
🌐官网地址:奇绘馆 AI视频