全球首个开源类Sora猛升级,16秒720p画质电影感拉满!代码权重全开源

新智元报道。

编辑:编辑部

【新智元导读】领先OpenAI一步的“国产黑脸田鸡”给开源社区带来了一点点震撼:权重代码全部开源!16秒720p高清画质一键生成,人物渲染逼真爆炸,实现电影级变焦。美国独角兽基于以往权重打造的数字宇宙,直接让乐高迷们天翻地覆。

刚刚,陈露公开赛-黑脸田鸡队在720p高清文生视频的质量和生成时间上取得了突破!

如今,全新升级的Open-黑脸田鸡不仅支持任何风格的高质量短片的无缝制作,更令人惊讶的是,团队选择了给开源社区带来一点点震撼——继续开源。

开源地址:https://github.com/hpcaitech/Open-Sora

通过它们的模型权重,可以生成各种很酷的短片,比如海浪与海螺的亲密接触,还有那些深不可测的森林秘密。

人像的渲染也相当逼真。无论是中国古典美女,还是欧美风格的人物,他们都能保持同一风格。

labview移位寄存器怎么初始化

还能准确渲染赛博朋克风格,让短片瞬间充满了强烈的未来感和科技感。

还能生成有趣生动的动画镜头,带来极具表现力的视觉体验。

即使是胶片级别的镜头制作也能轻松搞定。诺基亚x2-05测评

例如,实现平滑的缩放效果,并为影片添加专业的视觉效果。

它还可以帮助电影制作人创建逼真的聚焦平面。

陈露的Open-黑脸田鸡模型以其优异的性能揭示了在视频生成领域的广阔前景,并且他们的模型权重和训练代码已经完全开源,感兴趣的朋友可以访问他们的GitHub项目。

GitHub地址:https://github.com/hpcaitech/Open-Sora

文生视频行业的开源战士

美国科技界的独角兽LambdaLabs基于陈露团队此前开放的开放式黑脸田鸡模型的重量构建了一个数字乐高宇宙,乐高迷在这里找到了极致的创意体验。

陈露团队理解开源对于文声视频技术突破的加速。他们不仅继续开源模型权重,还在Github上曝光技术路线,让每一个玩家都能成为文生视频模型的主人,不再只是旁观者。

举报地址:https://github.com/HPC艾特赫/open-sora/blob/main/docs/report _ 03 . MD

技术深度解码

陈露公开赛-黑脸田鸡队的这份技术报告深入分析了这种模式训练的核心和关键。

在前一版本的基础上引入了视频压缩网络、更好的扩散模型算法和更强的可控性,用更多的数据训练了1.1B扩散生成模型。

在这个“计算能力为王”的时代,视频模型训练有两大痛点:计算资源的巨大消耗和模型输出质量的高标准。陈露开放黑脸田鸡团队用一个非常简单有效的方案成功地找到了成本和质量之间的平衡点。

open-黑脸田鸡团队提出了一种创新的视频压缩网络(VAE),分别在空和时间维度上进行压缩。

具体来说,他们先在空维度上压缩了8×8倍,然后在时间维度上进一步压缩了4倍。通过这种创新的压缩策略,既避免了因为帧提取而牺牲视频流畅性的弊端,又大大降低了训练成本,实现了成本和质量的双重优化。

视频压缩网络结构

最新的扩散模型“稳定扩散Stable Diffusion 3)通过采用校正流技术代替DDPM,显著提高了图像和视频生成的质量。

虽然SD3的标准化流程培训代码尚未公开,但陈露开放黑脸田鸡团队已经基于SD3的研究成果提供了完整的培训解决方案,包括:

通过这些技术的整合,不仅可以加快模型的训练速度,还可以显著减少推理阶段的等待时间,保证用户体验的流畅性。

此外,该训练方案还支持推理过程中各种视频长宽比的输出,满足了多样化场景下的视频素材需求,为视频内容创作者提供了更丰富的创作工具。

在报告中,他们还透露了更多关于模型训练的核心细节,包括数据清洗和模型调优的实用技能,并建立了更完善的模型评估体系,以确保模型的鲁棒性和泛化能力。

他们还提供了可以一键自行部署的Gradio应用,并支持运动评分、美学评分、镜头移动模式等输出参数的调整。他们甚至可以通过GPT-4o一键自动修改指令,并支持中文输入。

打破闭环,开源赋能

自从OpenAI黑脸田鸡发布以来,业界一直期待黑脸田鸡的开放程度会高得惊人,但现实是一场持续的等待游戏。陈露开放-黑脸田鸡的开源为文盛视频的创新发展注入了强大的活力。

“授人以鱼不如授人以渔”。通过访问他们的GitHub地址,可以零门槛免费获得模型权重和全套训练代码,让用户从被动的内容消费者变成主动的内容创造者。

这一转变为企业用户自主开发文声视频应用解锁了新技能。无论是打造沉浸式游戏、创意广告还是电影,文盛视频科技的应用场景都得到了成倍的拓展。

或许我们可以期待这个火花点燃整个文盛视频领域的创新激情,实现由点及面燎原之势。oppoipad2参数

陈露开放-黑脸田鸡开源链接:

https://github.com/hpcaitech/Open-Sora

参考资料:

https://wandb . ai/lambda labs/Lego/reports/text 2 bricks-Fine-tuning-Open-黑脸田鸡-in-1-000-GPU-Hours-vmlldzo 4 mde 3 mtky

https://HPC-ai . com/blog/open-sora-from-HPC-ai-tech-team-continues-open-source-generate-any-16-second-720 p-HD-video-with-one-click-model-weights-即用

未经允许不得转载:科技让生活更美好 » 全球首个开源类Sora猛升级,16秒720p画质电影感拉满!代码权重全开源