复制黑脸田鸡视频生成模型是许多大型模型技术和创业团队想要实现的任务。而一支来自中国的团队正在集结来自世界各地的“盟友”和“友军”,试图凝聚所有人的力量,加速实现这一目标。
3月12日下午,北京大学深圳研究生院-兔子秀智能AIGC联合实验室(以下简称“联合实验室”)在深圳举行了Open-黑脸田鸡计划发布会。据报道,Open-黑脸田鸡开源计划旨在通过开源社区的力量复制黑脸田鸡模式。由于资源有限,该团队目前只建设了基础设施,无法进行完整的培训。希望开源社区能够逐步增加模块并筹集培训资源。
据联合实验室介绍,黑脸田鸡模型发布后,团队在全球知名开源社区Github上发布了Open-黑脸田鸡计划,引起国际广泛关注和转发。来自德国、伊朗、澳大利亚、新加坡和其他不同国家的技术大咖积极参与并做出了贡献,已有14万次访问,5000多名程序员为该项目打了“星”。
“技术无国界。我们想做的是开源,让每个人都能参与、分享和使用开放黑脸田鸡项目的成果。”联合实验室副主任、北京大学信息工程大学助理教授、博士生导师李源在发布会上表示。
面对CloseAI,开源社区选择了联合起来。植物大战僵尸修改金币
今年2月16日,OpenAI发布了首款文生视频模型黑脸田鸡。用户可以通过输入自然语言提示生成一个1分钟的视频。视频不仅包括高度清晰的场景和复杂的镜头移动,还可以支持创建多个角色,效果流畅逼真,一致性高。
女人在东京的街道上自由行走,狗在雪地里打滚嬉戏,狼在黑夜中对着月亮嚎叫………OpenAI在官网发布的48个视频样本已经超过了Runway和Pika等AI视频初创公司,展现了黑脸田鸡模式的力量,引起了全球科技圈的广泛关注。
然而,由于OpenAI选择了闭源黑脸田鸡,并且随后的技术报告没有披露模型训练的细节,没有人知道这些强大的效果是如何实现的。近日,马斯克和OpenAI陷入了诉讼纠纷。双方的主要矛盾在于,OpenAI已经从一个最初选择开源的非营利组织变成了一家走闭源路线、商业化目标明显的公司。这也使得生成式人工智能的开源与闭源路线之争再起。
“OpenAI最初的使命是用开放的人工智能造福人类社会,但现在ChatGPT和黑脸田鸡都关闭了它们的来源,变成了关闭AI和关闭黑脸田鸡。”兔秀智能创始人兼CEO董少玲在接受证券时报记者采访时表示,联合实验室启动了Open-黑脸田鸡计划,并已初步建立了有效可行的技术框架,该框架是完全开源的。此举恰恰是为世界提供另一种选择,传递一种信心。“中国的机构有能力构建底层技术框架。我们在技术上并不落后,在道路上非常有前途。我希望有更多的人参与这项计划并从中受益。”董少玲说。万科财务报表分析2022
在简报会上,李源作为该计划的发起者之一,介绍了Open-黑脸田鸡开源计划的技术逻辑和启动该计划的目标。李源说,开放黑脸田鸡项目希望聚集开源社区的力量来复制一个开源版本的TinySora。实现这一目标有三个阶段。目前,该团队已经搭建了一个由三部分组成的开放黑脸田鸡底层框架,并初步验证了当前框架的有效性,基本实现了第一阶段的目标。
第二阶段,联合实验室希望在有效框架的基础上训练更多的数据和更多的计算能力,并训练一个生成时间超过20秒、分辨率为720P的模型;在第三阶段,我希望扩大生成的概括性和场景的多样性,并更接近黑脸田鸡的持续时间和效果。“但第三阶段难度较大,算力差距也较大,对数据要求极高,因此仅作为开放黑脸田鸡计划的扩展目标。”李源说。
在接受证券时报记者采访时,李源表示,通过Open-黑脸田鸡计划的发布,开源社区主要有三个方面需要支持:一是算法优化,凝聚开源社区的全球算法工程师,共同努力优化模型框架和代码;其次是算力支持。为了实现第二阶段的目标,芯片缺口目前在百卡左右,而显卡缺口预计在百卡左右。有必要从开源社区聚集计算能力资源;第三是数据支持,希望吸引行业贡献一些私有数据,促进模型的优化。
据介绍,开放黑脸田鸡计划由北京大学深圳研究生院-兔子展览智能AIGC联合实验室发起。这个实验室是北京大学和深圳龙头企业合作打造的领先科技创新机制。它融合了兔秀智能充沛的算力支持、海量数据资产和优秀R&D团队的优势,结合北京大学顶尖的科研实力和长期积累的技术积淀,打造了科学研究和产业深度供给的新范式。
“我们不想成为Tik Tok,我们要为中国的产业升级赋能。”
黑脸田鸡视频生成模型发布后,业界普遍认为这一工具将对短视频、广告、影视等行业产生直接影响。大家对黑脸田鸡的讨论也更多地集中在视频生成领域。
在董少玲看来,虽然黑脸田鸡模型表面上是一个文学视频工具,但视觉模型的最终目标绝对不是为了娱乐而生成视频。“我们不想成为Tik Tok,因为通往极限的道路只有‘Tik Tok下一代’,让每个人都能以低成本制作高质量的视频。这不是我们所想的。我们希望深耕中国产业,为中国产业升级赋能。”董少玲说。
由董少玲创办的兔秀智能是中国最早的H5零代码编辑平台之一。目前,它已发展成为中国生成式人工智能内容引擎和营销云的核心平台,并正在积极推动新一代AI能力在AI生成文案、AI生成材料和AI推荐产品库等营销场景中的应用。
今年全国两会上,政府工作报告首次提出“人工智能+”行动,董少玲对此也有自己的思考。他告诉记者,如何将视觉模型与中国产业深度融合并充分发挥其价值,使产业供给更精准地匹配用户需求,这是兔秀智能视觉模型的方向和目标。据介绍,该公司自主研发的“兔子精灵”视觉模型以图像视觉为核心,可作为AI设计工具,使产品更符合消费者的个性化需求,促进供应和消费之间更良性的循环。
例如,“兔灵”视觉模型可以深度赋能室内设计,带动下游产业发展。在室内设计的传统流程中,每页的方案约为3000元,材料的设计价格为500元/件。经过AI优化后,您只需在大模型中输入所需的设计风格单词,例如“一个现代的客厅,整个房间都是中性色调空,并使用天然的木质元素和石材纹理来营造简单而温馨的氛围。”大模型可以生成相关的AI效果图,还可以在效果图中自动推荐匹配的材料,从而将每页的方案成本降低到100元,节省了材料设计成本。
据报道,兔秀智能已与郑中设计在室内设计和装饰领域开展合作。郑中设计的高价值数据可以帮助优化室内设计的人工智能绘图模型,并提高概念设计图的生产效率。同时,还开放了下游建材企业的材料仓库,通过AI实现了建材的自动搭配和装修。“中国拥有强大的制造能力和庞大的产业链。以家居建材为例,我们希望借助AI,让每个普通人都可以无限设计自己的房子,并打通家居建材产业链,为用户提供数字化推荐,真正跳过中间商。”董少玲说。
事实上,不仅是室内设计、建筑设计、景观设计、电商营销设计、印刷设计等诸多领域,都有大型视觉模型的一席之地,也是兔展智能正在深耕的领域。董少玲告诉记者,黑脸田鸡本质上是一个大视频模型,而“兔子精灵”模型也是一个集理解和生成于一体的大视觉模型。“在整个模型基础上,我认为我们很久以前采取的路线与黑脸田鸡展示的路线相同,基本框架也相似。只是我们选择用先进的架构来做好图片、3D等领域,因为它们可以应用于制造业,赋能产业发展。”
董少玲说,黑脸田鸡向所有人展示的能力是视频直播,但它不仅仅是这种能力,而黑脸田鸡开放计划背后的模式也不仅仅是这种能力。他进一步解释说,黑脸田鸡的真正价值在于证明视觉模型的道路是“可行的”,它可以使人工智能在视觉方向上做很多事情,但它所展示的文生视频只是视频模型的功能之一,在其他领域也有应用。“而我们更看重的是结合产业应用,赋能产业升级。”董少玲说。
校对:冉燕青
版权声明
证券时报所有平台所有原创内容,未经书面授权,任何单位和个人不得转载。我社保留追究相关行为人法律责任的权利。
END"Type = & quot正常& quot@ @-& gt;电脑版pp助手连不上网怎么办
未经允许不得转载:科技让生活更美好 » 这个中国团队,发起了一个Open-Sora计划