注册 简体 繁体
闽南网 > 新闻中心 > 财经新闻 > 正文

清华团队国产“Sora”火了 融资额已达数亿元

来源:证券时报 2024-04-28 08:33 http://www.mnw.cn/

  时隔两个月,清华团队打造了一个中国版的Sora视频大模型。

  4月27日,在中关村论坛未来人工智能先锋论坛上,中国首个长时长、高一致性、高动态性视频大模型Vidu正式发布。这一模型由清华大学和大模型创业公司生数科技联合发布,可以一键生成长度达16秒、分辨率为1080P的高清视频内容。

  证券时报记者独家获悉,清华大学人工智能研究院副院长、生数科技首席科学家朱军在Vidu发布后发声表示:“Vidu,we do, we did, we do together!感谢小伙伴们日以继夜的坚持,在实验室架构上开花结果。”据介绍,这也是自OpenAI发布Sora以后,全球率先取得重大突破的视频大模型。

  Sora发布后,行业内一直有团队宣称要追赶和复现Sora,而Vidu团队用两个月的时间率先跑出来。记者梳理发现,生数科技在多模态大模型领域已经有较深的积累,也是目前多模态大模型赛道估值最高的初创公司之一。目前公司已完成三轮融资,融资额达数亿元人民币,投资方包括启明创投、智谱AI、BV百度风投、锦秋基金等一众机构。

  对标Sora,生成视频连贯高清

  “画室里的一艘船驶向镜头”,只需要输入这样一句简单的指令,即可以生成效果逼真、镜头连贯的一段视频。在生数科技发布的Vidu模型生成视频样片中,视频的整体质感几乎可与Sora相媲美。

  据生数科技介绍,Vidu模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。“U-ViT架构早在2022年9月就由团队提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。”生数科技表示。

  记者注意到,今年3月生数科技完成新一轮融资后,公司就公开表示,虽然Sora的出现表明美国在多模态大模型领域具有领先性,“但中国也并非完全从零开始的阶段”。据介绍,朱军在2023年1月就提出了基于Transformer的多模态扩散大模型UniDiffuser,采用了U-ViT,该架构与Sora的架构路线完全一致,区别在于UniDiffuser主要应用于图像生成任务,但也可以以此为基础进行视频任务的拓展。

  正是基于在机器学习和多模态大模型的长期积累,团队才能够在短短的两个月时间里突破了长视频表示与处理的多项关键技术,成功研发推出Vidu视频大模型。朱军在Vidu模型发布现场表示,Vidu主要有以下方面的特点与优势:

  一是模拟真实物理世界,可以生成复杂、细节丰富的场景,光影效果与人物表情都能够符合真实的物理规律。

  二是富有想象力,可以虚构场景以及想象超现实主义的画面。

  三是具有多镜头语言,不再局限于固定镜头,能够在遵循主体一致性的情况下实现远景、近景、中景、特写等不同镜头的动态切换,还可以实现长镜头、追焦等效果。

  四是有出色的视频时长,能支持16秒长度的视频生成,保持镜头和主体的连贯一致。

  五是能理解中国元素,可以更好地理解生成熊猫、龙等富有中国文化特色的形象。

  背后团队来自清华,已融资数亿元

  Vidu的背后,是一家来自清华的明星创业公司生数科技。

  公开资料显示,生数科技成立于2023年3月,核心成员来自清华大学人工智能研究院,致力于自主研发世界领先的可控多模态通用大模型。公司的CEO本硕就读于清华大学计算机系的唐家渝,首席科学家由清华人工智能研究院副院长朱军担任,CTO鲍凡则是清华大学计算机系博士生、朱军教授的课题组成员,长期关注扩散模型领域研究。

  记者注意到,今年3月,唐家渝曾在沟通会上向媒体表示,今年内公司的大模型一定能达到Sora目前版本的效果,“但很难说是三个月还是半年”。然而,Vidu却提前交出了一份令人惊艳的考卷,这主要得益于团队是国内最早布局多模态大模型的团队之一,多年以来在这一领域形成了深厚的积累。

  据唐家渝介绍,生数科技目前采取模型层和应用层两条路走路的模式。一方面,构建覆盖文本、图像、视频、3D 模型等多模态能力的底层通用大模型,面向B端提供模型服务能力;另一方面,面向图像生成、视频生成等场景打造垂类应用,按照订阅等形式收费,应用方向主要是游戏制作、影视后期等内容创作场景。

  记者梳理发现,生数科技自成立以来就备受资本关注。天眼查数据显示,生数科技目前共完成3轮融资。2023年6月,完成近亿元人民币天使轮融资,投资方包括蚂蚁集团、BV百度风投、卓源亚洲、卓源资本;2023年8月,完成数千万人民币天使+轮融资,投资方为锦秋基金;2024年3月,完成数亿元人民币A轮融资,投资方除了启明创投、达泰资本、智谱AI等新机构以外,还有BV百度风投、卓源亚洲两个老股东。

  在三轮融资总计数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。生数科技表示,Vidu的问世不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证,也代表了生数科技在多模态原生大模型领域的持续创新能力和领先性。

原标题:中国版Sora来了!清华打造!背后创业公司已融资数亿元
责任编辑:曾少林
相关阅读:
新闻 娱乐 福建 泉州 漳州 厦门
猜你喜欢:
热门评论:
频道推荐
  • 山西省纪委监委公开通报5起违反中央八项规
  • 柯文哲再押两个月,陈佩琪崩溃哭喊:要把他
  • 徐芝文任四川省人民政府副省长​
  • 新闻推荐
    @所有人 多项民生礼包加速落地快来查收 三峡大坝变形?专家:又有人在恶意炒作 北京新一波疫情为什么没出现死亡病例? 戴口罩、一米线 疫情改变了哪些习惯? 呼伦贝尔现幻日奇观 彩虹光带环绕太阳
    视觉焦点
    石狮:秋风起,紫菜香 石狮:秋风起,紫菜香
    石狮环湾生态公园内粉黛乱子草盛放 石狮环湾生态公园内粉黛乱子草盛放
    精彩视频
    医解百科︱痛风能不能喝酒?(视频)
    医解百科︱痛风能不能喝酒?(视频)
    世遗泉州|名居·中宪第:三百年红砖古厝里的海峡情缘(视频)
    世遗泉州|名居·中宪第:三百年红砖古厝里的海峡情缘(视频)
    专题推荐
    关注泉城养老服务 打造幸福老年生活
    关注泉城养老服务 打造幸福老年生活

    闽南网推出专题报道,以图、文、视频等形式,展现泉州在补齐养老事业短板,提升养老服

    新征程,再出发——聚焦2021年全国两会
    2020福建高考招录
     
    48小时点击排行榜
    南方今年来最强降雨来袭 今明厦门市有暴 厦门首次!咪咕新空入选全国成长性文化企 徐芝文任四川省人民政府副省长​ 柯文哲再押两个月,陈佩琪崩溃哭喊:要把 海报丨泉州产业蝶变密码:深耕数字沃土 A 山西省纪委监委公开通报5起违反中央八项 安溪召开内外贸高质量发展指挥部工作调度 鹿晗ins晒与山下智久合照 配文:追星成功

    版权声明 | 关于我们 | 联系我们 | 广告服务 | 网站地图 | 回到顶部 关注福建闽南网官方微博

    电话:0595-28985153 传真:0595-22567376 地址:福建省泉州市丰泽区田安南路536号五楼 站长统计 在线QQ客服

    CopyRight ©2019 闽南网由福建日报社(集团)主管 版权所有 闽ICP备10206509号 互联网新闻信息服务许可证编号:35120190010

    闽南网拥有闽南网采编人员所创作作品之版权,未经闽南网书面授权,不得转载、摘编或以其他方式使用和传播。