万博体育利好来了!阿里开源文生视频模型万相21!行业受益公司名单出你知道?阿里巴巴的万相2.1模型不仅在视频生成领域横扫国际竞争对手,还实现了全球首个支持中文特效的视频生成。这意味着,我们可以用中文输入生成带有水墨晕染效果的视频,这可真是让人耳目一新!想知道这项技术背后还有哪些惊人的创新?快来继续阅读!
并且在运动幅度、多对象生成、空间关系等关键指标上,万相2.1都远远领先于Sora、Luma等国际顶尖模型。
也就是说,阿里巴巴万相2.1模型可以将用户输入的中文文字,在生成的视频中实现“听得见”的特效,比如生成水墨晕染文字等东方美学表达。
据阿里巴巴官方数据,阿里Qwen系列模型的蒸馏模型数量已经突破十万,这一数据在全球范围内都没有任何竞争对手。
根据公开信息,目前全球第二名的AI模型蒸馏数量也不过4万,而阿里Qwen系列的蒸馏数量足足是第二名的25倍。
其中最大的功劳就是阿里巴巴自研的因果3D VAE架构,该架构被称为文生视频领域的一项颠覆性突破,可以让文生视频处理不再受时长限制。
也就是说,因果3D VAE架构让1080P视频的处理不再需要分段完成,只需要一键操作,就可以高效编解码。
因果3D VAE架构的出现,不仅提升了文生视频的生成质量,也提升了处理速度万博体育全站ManBetX,为文生视频的应用打开了更多可能性。
就在阿里巴巴宣布万相2.1模型开源的前一天,也就是2月24日,阿里巴巴还在投资者日上宣布了一项3800亿元的AI基建投资计划。
这项计划将会在未来三年内,把3800亿元投入到AI基建建设中,并且其中的一部分资金会专门用于打造世界级的大模型。
而3800亿元的投入,无疑是一个非常庞大的资金规模,即使放眼整个世界,也是一个非常庞大的数字。
即使是全球市值最高的公司特斯拉,也才2700亿美元,而阿里巴巴此次投资规模,就相当于特斯拉市值的一半还多。
这样的投资规模,不仅展现了阿里巴巴对未来AI领域发展的信心,也为万相2.1模型的开源提供了资金保障。
但是,这样的投资计划也并没有给阿里巴巴股价带来什么积极影响,在宣布投资计划后的第二天,美场开盘后,阿里巴巴股价就直接大跌超10%。
这已经是美国方面第二次对阿里巴巴发布调查令,在去年12月,美国方面就曾对阿里巴巴发布过一次调查令,而这次调查令也很快就无疾而终。
这次美国方面对阿里巴巴发布调查令,很有可能也是无端指控,没有任何实质性的证据支持,但是这也无疑让阿里巴巴又陷入了漩涡之中。
根据官方信息,万相2.1模型目前支持文生视频、图生视频、视频编辑、文本生图、视频转音频、艺术字创作等六大场景。
用户只需要输入想要生成的视频内容,就可以一键生成全新视频,大大降低了视频制作门槛,也提升了视频制作效率。
尤其是在如今短视频行业发展的如火如荼的情况下,万相2.1模型无疑会为无数短视频创作者提供极大的便利。
又比如视频转音频功能,通过分析视频内容,就可以提取出与之对应的音频文件,大大提升了工作效率。
并且,艺术字创作功能,可以让用户在设计海报时,将海报上的文字进行处理,使其呈现出独特的艺术效果,这也是一个非常实用又好看的功能万博体育全站ManBetX。
通过这样强大的功能,不仅能够让普通用户轻松完成高质量的视频制作,还能让专业用户摆脱繁琐的流程,将更多精力投入到创作上。
根据VBench榜单的数据分析,目前国际上支持中文文生视频的只有两个模型,一个是腾讯云发布的Sora,一个是Luma。
而这两个模型在生成中文时,都需要将拼音转化为中文进行处理,这样处理出来的视频,不仅难以保持原有的语调,还容易出现错误。
而万相2.1则直接实现了中文文字视频生成功能,并且在VBench榜单上名列第一,这也标志着中文文生视频领域进入了一个崭新的时代。
万相2.1在时空上下文建模能力上进行了全新的设计,并且通过大量的数据进行训练,使得其在处理时空上下文方面有着优异表现。
这种全新的设计,也让万相2.1在编解码方面拥有着超高效性能,可以支持无限长1080P视频编解码工作。
这样一来,无论是开发者还是普通用户,都可以在万相2.1模型中获得更好的体验,从而激发出更多创新性的应用。
我们知道,近年来国内很多互联网巨头都开始纷纷布局AI领域,比如百度、腾讯等公司都是在人工智能领域不断加码,而马云和马化腾等互联网巨头也都开始关注AI领域,并且亲自出马为公司布局AI。
根据业内人士分析,由于阿里万相2.1模型拥有着强大的多模态生成能力万博体育全站ManBetX,所以很有可能会成为众多公司AI产品中的“隐形人”。
通过API接口将万相2.1模型嵌入到自己的产品中,这样既可以降低自己的研发成本,也可以让自己的产品拥有强大的功能,从而实现业务增长和创新。
其实这样的情况,在AI领域并不是第一次出现。早在2020年5月,OpenAI就曾发布过一个名为“GPT-3”的自然语言处理模型,并且对外进行了付费API接口开放。
而OpenAI的开放,也吸引了大量公司使用GPT-3接口进行开发,并催生出了无数款优秀的软件和产品,比如被微软收购的GitHub Copilot、被Zoom收购的虚拟助手Kites.ai等等。
而此次,阿里巴巴也很有可能会借助自己强大的技术实力,让更多公司使用万相2.1接口进行开发,从而推动整个行业的发展。
从上面我们可以看出,万相2.1模型的开源,无疑会对整个行业产生积极影响,不仅可以促进技术进步,还能够推动产品创新。
则是中文文字生成能力,这是万相2.1的一项重要功能,也标志着中文文生视频领域正式进入一个崭新的时代。
总之,万相2.1的开源无疑为中文文生视频带来了新机遇,阿里巴巴在AI领域的实力也让人刮目相看。面对外界的压力,他们依然选择坚持自己的发展道路,实在是令人佩服。你觉得这样的投资和技术创新会对未来的短视频行业产生怎样的影响?欢迎在评论区留言讨论,别忘了点赞哦!返回搜狐,查看更多