2024“文生视频”创新企业TOP50

2024-05-06 DBC 德本咨询

2024“文生视频”创新企业TOP50
S/N企业备注
1抖音Dreamina、MagicVideo-V2、Boximator
2百度文心一言大模型、统一模式视频生成系统UNiVG
3360360智脑
4腾讯Follow-Your-Click、VideoCrafter2
5科大讯飞星火认知大模型
6华为盘古大模型
7阿里云"ModelScope—Sora开源计划"
8万兴科技天幕大模型
9中央广播电视总台人工智能工作室,文生视频动画《千秋诗颂》
10商汤科技"SenseNova日日新开放平台"
11京东言犀大模型
12昆仑万维天工大模型
13OPPO安第斯大模型
14上海人工智能实验室书生大模型
15中国电子云"星智大语言模型"
16中文在线中文逍遥大模型
17网易有道子曰大模型
18云知声山海大模型
19Minimax稀宇科技MoE大语言模型abab6
20"月之暗面Moonshot AI"跨模态大模型研发
21虹软科技ArcMuse
22知乎知海图
23火山引擎火山方舟
24智谱·AI认知智能大模型开放平台大模型MaaS平台
25中科院自动化所紫东·太初
26魔珐科技Xmov文生3D视频“有言”
27思必驰对话式人工智能平台,DFM-2大模型
28百川智能Baichuan大模型
29金蝶苍穹大模型
30因赛集团InsightGPT AI营销视频产品
31零一万物Yi开源模型,AIGC大模型服务
32追一科技博文Bcwen
33当虹科技智能视频解决方案与视频云服务
34百应科技智能用户运营平台
35天图万境AI影视工业服务
36新华三百业灵犀大模型
37面壁智能通用人工智能服务,CPM大模型
38中国电信启明大模型
39西湖心辰西湖大模型
40生数科技PixWeaver
41大华股份星汉大模型
42携程问道大模型
43云知声山海大模型
44阅文集团妙笔大模型
45小米MiLM-6B大模型
46爱诗科技爱诗视频大模型
47实在智能TARS大模型
48澜舟科技孟子大模型
49七火山Etna
50素鳞科技AI视觉创意产业服务
2024.04 DBC/CIW/CIS
“深水炸弹”Sora

继ChatGPT后,OpenAI又在人工智能领域扔下一颗深水炸弹,引爆海内外AI圈。

2月16日,OpenAI发布“文生视频”模型Sora。Sora 官网发布的几十个视频 Demo 中,有在东京街头散步的女人、在咖啡杯里航行的海盗船、在雪原上走过的猛犸、无人机视角拍摄的海浪拍打峭壁、华丽的纸艺海底世界、维多利亚冠鸽的微距特写,其视频主体和环境的一致性令人震撼。

Sora可以根据所输入的prompt,直接输出最高长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

Sora出现以前,主流的AI视频生成软件如Pika、Runway等生成的视频时长普遍被限制在5秒内,在特定情况下,应用户要求,能够扩展到16秒,这已是2024年以前AI生成视频领域公认的最长时间纪录。而Sora则突破常规,其独特的能力允许它生成长达一分钟的视频,这一时长无疑将其置于行业绝对的领先地位。

虽然Sora在文本生成视频的领域取得了显著的进展,但它也只是文生视频革命的初步尝试。

 赋能

Sora的推出让我们见证了一个技术奇迹,这个能够快速且优质地将文字描述转化为视频的AI工具,不仅代表着AI技术的一次巨大飞跃,也预示着我们熟悉的许多行业即将面临一场新的革命。

在短视频内容消费领域,随着Sora的出现,用户能够迅速制作出各种类型的视频内容,未来稀缺的不再是视频拍摄或者剪辑的能力,而是独特的创意。影视和游戏等行业是文生视频落地的重要场景,文生视频用文字就可以编辑和生成想要的故事情节,实现创意辅助和降本增效。而凭借为内容生成赋能这一独特优势,文生视频的前景也是毋庸置疑。

但是Sora在视频生成方面还较明显地有着各类Bug,这也是OpenAI迟缓推出Sora的重要原因之一。在OpenAI的官网介绍中,OpenAI表示Sora可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系,还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

在其他行业,如算力,受益于Sora驱动的AI视频生成技术对强大计算能力的持续渴求,市场需求将迎来显著增长;又如安全行业,普遍认为在AI视频生成广泛应用后,安全领域的革新将会是最受惠的方向之一,可预见的是,随着技术的发展和普及,市场上将涌现一大批专注于视频真伪鉴别技术研发与服务的新兴企业。

超越

以抖音为例,抖音在短视频和社交媒体方面的海量数据资源,会使其在文生视频模型的研发上占据独特优势。MagicVideo-V2的发布及其效果上的显著提升,已经证明了字节跳动在该领域的技术实力与创新能力。

同时,火山引擎大模型服务平台“火山方舟”的推出,以及与多家合作伙伴共建的生态体系不断完善,抖音不仅能够利用自身的庞大用户基础产生的实时、多样的数据流进行训练优化,还有望通过高效的模型迭代和协同创新,在未来开发出能与Sora匹敌甚至超越的新一代文生视频模型。

但这样的优势能否快速补充其他的发展短板,摘下国内首个正式开放文生视频的桂冠,仍需要时间来证明。

有个问题需要注意的是,ChatGPT成功运行最少需要一万张英伟达GPU提供算力,迭代到GPT-4后,其所需的英伟达GPU数量被爆超过了2万张,价值达数亿美元。而面对这种投入产出比,国内大模型厂商担忧的不是能不能做出Sora,而是投入重金研发后,硅谷是否会有开源模型突袭。

结语

当下,文生视频的热度足够火爆。

对于中国企业来说,Sora是前方需要追赶的又一个目标,它为更多内容创作及其他行业带来了全新的思考和机遇,百度、科大讯飞等在大语言模型中领先的企业,以及拥有海量数据资源的抖音,都应该加速了。

虽然我国文生视频领域尚且没有明星产品的出现,但更多有人才、有技术的文生视频公司正在不断涌现。

(文/欣遇)

e-Mail:lab@enet16.com

TEL:010-65283855

【排行“i系列标准”统一详细说明】


【DBC拟定框架简介】