S/N | 企业 | 备注 |
---|---|---|
1 | 抖音 | Dreamina、MagicVideo-V2、Boximator |
2 | 百度 | 文心一言大模型、统一模式视频生成系统UNiVG |
3 | 360 | 360智脑 |
4 | 腾讯 | Follow-Your-Click、VideoCrafter2 |
5 | 科大讯飞 | 星火认知大模型 |
6 | 华为 | 盘古大模型 |
7 | 阿里云 | "ModelScope—Sora开源计划" |
8 | 万兴科技 | 天幕大模型 |
9 | 中央广播电视总台 | 人工智能工作室,文生视频动画《千秋诗颂》 |
10 | 商汤科技 | "SenseNova日日新开放平台" |
11 | 京东 | 言犀大模型 |
12 | 昆仑万维 | 天工大模型 |
13 | OPPO | 安第斯大模型 |
14 | 上海人工智能实验室 | 书生大模型 |
15 | 中国电子云 | "星智大语言模型" |
16 | 中文在线 | 中文逍遥大模型 |
17 | 网易有道 | 子曰大模型 |
18 | 云知声 | 山海大模型 |
19 | Minimax稀宇科技 | MoE大语言模型abab6 |
20 | "月之暗面Moonshot AI" | 跨模态大模型研发 |
21 | 虹软科技 | ArcMuse |
22 | 知乎 | 知海图 |
23 | 火山引擎 | 火山方舟 |
24 | 智谱·AI | 认知智能大模型开放平台大模型MaaS平台 |
25 | 中科院自动化所 | 紫东·太初 |
26 | 魔珐科技Xmov | 文生3D视频“有言” |
27 | 思必驰 | 对话式人工智能平台,DFM-2大模型 |
28 | 百川智能 | Baichuan大模型 |
29 | 金蝶 | 苍穹大模型 |
30 | 因赛集团 | InsightGPT AI营销视频产品 |
31 | 零一万物 | Yi开源模型,AIGC大模型服务 |
32 | 追一科技 | 博文Bcwen |
33 | 当虹科技 | 智能视频解决方案与视频云服务 |
34 | 百应科技 | 智能用户运营平台 |
35 | 天图万境 | AI影视工业服务 |
36 | 新华三 | 百业灵犀大模型 |
37 | 面壁智能 | 通用人工智能服务,CPM大模型 |
38 | 中国电信 | 启明大模型 |
39 | 西湖心辰 | 西湖大模型 |
40 | 生数科技 | PixWeaver |
41 | 大华股份 | 星汉大模型 |
42 | 携程 | 问道大模型 |
43 | 云知声 | 山海大模型 |
44 | 阅文集团 | 妙笔大模型 |
45 | 小米 | MiLM-6B大模型 |
46 | 爱诗科技 | 爱诗视频大模型 |
47 | 实在智能 | TARS大模型 |
48 | 澜舟科技 | 孟子大模型 |
49 | 七火山 | Etna |
50 | 素鳞科技 | AI视觉创意产业服务 |
2024.04 DBC/CIW/CIS |
“深水炸弹”Sora
继ChatGPT后,OpenAI又在人工智能领域扔下一颗深水炸弹,引爆海内外AI圈。
2月16日,OpenAI发布“文生视频”模型Sora。Sora 官网发布的几十个视频 Demo 中,有在东京街头散步的女人、在咖啡杯里航行的海盗船、在雪原上走过的猛犸、无人机视角拍摄的海浪拍打峭壁、华丽的纸艺海底世界、维多利亚冠鸽的微距特写,其视频主体和环境的一致性令人震撼。
Sora可以根据所输入的prompt,直接输出最高长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
Sora出现以前,主流的AI视频生成软件如Pika、Runway等生成的视频时长普遍被限制在5秒内,在特定情况下,应用户要求,能够扩展到16秒,这已是2024年以前AI生成视频领域公认的最长时间纪录。而Sora则突破常规,其独特的能力允许它生成长达一分钟的视频,这一时长无疑将其置于行业绝对的领先地位。
虽然Sora在文本生成视频的领域取得了显著的进展,但它也只是文生视频革命的初步尝试。
赋能
Sora的推出让我们见证了一个技术奇迹,这个能够快速且优质地将文字描述转化为视频的AI工具,不仅代表着AI技术的一次巨大飞跃,也预示着我们熟悉的许多行业即将面临一场新的革命。
在短视频内容消费领域,随着Sora的出现,用户能够迅速制作出各种类型的视频内容,未来稀缺的不再是视频拍摄或者剪辑的能力,而是独特的创意。影视和游戏等行业是文生视频落地的重要场景,文生视频用文字就可以编辑和生成想要的故事情节,实现创意辅助和降本增效。而凭借为内容生成赋能这一独特优势,文生视频的前景也是毋庸置疑。
但是Sora在视频生成方面还较明显地有着各类Bug,这也是OpenAI迟缓推出Sora的重要原因之一。在OpenAI的官网介绍中,OpenAI表示Sora可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系,还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
在其他行业,如算力,受益于Sora驱动的AI视频生成技术对强大计算能力的持续渴求,市场需求将迎来显著增长;又如安全行业,普遍认为在AI视频生成广泛应用后,安全领域的革新将会是最受惠的方向之一,可预见的是,随着技术的发展和普及,市场上将涌现一大批专注于视频真伪鉴别技术研发与服务的新兴企业。
超越
以抖音为例,抖音在短视频和社交媒体方面的海量数据资源,会使其在文生视频模型的研发上占据独特优势。MagicVideo-V2的发布及其效果上的显著提升,已经证明了字节跳动在该领域的技术实力与创新能力。
同时,火山引擎大模型服务平台“火山方舟”的推出,以及与多家合作伙伴共建的生态体系不断完善,抖音不仅能够利用自身的庞大用户基础产生的实时、多样的数据流进行训练优化,还有望通过高效的模型迭代和协同创新,在未来开发出能与Sora匹敌甚至超越的新一代文生视频模型。
但这样的优势能否快速补充其他的发展短板,摘下国内首个正式开放文生视频的桂冠,仍需要时间来证明。
有个问题需要注意的是,ChatGPT成功运行最少需要一万张英伟达GPU提供算力,迭代到GPT-4后,其所需的英伟达GPU数量被爆超过了2万张,价值达数亿美元。而面对这种投入产出比,国内大模型厂商担忧的不是能不能做出Sora,而是投入重金研发后,硅谷是否会有开源模型突袭。
结语
当下,文生视频的热度足够火爆。
对于中国企业来说,Sora是前方需要追赶的又一个目标,它为更多内容创作及其他行业带来了全新的思考和机遇,百度、科大讯飞等在大语言模型中领先的企业,以及拥有海量数据资源的抖音,都应该加速了。
虽然我国文生视频领域尚且没有明星产品的出现,但更多有人才、有技术的文生视频公司正在不断涌现。
(文/欣遇)
e-Mail:lab@enet16.com
TEL:010-65283855