Sora还没来,概念已席卷A股
导读
2月19日是A股市场进入龙年后的首个交易日,市场表现较为强势:上证指数以2910.54点收盘,涨幅1.56%;国证A指涨幅1.43%,沪深300涨幅1.16%。
盘面上看,当日沪深京三市最活跃的题材无疑是AI应用方向,包括宣亚国际(300612.SZ)、当虹科技(688039.SH)、易点天下(301171.SZ)在内的相关概念股批量涨停。中证人工智能产业指数大涨6.14%,同花顺Sora概念(文生视频)指数涨幅更是高达16.17%!
但值得注意的是,自去年12月以来,A股投资者对AI概念的热衷程度实际上已有所减退,曾经股价持续走高的相关个股纷纷陷入“回调”。
例如,2月19日走出一字涨停的宣亚国际,在2023年12月12日至2024年2月8日的短短42个交易日中,股价曾暴跌51.14%,中证人工智能产业指数亦在同一区间内跌去18.99%。
AI概念股春节前后的强烈反弹,部分得益于外围利好消息,特别是OpenAI于2月16日发布的全球首个文生视频大模型——Sora,为市场注入了一剂“强心剂”。
从OpenAI官方的演示材料来看,Sora可以基于用户输入的简短指令生成最长达一分钟的视频,轻松地将用户想象中的场景转化为各类高清视频呈现,这种能力再一次大幅拓展了生成式AI的应用场景,展示了AI在理解和创造复杂场景方面的巨大进步,这使得Sora成为全球科技圈讨论的焦点。
“Sora意味着AGI(通用人工智能)的实现将从十年缩短到两三年。”2月16日当天,360集团创始人、董事长周鸿祎在微博上如是点评Sora模型的发布。
许多业内人士认为,Sora的出现将为内容创作、娱乐和教育等行业带来革命性变化,因为这意味着个人或小团队创作者可突破传统资源、资金和技术的限制,创作出更加多元和丰富的内容。同时,亦有短视频行业的从业者强调,Sora作为一种初步的生产力工具,预示着效率革命的到来,但不会是简单地颠覆或取代视频行业现有体系。
“一位时尚的女士穿着黑色皮夹克、长红裙和黑靴,在充满霓虹灯和动感城市标志的东京街头行走。她佩戴太阳镜和红色口红,手提一只黑色手袋,自信而随意地走着。街道潮湿而有反光,色彩斑斓的灯光在地面上形成镜像效果。许多行人在街上来往。”这是OpenAI官网上,展示的一则让Sora生成视频所使用的Prompt(提示词)。
从生成结果来看,Sora准确地还原了Prompt所描述的场景,同时Sora还给视频增加了相当多的细节,不管是对日文霓虹灯牌的还原、熙熙攘攘的行人,还是多彩灯光在潮湿街道上所形成的镜像效果,这些细节都进一步增加了场景的沉浸感。
而在OpenAI官网上,类似这样的演示案例还有48个,这些提示词及生成内容五花八门,有远古生物猛犸象漫步在雪山之中,也有越野吉普穿越在崇山峻岭之间。
记者在浏览Sora所生成视频时,一个最大的感受便是“真实”。
在该模型所创作视频中,可以实现人物和关键场景元素在三维空间中保持连贯运动,且基本符合物理规律,同时,能够确保一个主题即使暂时离开视野也能保持外观不变。
“持续扩展视频模型的规模是一个有前景的方向,有助于开发出高效能的物理和数字世界模拟器,以及其中活动的物体、动物和人类。”OpenAI在Sora官方的技术文档中指出。
“现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作,并没有适用物理定律。但Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。所以我理解这次OpenAl利用它的大语言模型优势,把LLM(大型语言模型)和Diffusion(扩散模型)结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。”周鸿祎分析称。
“AI大模型之前有个很大的问题就是对物体持续性认知不足,理解不了现实世界里各种对象和元素间的关系,理解不了三维世界里的物理规律,比如水面应该反光,人受重力影响应该站在地上等等,所以经常会出现‘牛头不对马嘴’的生成结果。从演示来看,Sora似乎已经解决了这一问题,但还是有些瑕疵。”杭州一位AIGC领域从业者陈雨向记者表示。
记者亦注意到,在OpenAI演示的实例中,还是出现了部分不符合现实世界依赖关系认知的滑稽内容,例如,在一个提示词为:“一个人奔跑的逐帧打印场景,以35毫米电影胶片拍摄的电影镜头”的生成视频中,视频中的人物在跑步机上出现了倒着奔跑的情形。
“Sora有时会创造出物理上不合理的动作。”OpenAI官方也在该实例下方点评称。
除了文生视频,从Sora官方的技术文档来看,该模型还支持在两个输入视频之间逐渐插值(插入其他视频),在具有完全不同主题和场景构图的视频之间创建无缝过渡,同时,Sora还具备将视频在时间线上向前或向后扩展的能力。
“我们正在让人工智能掌握对运动中的物理世界的理解和模拟,旨在培养出能辅助人们解决需要与真实世界互动问题的模型。”OpenAI官方如是定义Sora模型的价值。
目前,OpenAI官方只向部分视频行业从业者开放了Sora的试用,该模型尚未正式面向普通用户推出。
2月17日,OpenAI的工程师大卫·施努尔还在X平台上发布了一条推文称,OpenAI正在为Sora项目寻找对大规模视频基础架构(如视频传输、处理、上传等)有经验的人才。
兴奋的从业者
驱动AI产业新一轮景气度
据记者梳理,目前在A股中,虽然尚未有相关公司推出成熟的文生视频模型,但已有不少上市公司开始布局。
2月19日,数字创意软件龙头万兴科技(300624.SZ)“20CM”涨停。从公开信息来看,该公司核心产品万兴播爆,是目前市场中较为流行的数字人短视频营销内容创作工具,此外,该公司在去年还曾与微软签署合作协议,引入OpenAI商用服务,将大模型能力落地至多款海外产品。
在2月19日,同样“20CM涨停”的还有当虹科技和因赛集团。
据当虹科技披露,该公司拥有自研的AIGC工具集,于2023年上半年发布了以静态照片生成三维体积视频的方案,支持6DOF(六自由度)视角自由移动,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩,实现不同模态之间相互切换。同时,公司自研的AIGC视频内容智能生成系统融合了大模型技术,包括语言、视觉、音乐等,以及公司在视频技术领域的诸多创新技术,如超高清编码、AI超分插帧等,能助力用户在新闻传播、商业推广、教育教学、视频内容创作等多项领域中创作出优质视频内容。
“公司的文生视频技术已取得一定进展,但从技术到商业应用是一个逐步落地的过程,投资者需理性看待。”2月19日,记者以投资者身份致电当虹科技,其相关负责人如是回复。
值得注意的是,作为一家以营销传播代理为主营业务的企业,因赛集团亦正积极融入AIGC的浪潮当中,为了推动大模型研发,该公司在2023年7月还通过了定增预案,计划募资6.45亿元,用于构建营销AIGC大模型研发与应用项目,而因赛集团2023年前三季度总营收也不过3.87亿元。
“公司自研的InsightGPT属于营销行业应用层垂类模型,与Sora这类底层通用大模型并不属于直接竞争关系,反而可以结合Sora等通用大模型丰富自身视频素材库以及提升视频生成效率和品质;随着未来视频生成相关技术水平被逐步拉齐,愈加普及的视频创作型工具唯有通过内容、创意、创新等方面的能力制胜,而公司在营销行业具有二十余年的积淀,内容创意生产能力位居行业头部,有助于InsightGPT在创意和洞察环节形成差异化优势并在市场竞争中脱颖而出,尤其是面向大型品牌客户。”在投资者问及Sora发布对公司带来的影响后,2月19日,因赛集团在互动易上如是表示。
2月17日,国盛证券在相关研报中分析指出,随着 AIGC 技术在影视剧集、宣传视频、自媒体、游戏等领域逐步渗透,视频创作效率或迎来显著提升,同时视频模型相对于文字、图像模型的交互数据量级将有巨大提升,或对应算力需求的高速扩张。
“Sora的横空出世,有望进一步激发市场对 AI 产业持续创新能力的期待。从去年的 LLM,到文生图,再到文生视频,AI 大模型在对真实世界的理解和模拟方面能力持续且快速提升,向 AGI 迈进的速度也超出了大家的预料。此次 Sora 的推出,有望带动产业新一轮的景气度上升。”国投证券则在2月19日发表的一份研报中强调。