“眼见为实”或成过去AI“文生视频”如何改变未来？_专题报道_爱游戏体育平台官网首页

当前位置：首页 > 新闻中心 > 专题报道

“眼见为实”或成过去AI“文生视频”如何改变未来？

作者：专题报道发布时间：2024-07-12 05:56:20

　　继去年发布的聊天机器人ChatGPT引领新一轮人工智能（AI）浪潮之后，美国人工智能公司OpenAI于16日又发布了全新的生成式人工智能模型Sora，它可以通过文本指令创建最长达60秒的视频，其逼真的视觉效果让它在一夜之间“刷屏”，全球诸多媒体都对其冠以“颠覆性”的美名，甚至有网友感叹“视频行业全都要被洗牌了”。相关专家17日接受《环球时报》记者正常采访时表示，短期来看，Sora确实会对影视等行业带来显著影响，但我们也不应神化其作用，长久来看，需要用心制作的作品，依旧很难仅用“芯”完成。

　　目前OpenAI还没有发布Sora的公开使用版本，但已经发布的40多个演示视频中包含有细节拉满的场景、复杂的摄像机运镜以及多个充满情感的角色。OpenAI宣称，Sora能够理解物体在物理世界中如何存在，并准确地解释道具并生成引人注目的角色来表达充满了许多活力的情感。例如它能够准确的通过文字描述“在东京街头，一名时髦女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上”，生成一段包含有多镜头的高清晰视频，包括从大街景切入对女士脸部表情的特写，以及潮湿的街道地面反射霓虹灯的光影效果。这些视频的真实度令人为之惊叹，就连特斯拉CEO马斯克也在社会化媒体上对此表示“人类愿赌服输”。

　　美国有线电视新闻网（CNN）称，尽管“多模态大模型”屡见不鲜，但Sora的制作长度和准确性使其与众不同，它可能会对数字娱乐产业产生重大影响。

　　北京邮电大学人机交互与认知工程实验室主任刘伟接受《环球时报》记者正常采访时表示，Sora在短期内可能会对短视频制作、影视行业及视觉交互界面应用产生较为明显的影响；从长久来看，这项技术会为无人驾驶、数字仿真、场景模拟等领域带来改变。他表示，“我们不应神化Sora的作用，这项技术还很难取代传统的影视行业制作流程，人类用‘心’拍出影视的作品，还很难仅用‘芯’来完成。”

　　中国影协科幻电影工作委员会执行秘书长马贺亮接受《环球时报》记者正常采访时表示，Sora的确让影视圈“震惊”，但“还在于AI的发展速度远超于了原来的预期”。他认为，短期内与概念设计、视频预览相关的岗位会在某些特定的程度上受到Sora的影响，但它所能呈现的效果其实还达不到院线电影的级别，而且电影在创作上有主观立场、视角和表达，观看时有情感交流和情感投射，远不是简单生成一段视频就能代替，因此AI作为技术辅助手段的确已经在改变电影制作方式与流程，能优化提升电影创作，但要说它能“颠覆整个电影行业”，还为时过早。

　　OpenAI也坦承，Sora还存在一些短板，例如模型在准确模拟复杂场景的物理特性方面可能会遇到一些困难，也可能没办法周到地展现具有因果关系的事例。例如演示视频中就出现了“有人咬了一口饼干，但饼干上并未出现咬痕”的明显漏洞。

　　中国人工智能专家吴甘沙17日接受《环球时报》记者正常采访时表示，“Sora的影响往小了说，是文生视频技术突破了一个数量级（时长比此前最好的水平提升了15-20倍），可以直接应用于短视频、广告行业等，对无人驾驶的场景和数据生成等都有正面影响；往大了说，它提供了理解、重建和模拟这样一个世界的可能性。如果大语言模型LLM像是一个小孩关在图书馆里读遍人间万卷，Sora就是一个胸有丘壑的青年来到真实人间、行万里路，用现实和反馈来印证知识，还可以用视频（模拟真实）的方式输出知识和内容。一图胜千言，图和视频的信息传递损耗远低于文字，从这个意义上来看，它未来冲击的不仅仅是视频、电影行业，也会影响书籍、知识、教育等一切信息输出的行业”。

　　新智元创始人杨静17日接受《环球时报》记者正常采访时表示，Sora是对OpenAI算法应用领域的升维拓展，ChatGPT一年前已在自然语言交互领域取得重大突破，Sora则在AI视频领域一举登上行业巅峰。如果说ChatGPT模拟了人类的思维能力，Sora则是对整个物理世界的模拟。结合这些技术，如果未来虚拟世界与现实世界无缝融合，那么人类的整个社会生活都会颠覆，包括智慧城市、军事、影视游戏、电商社交等多个领域。

　　但杨静也提醒说，AI生成的假视频存在泛滥风险，可能被用于诈骗犯罪。在Sora将AI生成视频能力提升到近乎逼真的程度时，大家也要认识到“眼见为实”可能已成过去。CNN称，OpenAI已关注安全性问题。该公司表示，未来将在Sora输出的视频中应用内容追溯技术，以鉴别是否为AI深度伪造视频。

　　刘伟认为，如今AI技术在应用层面出现的一些乱象也凸显这项技术是一把“双刃剑”。随着以大语言模型为代表的AI技术加快速度进行发展，会对传统的伦理、法律以及生产方式等等方面都产生强大的冲击，如果我们不加以监管，其一旦“泛滥成灾”，必然会侵犯许多人的权益。但如果我们过早或者过严地加以监管，这必然又会限制这项技术的发展。“我认为监管之难大多数表现在如何平衡‘管’与‘放’之间的关系，特别是在全球各国人工智能快速的提升的时期。”刘伟表示，在真实的操作的层面，我们既要对明显会侵害大部分人权益的行为坚决加以限制，与此同时也应有“特区制”，允许有试错的空间。

　　Sora的出现也引发了国内许多业界人士的担忧，“中美AI领域差距进一步拉大”成为Sora问世后的伴生线集团创始人周鸿祎认为，“OpenAI训练的Sora应该会阅读大量视频。一幅图胜过千言万语，而视频传递的信息量又远超于一幅图”，因此Sora的出现可能意味着通用AI“线年的问题，可能一两年很快就能轻松实现”。他表示，尽管国内大模型发展水平表面看已经接近GPT3.5，但实际上跟4.0比还有一年半的差距。从现在来看，OpenAI手上除了GPT5之外，可能还有一些“秘密武器”没有亮出来。“中国和美国的AI差距可能不但没有缩小，反而在加大。”

　　杨静认为，Sora的震撼给我们三个提醒。第一是在算法方面，OpenAI在攻破语言和视觉两个堡垒后，即将向通用AI发起最后挑战；一旦实现超级人工智能，加上生成式的AI世界，人类整体的权重都将降维；第二是在算力方面，OpenAI公布筹资7万亿美元建立芯片帝国的计划，这笔巨款相当于美国GDP的1/4，或许将确立垄断全球算法与算力的AI霸主地位；第三是在数据方面，微软此前为OpenAI提供了5000亿视频用于Sora训练，未来还将有更多海量数据涌入，又有更多视频生成。

　　吴甘沙表示，目前AI领域的竞争格局是OpenAI公司“一骑绝尘”。无论是谷歌的Gemini、勇于探索商业模式的公司Runway和Pika，还是中国的顶尖公司，都要奋起急追，不然差距会慢慢的大。他认为，中国要在AI领域追赶，首先是依靠人才，确保与世界顶尖水平的交流，鼓励人才高密度聚集。“美国大模型相关的大公司加勇于探索商业模式的公司可能就是一二十家，而中国有几百家，人才太分散”。其次是不能太短视，要允许失败，给予足够的发展时间。第三是别过度监管，宽进严出，让不完全成熟的技术通过不断反馈得以提升。同时算力也是AI发展的稀缺资源，更不应该太分散了。

　　刘伟曾多次参加中美之间的人工智能技术官方和学界层面对话，他告诉《环球时报》记者，在这些对话活动中有一个深刻感触就是“中美学者对于两国人工智能技术发展的认识趋同”。大家一致认为，美国在AI技术的软件和硬件上更具一马当先的优势，而且这个优势还有逐步扩大的趋势；但在技术应用和数据收集方面，美国学者坦言中国更具优势，而在AI领域，“大数据正好是辅助决策模型的重要组成部分”。

　　此外，在人机协同和人机融合领域，中美技术能力旗鼓相当。“这也是美国三番五次与中国开展人工智能技术对话的原因之一，双方实力相当，才有对话的意愿，美国方面也很担心我们在人机协同上实现重大突破，从而占据领头羊。”

上一篇: 【48812】最全在线视频下载网站保藏备用很好用

下一篇: 分享6 款图片文字识别工具一键提取图片上的文字

爱游戏体育首页

爱游戏体育首页入口