您现在的位置是:谦恭下士网 > 娱乐

太炸了!OpenAI深夜发布 文字直接生成视频 网友:我要失业了

谦恭下士网2024-04-29 07:04:02【娱乐】8人已围观

简介2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官

  2月16日凌晨,太炸OpenAI再次扔出一枚深水炸弹,深夜生成视频失业发布了首个文生视频模型Sora。发布据介绍,文字网友Sora可以直接输出长达60秒的直接视频,并且包含高度细致的太炸背景、复杂的深夜生成视频失业多角度镜头,以及富有情感的发布多个角色。

  目前官网上已经更新了48个视频demo,文字网友在这些demo中,直接Sora不仅能准确呈现细节,太炸还能理解物体在物理世界中的深夜生成视频失业存在,并生成具有丰富情感的发布角色。该模型还可以根据提示、文字网友静止图像甚至填补现有视频中的直接缺失帧来生成视频。

  例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。

  在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。

  电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。

  AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。

  竖屏超近景视角下,这只蜥蜴细节拉满:

  网友直呼game over,工作要丢了:

  甚至有人已经开始“悼念”一整个行业:

  还有网友表示,电影业要彻底颠覆了。

  一位YouTube博主Paddy Galloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”

  对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

  例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

  该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

  如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。

  OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

  随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。

  视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。

  Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。

  如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。

编辑: 陈晓怡纠错:171964650@qq.com

  • 博物馆里过大年

    博物馆里过大年

  • 春节我在岗|高空中打“钢管结”

    春节我在岗|高空中打“钢管结”

  • 新春纪事 | 千年古县城与千年“美灯”的邂逅

    新春纪事 | 千年古县城与千年“美灯”的邂逅

  • 年会上喝下一瓶白酒 28岁小伙转身进了ICU

    年会上喝下一瓶白酒 28岁小伙转身进了ICU

  • 春节期间怎么吃才健康?权威解答来啦

    春节期间怎么吃才健康?权威解答来啦

  • 春运路上 听听他们带了哪些宁波特产回家

    春运路上 听听他们带了哪些宁波特产回家

  • 南塘老街摆出百米长龙宴

    南塘老街摆出百米长龙宴

中国宁波网首页 新闻中心首页
  • 今天阳光回归但气温依旧低迷 下周天气格局将迎来大反转

    今天阳光回归但气温依旧低迷 下周天气格局将迎来大反转

  • 三亚最新发布!

    三亚最新发布!

  • 新春纪事 | 嵊州豆腐包 味之浓时是故乡

    新春纪事 | 嵊州豆腐包 味之浓时是故乡

  • 3天销售额近9亿元!超11万人次“买买买” 为...
  • 买不到返程车票不能按时上班 算旷工吗?
  • “挡刀女孩”崔译文又有新身份!她的新年愿...
  • 贾玲减肥成功 宁波私教:催不动的客户来催我了
  • 国家民航局将增加海南运力

扫一扫,中国宁波网装进手机

中国宁波网手机版

微信公众号

本地看点
  • 记者驻村日记:"老鸭生蛋村"的蝶变
  • 单日客流破“5万”大关!宁波机场太“火热”
  • 返程高峰继续 明天还有最后一波 宁波交警提醒
  • 年味high不停!这些活动等你"打捞"
  • 新春纪事|外婆家的老屋里尘封着回不去的时光
  • 新春纪事|奔赴一场相隔十年的团圆之约
明州论坛/甬城晨笔
  • 陈戌源案的血泪教训要好好汲取
  • 劝君常读警示录
  • 高水平建设质量强市
  • “尔滨”宠溺“南方小土豆”:摸准了服务业的真谛
  • “进一次门、查多项事”就是为企业减负
  • 让更多村民乐享“村晚”大餐
  • 点上调研 面上破题
  • 乡村“出海”促进交流互鉴
  • 沐春风

    沐春风

  • 龙年贺岁

    龙年贺岁

茶座/文摘
  • 吴启钱:唯有谦卑
  • 桂晓燕:龙的特殊和神奇
  • 陈鲁民:范纯仁的“食谱”
  • 陈鸣达: 滕头村魅力,乡村让城市更向往
  • 阴 冰:以务实之举纠治形式主义顽疾
  • 黄奇帆:新质生产力制造业的方向
  • 刘俏:发展与高质量发展高度适配的科技金融
  • 李瑞德 潘玉腾:“四下基层”的哲学意蕴和文化底色

中国宁波网(宁波甬派传媒股份有限公司)版权所有(C)

Copyright(C) 2001-2024 cnnb.com.cn All Rights Reserved

互联网新闻信息服务许可证:3312017004 信息网络传播视听节目许可证:1104076

违法和不良信息举报电话:0574-81850000 举报邮箱:nb81850@qq.com

看天下 看宁波

太炸了!OpenAI深夜发布 文字直接生成视频 网友:我要失业了

稿源: 法治网公众号 2024-02-16 20:07:35

  2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

  目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

  例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。

  在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。

  电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。

  AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。

  竖屏超近景视角下,这只蜥蜴细节拉满:

  网友直呼game over,工作要丢了:

  甚至有人已经开始“悼念”一整个行业:

  还有网友表示,电影业要彻底颠覆了。

  一位YouTube博主Paddy Galloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”

  对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

  例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

  该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

  如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。

  OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

  随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。

  视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。

  Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。

  如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。

编辑: 陈晓怡

纠错:171964650@qq.com

很赞哦!(1725)