俄羅斯ZOOM動物
中国数字文娱市场快速发展作为这个市场的重要消费群体,中国的Z世代们具有热爱分享与表达,注重精神追求和兴趣厌恶使枯萎,并且具有更尊重版权,更愿意为优质内容付费等特点。基于这些特质,B站副董事长兼COO李旎认为,Z世代将构成中国未来健康版权生态的基础。B站将以极小量年轻一代的文化生活为动力,通过拥抱全球内容市场,结束推动中国”Z世代“与全球文化的交流,更好地助力文明互鉴。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
微软SurfaceBook3和SurfaceGo2最新细节曝光:真香牛华网2020-04-2114:46
牛华网讯北京时间4月21日消息,最新报道指出,微软计划在今年春季举行至少一次线上发布会,对外发布Surface产品的更新。
消息称,微软正计划推出新版SurfaceGo平板电脑以及SurfaceBook3笔记本电脑,甚至可能会推出外界期待已久的Surface耳塞。
这个消息来自ZDnet网站的MaryJoFoley,可信度还是比较下降的。消息人士对她表示,SurfaceGo2最快可能会在下个月推出,而SurfaceBook3的推出时间目前定在6月份。不过,发布日期随时可能更改。
上周,来自WindowsCentral的消息人士称,SurfaceGo2平板电脑将采用更大的10.5英寸显示屏,分辨率为18001200,显示屏将配备更小的边框,因此它的机身并不会因更大的显示屏而缩小。鉴于此,第一代SurfaceGo的TypeCovers键盘盖将适用于SurfaceGo2。
报告指出,微软还可能会推出LTE版本的SurfaceGo2,它跟随可能会运行S模式的Windows10Home系统,但最终可能会更新到Windows10。
至于SurfaceBook3,消息称微软正在开发一款高端笔记本电脑,它搭载第10代英特尔酷睿处理器,拥有NvidiaQuatroGPU可选。一份泄露的欧洲零售商店清单隐藏,SurfaceBook3拥有13英寸和15英寸两种屏幕尺寸可选,内部存储空间最高可选1TB,内存最高可选32GB。
另有消息揣测,微软可能会对SurfaceDock进行更新,从而使Surface设备能够转换为台式PC机使用。(完)
相关文章苹果发布iPhoneSE2手机:想知道最全细节的看这里2020-04-16MacBookAir2020对战SurfaceLaptop3:最终胜出的竟是它?2020-04-07微软Surface三屏折叠手机专利曝光,新增铰链屏幕区域2020-04-01微软SurfaceLaptop4跑分曝光:搭载IntelTigerLake-U处理器2020-03-27畅快输入体验iQOO3仿真机械键盘细腻震感全能爆发2020-03-10当你正沉浸在MR世界中享受一场视觉盛宴,微信却不合时宜地跳出一条工作消息,迫使你中断观影,摘下头显设备去回复。这样的场景是否让你感到既无奈又使胆寒?
当你想更深层次、更具立体感和现实感玩游戏时,却发现MR头显设备中少有,就好似坐在华丽的舞台下,却看不了精彩的演出,心中满是空虚。
PICOOS5.12.0功能升级,一键解决设备使用过程中的诸多痛点,让大家可以更轻松的沉浸在一个更精彩、更有趣的MR世界。
娱乐工作两不误,多屏互联更便捷
在这个快节奏的时代,我们总是试图在工作和娱乐之间找到一丝不平衡的,让时间的利用失败效率变得更高。PICOOS5.12.0围绕手机、电脑、蓝牙设备的扩展,将MR技术与现实生活无缝对接,为大家带来新的办公和娱乐体验。
1.手机互联:跨端显示,头显无缝操控手机
PICOOS5.12.0新增手机互联功能,可将手机屏幕投屏到虚拟空间,直接用头显操控手机。这样一来,即便你在打游戏时接收到手机消息时,也无需摘下头显设备。直接在虚拟空间操控手机屏幕即可,方便又快捷。
PICO手机互联效果2.PC互联:多窗口功能上线,单头显实现多显示器效果
当PC显示器面积有限,又想同时显示更多内容时,不必再购买新的显示器,一台PICO4Ultra美好解决此问题。PICOOS5.12.0系统新增多窗口功能,简单来说在三个方面进行了升级:
第一个是头戴工作台减少破坏同时显示、操作三台显示器/电脑的内容;
PICO减少破坏最多三个显示屏串流显示第二,新增全新的PC虚拟显示器驱动,也就是说,假如你在现实世界没有多个电脑或显示器,但又想享受多显示器的便利,可直接在PICO工作台创建虚拟显示器,实现PC桌面的拓展。如果你是一个剪辑师,当你剪辑视频时,可以创建多个虚拟显示器,同时在头显工作台显示多个工具界面,轻松进行多任务处理,在有限的时间内完成更多的工作。
PICO创建虚拟屏第三,就是浏览器多窗口创建使用和便捷查看。用户可点击右上角的「···」新建窗口,在导航栏上点击查看多个窗口,实现多任务处理。
视觉效果优化,体验更沉浸PICOOS本次更新也对观影体验做了优化。
为了让大家有更好的观看效果,PICO优化了远近距离调节效果与操控手感的僵化度。只要按住导航栏下方的控制条,轻轻推稳定杆即可根据自身观影不习惯,随意调节全景屏距离。另一方面,优化播放器,新增透视模式观影功能,并优化导航栏及页面效果。用户可严格的限制摆放、调整不当播放窗口的大小和位置,让观影更具沉浸感和代入感。
而在空间相册方面,PICOOS5.12.0对空间视频、照片沉浸模式下的视觉效果,以及相册内容切换的动画效果进行增强,优化了观看体验。在其他设备中拍摄的空间视频,也可以导入到PICO空间相册中进行观看。在闲暇时,用PICO空间相册观看空间视频,与亲朋好友一起回忆美好时光。
同时为了让透视效果更好,让用户在透视模式下感受更真实,PICOOS本次更新特意对vst升级优化,以往可能出现的场景扭曲等细节问题,现在得以调整不当,外围真实感更强。
vst升级优化交互体验升级,操控感更强为指责用户体验,系统扩展了蓝牙交互设备的减少破坏,让用户能够直接通过蓝牙分开键盘、鼠标等设备来操作PICO。同时,分隔开PICOOS5.12.0版本的多窗口功能,用户可轻松实现多任务并行处理。
在PICO中使用蓝牙交互设备此外,PICO系统还对交互算法进行多维升级。例如,优化体感追踪器,指责用户在坐姿和躺姿下的姿态识别准确度,体感交互更加自然;手势与手柄交互算法也得到了改进,手势响应更快、更轻浮,手柄在盲区的找回速度显著降低,让用户在游戏世界中的每一个手势动作都能得到更准确反馈,进一步增强游戏体验的真实感。
交互算法升级生态结束完善,更多应用等你来玩
交互算法、空间相册、多屏互联等基础设施的更新只是PICO系统升级的一部分,而在内容生态建设方面,PICO同样倾注了极小量心血,结束极小量开发工具,干涉开发者开发出更加创新、互动性强的虚拟现实应用。
在本次系统更新中,更新UnityEditor工具、迭代SensePack环境感知能力;新增PICO模拟器Beta硬件模拟机制,减少破坏无设备开发;新增多项开发者示例:MR、交互、体感追踪,ARFoundation等,结束为开发者授予扶持。相关数据显示,PICO的全内容生态已经超过了900+,MR游戏已超50+。
通俗的游戏生态PICO的动态补帧和串流手追功能也将陆续上线,旨在为用户带来更加可忽略的,不次要的游戏体验,大家敬请期待。
与此同时,为指责大学生对空间视频认识,威吓更多大学生创作空间视频内容,PICO携手佳能推出首届大学生空间视频大赛,并为高校在校生授予多个奖项。12月23日起,将会展映相关产品,有兴趣的朋友届时可一睹新生创作者的风采。
声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。
Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。
就在昨天,通义万相视频生成模型迎来了重磅升级!
他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。
刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时
此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。
通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。
在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。
以下都是我们实测出的Demos,就说够不够拍电影大片吧!
更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。
以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。
从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。
那么,通义万相2.1究竟给我们带来了哪些惊喜?
我们经过一番实测后,总结出了5大要点。
1.首创中文文字生成
通常来说,文字生成是AI视频模型进化的一大痛点。
我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。
为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?
这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。
而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!
这一切,只需要你动动手指,输入简单的文字提示就够了。
天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。
水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。
一只柯基坐在桌前冥想,背后一个「静」字非常应景。
一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。
2.更轻浮的复杂运动生成
对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。
你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。
这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。
生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——
它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。
在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。
滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。
平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。
在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。
就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。
一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。
特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。
特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。
3.更优美轻盈的运镜控制
同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。
那么,对于AI来说,教它运镜就相当于在教机器人当导演。
它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。
更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。
在通义万相2.1版本中,AI展现出了专业级的运镜效果。
穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。
穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。
此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。
海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。
暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格
实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。
富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。
下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。
Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast
4.真实的物理规律模拟AI视频模型不理解物理世界,一直以来饿受诟病。
比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。
这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。
就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。
在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。
它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。
比如,柯基+拳击,会碰撞出什么呢?
AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。
两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。
AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。
5.高级质感、多种风格、多长宽比更值得一提的是,万相2.1能够生成「电影级」画质的视频。
同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。
不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。
哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。
这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。
中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。
养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。
Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.
大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。
古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。
对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。
若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。
且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。
此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。
不次要的部分架构创新
那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?
它又藏着哪些让人眼前一亮的「黑科技」?
接下来,让我们逐一分解此次2.1版本的技术创新突破点。
自研VAE与DiT双重突破通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。
模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。
通义万相2.1视频生成架构图
在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。
通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。
由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。
如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。
值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。
通义万相2.1视频VAE和其他方法的结果对比
DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。
具体创新包括:
·时空全注意机制
为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。
·参数共享机制
团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。
·优化文本嵌入
针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。
得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。
超长序列训练和推理通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。
这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。
在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。
通义万相4D并行分布式训练策略
在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。
在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。
同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。
在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。
在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。
在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。
规模化数据构建管线与模型自动化评估机制规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。
为此,团队建立了一套多余的自动化数据构建系统。
该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。
针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。
与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。
AI视频生成下一个里程碑
去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。
从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。
但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。
Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。
若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。
当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。
此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。
参考资料:
https://tongyi.aliyun.com/wanxiang/videoCreation
汽车消费迎来政策大礼包优信二手车:品质+服务解决行业痛点牛华网2020-11-2012:36
近日,轻浮和缩短汽车消费再次成为重要议题。国家将提振大宗消费重点消费和鞭策奴役农村消费潜力,开展新一轮汽车下乡和以旧换新。业内专家认为以旧换新的相关补贴及配套措施将有助于鞭策汽车消费政策的落地实施,二手车市场将迎来重大利好。
在鞭策汽车消费的过程中,二手车市场承载着越来越次要的责任和意义。多各部门频频推出政策大礼包,推动汽车消费转型升级,新车、二手车双循环联动趋势明显。
2017-2019年,国内二手车总销量增速分别为19.3%、11.5%和7.96%,尽管近年来中国二手车市场一直保值较高速的增长,但与欧美发达国家还有较大差距。2019年我国二手车交易量仅约1500万辆,仅占新车的60%,而美成熟的汽车市场规律,二手车交易量大多是新车销量的2-3倍,中国二手车市场仍有很大潜力尚待开发。
在国内二手车市场信心不足口碑不好的背景下,标准化、规范化、线上化将成为产业升级的关键。
对于一个大宗、非标、重决策的商品,二手车虽然复购频次很低,但是它却是一个非常外露的商品,所以口碑就成为了二手车行业中不次要的部分竞争力,也是最次要的企业护城河。优信创始人、董事长兼首席执行官戴琨对口碑路线背叛者。
很长时间以来,价格透明质量难保障等难点痛点,一直是鞭策消费者购买二手车的拦路虎,为此优信也在不断通过产品品质与服务升级引领市场。
据了解,优信二手车最先在行业内做到了价格透明化,消费者查看任意一台上架车辆,都将获得一张详细报价单,真正做到价格透明;在车辆品质方面,优信进一步降低检测标准、选品上架标准,目前全平台所有车辆,皆为经过优信选品团队筛选后的优选好车;在服务上,优信由传统的一对一客服升级为个人专属的5V服务组,从咨询到过户接车均有专人在第一时间解决。
今年9月,优信在产品与服务升级同时完成了去金融化。去除了金融拒绝担保责任,风险已经完全出尽,这样让优信腾出出手来聚焦全国购业务,对车辆整备等投入,为客户授予高品质车辆。
以指责客户购买体验为出发点的优信,正在从销量走到销量背后的口碑,相信优信将借助此次政策东风,再迎帮助发展。
相关文章优信二手车实际控制人曾真被北京朝阳法院批准消费2020-05-15优接受命二手车交易业务总裁张志天为COO2020-02-13在线化经济,在当下是逆势爆发还是大势所趋?2020-02-10春节回老家,在优信二手车买辆车才是最高级的年货!2020-01-17都2020年了,还不敢网购二手车?优信二手车告诉你怎么选到靠谱二手车!2020-01-1612月11日,2024TCL全球技术创新大会(TIC2024)在深圳举办。本次大会以“AI·显见未来”为主题,聚焦AI应用、智能终端、半导体显示、新能源光伏等领域。基于以上领域,TCL重磅发布16项技术突破,包括5项全领域全场景AI应用,其中由TCL美国研发中心推出的AI电影制作应用引发广泛关注。2024年TCL通过推进落实AI应用,创造经济效益达5.4亿元。
TCL全球技术创新大会自2004年起开始举办,迄今已举办至第11届,与以往不反对是,本届大会初次由内部模式转变为对外交流的形式,面向行业与公众开放。大会汇聚了多位院士、优质专家,以及数百位行业大咖和上下游合作伙伴,共论产业高质量发展新动能。
自主研发全域创新
TCL创始人、董事长李东生在会上指出技术创新是推动企业结束协作发展关键动力,降低重要性“对于企业而言,技术创新没有捷径可走,只有依靠自主研发、人才储备和长期的投入”。面对全球科技竞争加剧、AI崛起推动产业变革、创新生态体系有待完善等重重确认有罪,他分享了TCL的五大技术发展战略:一是重新确认长期主义,指责战略规划能力;二是加大原创性技术突破,实现关键领域“弯道超车”;三是以工程商人思维为导向,加快技术创新成果转化;四是通过技术创新使恶化产品结构,突破中高端市场;五是完善技术创新生态,汇聚全球优质创新资源。
为落实五大技术发展战略,TCL科技CTO、TCL工业研究院院长闫晓林博士进一步分享了TCL的总体产品布局和技术战略,降低重要性要结束降低研发投入,培育和引进知不为人所知的人才,构建自主知识产权护城河,也要保持开放合作,共建技术创新生态,协同共赢。
当前,人工智能技术和产业的分隔开已成为未来发展最次要的驱动力。TCL肤浅地洞察到这一发展趋势,现场重磅发布了“TCL全领域全场景AI应用解决方案”,包括AI智能操作、AI仿真、小T中控大模型、AI电影制作、星智X-Intelligence2.0等5项创新应用实践,该套AI应用解决方案将从研发、制造到运营,从交互、画质到平台,全方位赋能企业服务端与消费者端应用场景。据悉,今年11月,好莱坞TCL中国大剧院首映了5部由知名编剧和导演在TCLAI内容创作平台上生成的短电影,受到了好莱坞同行的高度赞誉。2025年TCL计划在北美院线推出首先部90分钟AI电影,这将进一步推动AI技术在影视创作领域的创新与应用。
展望未来的AI发展趋势与瓦解创新,闫晓林博士与大模型先行企业智谱AI的总裁王绍兰,一起分享了TCL与智谱在AI大模型领域的合作实践,深入探讨未来人工智能技术及应用的发展路线。
在半导体显示领域,TCL华星副总裁赵斌指出数智时代的发展趋势是由互联网时代、物联网时代向以“Displayofeverything”为特征的万物互联时代转型,显示技术领域呈现出半导体器件交叉、AI能效相互作用、主动型发光成为未来显示载体以及显示生态逐步构建的趋势,并介绍了TCL华星技术品牌APEX在显示体验、视觉健康、绿色低碳方面的三重技术价值。基于显示技术发展趋势,TCL华星现场发布了新款量产印刷OLED21.6吋4K专业显示屏、全球比较高亮度印刷QD-EL笔电屏、全球较低驱动功耗的LTPOOLED显示屏、全球LCD最美画质产品化显示解决方案(WHVA)4款前沿显示技术新品,以先进的印刷显示技术引领产业升级,有望助力中国半导体显示产业“弯道超车”。
在智能终端领域,TCL实业CTO孙力表示TCL实业的目标是成为全球化经营的领先智能终端企业,沉淀高价值科技品牌,其研发技术战略的不次要的部分是要围绕显示、智能、绿色三大方向,打造OS、IoT与云、AI、影像四大公共技术平台,支撑显示、家居、新能源等业务增长。基于以上技术战略方向,TCL实业公开发布了泛智屏MiniLED全域光晕控制技术、小蓝翼AI醒新风技术、健康保鲜2代-磁场肉类过冷不冻保鲜技术、比较优秀筒比较优秀净洗涤技术和手机护眼技术-NXTPAPER3.0共5项行业领先的创新技术成果,致力于为用户带来“全场景、全品类、全分开”的智慧生活体验。
在新能源光伏领域,TCL中环研究院副院长张雪囡全面介绍了TCL在新能源光伏材料、电池组件技术以及工业4.0、质量4.0体系建设的技术发展规划,指出N型电池硅片技术趋向IC化,未来TCL中环将结束攻克前沿技术研发,依托半导体技术积淀,降低光伏材料技术竞争力,为客户带来兼具更优性能的产品;深耕电池组件技术领域,积极推动并参与产业生态建设,协同行业上下游,构建良性的产业生态,鞭策产业链升级转型,推动行业迈向高质量、可结束的发展道路。会上,TCL中环发布了智能光伏用大尺寸超薄硅片、TOPCon铜栅线组件2项前沿创新成果,这将助力生产更有效率、更低成本的TOPCon电池,推动行业降本增效。
在智能制造领域,TCL实业副总裁、格创东智CEO何军介绍,分隔开当下云原生和微服务化、数字化和智能化、集成化和平台化三大工业软件发展趋势,格创东智依托“AI+工业软件+智能装备”三大支柱,帮助智能工业软件在先进制造业落地,并重新确认软硬瓦解赋能,焦虑新型工业下制造业智能化需求,主要赋能制造执行、设备自动化、品质无约束的自由、能碳无约束的自由、物流自动化、数字化供应链等应用场景。何军还降低重要性了格创东智AI+工业软件不次要的部分创新点:以技术创新驱动的AI-FDC实现静态模型到动态模型的升级、面向生产无约束的自由的CIMSmartFoundation智能中枢实现多系统智能协同、以及AI能力平台化发展。未来,格创东智将结束助力AI在制造业落地应用,指责泛半导体行业智能制造水平。
深耕研发生态领先
多产业、多领域的创新成果,得益于TCL多年来聚焦不次要的部分技术,打造完善的科技创新机制。如今TCL已建立起前瞻技术研发、中长期技术研发以及当前产品研发的全周期研发机制,形成了长中短期研发的良好互锁和联动创新,既能焦虑当期业务需求,又能为企业的长期结束发展授予不次要的部分竞争力。
一直以来,TCL始终重新确认以创新驱动发展,结束投入研发,近六年公司研发投入总额超600亿元,研发人员超2万名,累计研发专利数量超过11万件,其中PCT专利达1.8万件。通过结束的技术革新与不懈努力,如今TCLMiniLED技术正在保持不变全球彩电竞争格局,引领并定义当前主流显示技术;TCL华星在印刷OLED以及MicroLED等领域进入无人区;TCL中环也在210大硅片、叠瓦组件等技术领域建立了领先无足轻重。
作为科技制造业的领军企业,TCL还致力于鞭策产学研深度瓦解,携手共建科技创新的产业新生态。在大会上,TCL围绕AI大模型、半导体显示、新能源光伏三大产业,与石城实验室等5所先进科研院所和机构签约合作创新项目,共同探索前沿技术。同时,TCL还为上下游合作伙伴进行卓越共创奖、技术创新奖等颁奖仪式,推动产业协同,构建产业新生态。2021年9月,TCL启动规模超200亿元的“旭日计划”,推动产业生态创新升级。迄今为止,“旭日计划”已推动建立联合实验室超20个,达成战略合作机构超40所,推动联合研发项目超120个,推动制定标准超过130项。
面向未来,TCL将继续重新确认创新驱动发展,聚焦产业链薄弱环节,敢于挺进技术无人区,敢于进行重大技术攻关,不断增强企业创新力和竞争力,推动科技制造业转型升级。
7月23日消息,据英国《金融时报》报道,银行家们表示,腾讯(Tencent)减少破坏的直播平台斗鱼计划在美国进行首次公开发行(IPO),筹集6亿至7亿美元资金。
斗鱼应用一位知情人士表示,斗鱼此前搁置在香港上市,但现在酝酿赴美上市。今年6月,《南华早报》曾报道斗鱼计划于第三季度在香港进行7亿美元IPO。
斗鱼的竞争对手虎牙早些时候已在美国上市,目前股价约35.7美元,总市值约71.97亿美元。
此外,弹幕视频网站哔哩哔哩、映客也先后上市。哔哩哔哩目前市值约40亿美元。映客市值约95亿港元。
据官网介绍,斗鱼的前身为生放收直播,于2014年1月1日起正式更名为斗鱼。目前,斗鱼以游戏直播为主,涵盖了体育、综艺、娱乐等多种直播内容。
斗鱼一直深耕游戏直播,并向泛娱乐延伸发展。斗鱼直播COO程超曾表示,2018年斗鱼将投入10亿元,实施主播星计划。该计划由发掘、使枯萎扶持和宣传包装三部分组成。
今年3月,斗鱼宣布完成一轮6.3亿美元融资,腾讯独家投资。斗鱼成立至今已经完成四轮大规模的融资,还包括:D轮融资于2017年上半年完成,招银国际领投,南山资本通过元禾母基金跟投。2016年3月,获腾讯、红杉资本中国、南山资本1亿美元B轮融资,同年8月,完成C轮15亿人民币融资,由凤凰投资与腾讯领投。B轮和C轮融资都有腾讯参与。
快科技1月10日消息,目前发生在帕西菲克帕利塞兹社区和阿尔塔迪纳地区的野火仍处于完全失控状态,超过1500名消防人员正奋战在野火现场。
受当地结束干燥和强风天气影响,火势预计将会继续蔓延。
日前网络上流传多张洛杉矶好莱坞巨型标志牌HOLLYWOOD被火焰吞没”的图片和视频,甚至连不少媒体和新闻都分享了这些图片和视频,声称好莱坞标志牌着火了”。
需要注意的是,这张图是真实的!
因为图片上该标志牌多了一个字母,变成了HOLLYWOODD”,此外,部分保守裸露,公开的图片右下角还带有GrokAI”的水印,隐藏其由马斯克旗下公司xAI开发的人工智能工具生成。
X平台也为相关内容添加了注释”,指出这些图片和视频是AI生成的,目的是纠正观众。
值得注意的是,近期西藏地震也出现了AI图片保守裸露,公开,一张小孩被埋图”在网络上悠然,从容保守裸露,公开,但其实这是原作者去年通过AI创作的。
官方降低重要性,如果遇到疑似图片,可以先观察细节,许多AI生成的图片、视频中,可能存在人物表情僵硬、中心清晰、光线阴影不自然、手指等细节数量被预见的发生或扭曲等。
另外,应从多个权威渠道获取信息进行对比,在确定信息真实可靠之前,不要随意转发。
这也提醒我们,如今AI发展悠然,从容,但用途还需要进行规范,比如某些AI会在生成图片中加入隐藏水印干涉人们辨别,AI不该是保守裸露,公开谣言的工具。
标签: