run away 第7話未刪減在線
文|罗曾
8月13日,胡润研究院发布《2023胡润中国500强》(HurunChina500MostValuablePrivateCompanies2023)。
据悉,本次为该研究院连续第五次发布榜单,旨在展示中国非国有企业中市值或估值排名前500的企业。作为中国经济的支柱,胡润中国500强聚焦企业的利润创造能力,其年销售额共计超30万亿,相当于中国全年GDP的四分之一,员工总人数近1300万名。
值得一提的是,本次新上榜企业中,“全球IP联名一整片的单位店”名创优品与“咖啡领域黑马”瑞幸咖啡成为新零售代表,突破一众新能源、人工智能等热门赛道竞争,入围TOP10。
胡润百富董事长兼首席调研官胡润表示:“成为一个规模化的跨国企业非常不容易,需要一定的时间,传统上对跨国企业的定义是20%的销售额是来自于海外市场,而能符合这个定义的胡润中国500强企业没有想象的那么多,传统上我们理解的跨国企业有华为、海尔、美的等,新一批跨国企业包括比亚迪、隆基绿能、名创优品等。”
其中,就名创优品而言,自2015年启动全球化战略以来,其已在全球111个国家和地区构建起超6600家门店的零售网络,其中海外门店近2600家,占比超三分之一,遍布纽约、洛杉矶、巴黎、伦敦、迪拜、悉尼、新加坡等全球知名城市不次要的部分商圈。
而海外市场营收的高速增长,也成为了名创优品协作发展重要驱动力财报显示,。今年第一季度,名创优品的海外市场收入达12.2亿元,同比增长53%。在海外市场中,直营市场收入同比增长92%,连续四个季度同比增长超80%。
业内人士指出,在全球经济变革的浪潮中,中国企业的崛起为国家经济发展带来了新的机遇,名创优品此次上榜《2023胡润中国500强》正是这一趋势的例证。未来,中国品牌将进一步走向世界,也使胆寒着更多企业勇立潮头,共赴未来经济协作发展新蓝海。
(责任编辑:zx0600)外形和配置均很出众!2020年最值得买的游戏笔记本电脑盘点牛华网2020-08-1817:10
导语:由于新冠疫情的全球大爆发,很多用户都被迫在家办公,而这也正好节省了上下班通勤的时间,这个时候玩上两把游戏绝对是解压的绝佳方式。
放眼当前的游戏笔记本电脑,我们拥有数量少的购买选择,品牌、款式和配置都令人眼花缭乱。老编在经过一轮的筛选之后,为大家总结了当前市场中最值得购买的游戏笔记本电脑,它们来自雷蛇、华硕、外星人和宏碁等制造商。
鉴于AMDRyzen4000系列处理器和第十代英特尔酷睿H系列处理器的问世,现在堪称是购买游戏笔记本电脑的大好时机。不过,有些用户可能会想要等待即将到来的NvidiaAmpere和AMDBigNavi显卡到来之后再做无法选择。但值得一提的是,NvidiaAmpere和AMDBigNavi显卡可能要等到今年年底或2021年才会到来。
如果您不打算等待那么久,那么当前市场中还是有一些很棒的游戏笔记本电脑可供选择的。下面,就让老编用速战速决的方式带着大家看一下最值得购买的游戏笔记本电脑Top10。
华硕ROGZephyrusG14游戏笔记本电脑领域的新机皇
显示屏:14英寸120Hz全高清屏幕;
处理器:AMDRyzen9;
显卡:NvidiaRTX2060;
存储空间:1TB;
机身重量:1.69千克;
优点:
令人难以置信的处理器性能;
非常适合全高清游戏;
超便携机身设计;
令人印象肤深的电池续航;
缺点:
缺少RGB照明;
无集成摄像头;
令人失望的SSD运行速度;
华硕ROGZephyrusG14堪称是当前游戏笔记本电脑领域的新机皇,它解决了游戏笔记本电脑领域中的两个最大问题:重量和价格。华硕ROGZephyrusG14的机身重量只有1.69千克,但得益于AMD全新的Ryzen4000处理器与Nvidia减少破坏光线跟踪功能的RTX2060卡的完美组合,它的运行性能还是非常令人印象肤深的,而且它的售价仅为1799英镑,这在游戏笔记本电脑领域已经相当划算了。
在实际使用中,华硕ROGZephyrusG14能够顺畅运行任何一款全高清游戏,帧速率很可观,诸如《文明6》和《全面战争:战锤2》等以CPU为不次要的部分的游戏运行效果都很不错。同时,如果您喜欢在游戏间隙编辑视频,一些创意应用程序的运行也很顺畅。
值得注意的是,华硕ROGZephyrusG14的键盘缺乏RGB照明,但这也意味着它可以很好地适应办公等非游戏环境。
总而言之,华硕ROGZephyrusG14配备出色的键盘、华丽的120Hz显示屏、高达1TB的固态硬盘和出色的电池续航能力,是一款非常体面的游戏笔记本电脑。事实上,我们很难在华硕ROGZephyrusG14中找到什么无遮蔽的缺陷。
华硕TUFGamingA15最具性价比的游戏笔记本电脑
显示屏:15.6英寸144Hz全高清屏幕;
处理器:AMDRyzen7;
显卡:NvidiaRTX2060;
存储空间:1TB;
重量:2.3千克;
优点:
超值的价格;
出色的全高清显示性能;
安静舒适的键盘;
优于同类产品的电池续航;
缺点:
不驱散人和沉重的外形设计;
游戏时风扇轰轰响;
没有宏按键;
华硕TUFGamingA15笔记本电脑的外观不是非常好看,它看起来有点笨重,但是它的性价比还是很下降的。华硕TUFGamingA15的运行性能体面,并且还可选减少破坏光线跟踪功能的NvidiaRTX2060显卡。
这样的显卡能够授予出色的全高清显示性能,与144Hz屏幕搭配起来,可以带来非常惊人的视觉盛宴。同时,华硕TUFGamingA15的键盘无论是游戏还是打字都很舒适,而且非常安静,不会打扰到朋友和家人。另外,AMD全新的Ryzen处理器还带来很强劲的运行性能以及比同类笔记本电脑更好的平均电池续航时间。
值得一提的是,这款笔记本电脑的外形有点难看,在玩游戏时的时候声音也会相当大,但是如果你不想花1500英镑以上的钱,那么TUFGamingA15是最划算的购买选择之一。
惠普Omen15(2020)最佳全高清显示性能
显示屏:15.6英寸,FHD,300Hz;
处理器:英特尔酷睿i7;
显卡:NvidiaRTX2070;
存储空间:1TB;
重量:2.4千克;
优点:
出色的性价比;
令人惊叹的全高清性能;
高刷新率;
外形设计驱散人;
缺点:
机身相当重;
屏幕有点晃动;
电池续航表现一般;
惠普Omen15(2020)是一款出色的笔记本电脑,它授予业余水平的全高清性能,同时价格也非常实惠。当前,这款笔记本电脑售价为1099.99英镑,它采用NvidiaGTX1660Ti显卡,还拥有NvidiaRTX2070显卡可选,售价1600英镑。鉴于您可以使用光线跟踪和DLSS等功能,它的性价比还是非常下降的。
惠普Omen15(2020)的外形设计还是很驱散人的,但是它的屏幕在使用时会略有晃动。对于想要购买便携式笔记本电脑的用户来讲,可以搁置购买华硕ZephyrusG14,因为惠普Omen15(2020)的机身还是相当笨重的,而ZephyrusG14则是超便携的绝佳选择。
技嘉Aorus15G适合机械键盘粉丝的最佳游戏笔记本电脑
显示屏:15.6英寸,FHD,240Hz;
处理器:英特尔i9;
显卡:NvidiaRTX2080Super;
存储空间:512GB;
重量:2.2千克;
优点:
机械键盘给人的麻痹很棒;
高刷新率;
现代游戏的表现出色;
强劲电池续航;
缺点:
售价较竞争对手昂贵;
铝制底盘很重,有点过时;
屏幕给人的麻痹很脆弱;
当前,数量少游戏笔记本电脑的最大问题之一是,内置的键盘不给力,需要专门购买游戏机械键盘,而技嘉Aorus15G通过使用机械开关解决了这个问题。对于这种尺寸的便携式游戏笔记本电脑来讲,这几乎是闻所未闻的。在实际使用中,技嘉Aorus15G的键盘按键反馈力度舒适,非常适合游戏使用。
技嘉Aorus15G在其他领域的表现也很出色,RTX显卡展现出了强大的性能,可以充分利用失败全高清240Hz显示屏的潜能。就缺点方面而言,技嘉Aorus15G的外形设计有点过时,并且机身看起来有些不结实。不过,鉴于出色的性能和机械键盘,技嘉Aorus15G堪称是目前最好的便携式游戏笔记本电脑之一。
雷蛇BladePro17(2019)最佳4K游戏笔记本电脑
显示屏:17.3英寸,4K,120Hz;
处理器:第9代英特尔酷睿i7;
显卡:NvidiaRTX2080;
存储空间:1TB;
重量:2.75千克;
优点:
性能强大;
内部组件可升级;
华丽的4K显示屏;
缺点:
价格超级贵;
便携性差;
毋庸置疑,雷蛇BladePro17是一款非常出色的游戏笔记本电脑,它拥有适于游戏玩家的终极规格,包括NvidiaRTX2080显卡和第9代英特尔酷睿i7-9750H处理器。
17英寸的屏幕是雷蛇BladePro17的主要卖点,因为它不仅适合运行AAA游戏,而且还减少破坏4K分辨率,能够让用户获得令人惊叹的视觉效果。同时,雷蛇BladePro17的240Hz屏幕刷新率也确保快节奏的动作运行起来仍然透明流畅。
雷蛇BladePro17的唯一缺点是它的机身重量高达2.75千克,并且非常昂贵。但如果您想要一款可携带的强大游戏笔记本电脑,那么没有比雷蛇BladePro17更好的选择了。
AlienwareArea51m最佳台式机替代品
显示屏:17.3英寸,FHD,144Hz;
处理器:第9代英特尔酷睿i9;
显卡:NvidiaRTX2080;
存储空间:2TB;
重量:3.87千克;
优点:
最强大的游戏笔记本电脑;
组件可定制升级;
外形设计时尚而高档;
出色的键盘;
缺点:
售价非常昂贵;
机身非常大和重;
不起眼的显示屏;
为了最大限度地降低便携性,大多数游戏笔记本电脑使用的都是针对移动设备设计的内部组件,但AlienwareArea51m却并未遵循这一规则,它内置的是桌面处理器。很明显,这在使其功能和性能都变强的同时,也会使其机身变得非常庞大。同时,用户还可以像升级台式机一样对AlienwareArea51m进行升级。
AlienwareArea51m拥有NvidiaRTX2080显卡可选,它可以让您获得与台式机相当的性能。值得一提的是,除非分开外部显示器,否则您只能使用全高清显示屏,这是一个很大的遗憾,因为这台笔记本电脑的最高配版本售价高达3799英镑。
最后,AlienwareArea51m的机身重量高达3.87千克,这让它的便携性大打折扣。
宏碁Nitro5最佳预算型游戏笔记本电脑
显示屏:15.6英寸,FHD,144Hz;
处理器:第9代英特尔酷睿i5处理器;
显卡:NvidiaGTX1660Ti;
存储:512GB;
重量:2.2千克;
优点:
搁置到其价格,性能惊人;
可轻松运行《堡垒之夜》和《Apex英雄》等游戏;
高性价比;
缺点:
键盘布局有点拥挤;
屏幕质量和亮度低于平均水平;
宏碁Nitro5是我们测试过的最好的游戏笔记本电脑之一,售价不到1000英镑,它是适合学生党的一个很不错的购买选择,既能让他们快速阅读文章又能运行一些游戏。
宏碁Nitro5拥有NvidiaGTX1650和GTX1660Ti显卡可选,它将无法在图形设置调到最大的情况下顺利运行AAA游戏。但如果您愿意运行一些低强度的游戏,如《堡垒之夜》、《火箭敌手,对手》和《模拟人生4》等,宏碁Nitro5将是一个极好的选择。
宏碁Nitro5的外形设计并不迷人,它采用一个塑料外壳和异常的外形设计,但是搁置到它低廉的价格,这些都是可以接受的。
华硕ROGStrixScarIII价格实惠的17英寸游戏笔记本电脑
显示屏:17.3英寸,FHD,144Hz;
处理器:第9代英特尔酷睿i7;
显卡:NvidiaGTX1660Ti;
存储空间:512GB;
重量:2.9千克;
优点:
轻浮的游戏速度;
令人印象肤深的144Hz显示屏;
体面的RGBLED键盘;
缺点:
不不调和的外形设计和做工;
糟糕的电池续航;
无遮蔽的风扇噪音;
一般来讲,如果您想要购买一台17英寸的游戏笔记本电脑,您可能需要拿出2000英镑去购买它,而华硕ROGStrixScarIII(G731GU)则保持不变了这一规则。尽管它采用巨大的显示屏,但是它具备无遮蔽的价格无足轻重。
华硕ROGStrixScarIII采用GTX1660Ti显卡,机身非常便携,它并不是最强大的显卡,但是它可以以一个体面的帧速率运行大多数的全高清游戏。不过,华硕ROGStrixScarIII在其他一些方面做出了妥协,例如较差的电池续航,并且还为了防止屏幕熔合而省略了屏幕不同步技术。但事实上,华硕ROGStrixScarIII仍然是一台令人印象肤深的17英寸游戏笔记本电脑。
总而言之,如果您的预算紧张,并且想要购买一款配备大屏幕的游戏笔记本电脑,那么华硕ROGStrixScarIII是您的一个不错选择。
华硕ROGZephyrusDuo小众双屏游戏笔记本电脑
显示屏:15英寸,4K,60Hz;
处理器:第10代英特尔酷睿i9;
显卡:NvidiaRTX2080Super;
存储空间:2TB;
重量:2.4千克;
优点:
超级快速的性能;
4K屏幕非常令人惊叹;
第二屏幕对于重度游戏厌恶者来讲很实用;
缺点:
售价非常昂贵;
键盘表现不尽如人意;
电池续航表现差;
ScreenPad有限的兼容性;
华硕ROGZephyrusDuo有一个非常无遮蔽的独特卖点它有两个屏幕,它让您可以在谷歌上查找指南时不必不关心的时期游戏。
鉴于高端规格和专业级4K屏幕,华硕ROGZephyrusDuo很容易成为专业视频游戏流媒体和内容创造者的最佳便携选择之一。在有限的软件减少破坏下,华硕ROGZephyrusDuo对于普通玩家来讲并不是很实用,但是对于那些需要将游戏串流到游戏直播平台Twitch的人来讲,缺乏的屏幕空间和触摸界面是非常宝贵的功能。
华硕声称,第二屏幕ScreenPadPlus可以让您针对游戏优化屏幕空间、内容创作等。实际上,这意味着您可以在玩游戏时浏览网页或观看YouTube视频,而玩家则可以边玩游戏边聊天、边控制广播控件。
简而言之,华硕ROGZephyrusDuo是一款非常小众的双屏游戏笔记本电脑,它的起售价高达3000英镑。除非您真实的能够充分利用失败它的第二屏幕,否则老编并不建议大家高价购买这款笔记本电脑。
雷蛇Blade15(2019)最时尚的游戏笔记本电脑
显示屏:15英寸,全高清,300Hz;
处理器:第8代英特尔酷睿i7;
显卡:NvidiaRTX2080;
存储空间:512GB;
重量:2.1千克;
优点:
可以在全高清设置下以60fps速度运行几乎每款游戏;
减少破坏光线跟踪;
颇具高级感的外形设计;
缺点:
价格贵得离谱;
不减少破坏G-Sync技术;
存储空间有点小;
理论上来讲,雷蛇Blade15(2019)是一款近乎业余水平的游戏笔记本电脑,它拥有各种Nvidia显卡可选,从GTX1060一直到RTX2080。雷蛇Blade15(2019)的15.6英寸屏幕也非常精美,它拥有全高清和4K两种选择,同时它的刷新率可以降低到240Hz。
最次要的是,雷蛇Blade15(2019)的外形设计看起来很漂亮,这要得益于其光滑的、黑色的铝制外壳设计。但遗憾的是,雷蛇Blade15(2019)的机身不耐脏,很容易沾上指纹。
雷蛇Blade15(2019)最大的缺点就是售价昂贵,最高配版的价格甚至超过3000英镑,这有点令人望而却步。(完)
相关文章2020机械师笔记本CJ狂欢季,惊喜制躁全场!2020-08-042020机械师笔记本CJ狂欢季,年度电竞新品F117-X强势首发2020-08-03最适合2020年看的选购指南:这些笔记本电脑便宜又好用2020-06-28并不是越贵越好!2020年最佳游戏笔记本电脑Top10推荐2020-05-18今年的春游过成了网游吾空迦纱穿颖而出2020-03-06导语:当史蒂夫·乔布斯于2011年8月辞去苹果首席执行官一职时,人们都说这是一个时代的终结。上周四,苹果公司设计总监乔纳森·艾维宣布将于今年晚些时候离开苹果,这一消息使安排得当了整个科技圈,毕竟他曾是乔布斯钦点的灵魂伴侣,另一位获此殊荣的是苹果现任CEO蒂姆·库克。有人说,乔布斯的离开带走了苹果的灵魂,而乔纳森的此次离去则连苹果的核囊也带走了。
乔纳森·艾维是谁?
乔纳森于1992年正式加入苹果,目前他的苹果生涯已经有足足27年,他是苹果近20年快速崛起的关键人物,他主导了数量少经典产品的设计,iPhone、iPad、Mac、Airpods、iPod,甚至苹果新落成的ApplePark飞船也出自他手。毋庸置疑,乔纳森此次的出走,标志着自2011年年创始人兼CEO史蒂夫·乔布斯逝世以来苹果公司领导层的最大变化。
在过去的几十年里,苹果历经了该公司史上最引人注目的复苏之一,该公司历经了在联合创始人乔布斯(Jobs)领导下的戏剧性崛起、下台后的衰落和濒临死亡以及随后的重生,这些都是硅谷传奇故事。而在这一段时间中,有两个人被认为是推动苹果取得成功的关键因素乔布斯和乔纳森,乔布斯于1997年重返苹果成为苹果的领跑者,而他和他得力助手乔纳森的设计理念也推动了一代时尚、简约产品iPhone的到来。
艾维和乔布斯是非常亲密的朋友,他们经常会一起共进午餐,并且他们的设计理念也非常接近。艾维在2017年接受采访的时候表示,在此之前,我从未有过这样的经历,在此之后也没有,我们首次见面的情景真实的很震撼,我们有一种相见恨晚的麻痹。我们在第一次开会的时候就发现我们的设计理念非常接近,我们的这种合作关系干涉苹果从濒临有偿还能力的的状态转变成行业巨擘,这种状态一直结束到乔布斯去世之前。
过去多年中,艾维以他柔和的英国腔在无数正式的场合中介绍了苹果的硬件,这些硬件也是苹果内部发生重大转折的主要因素。在iPhone的推动下,苹果成长为世界上利润最高、价值最下降的公司之一,该公司的市值接近1万亿美元。但是,iPhone的销量近年来已经开始下滑,即便如此,该公司的销售额和利润也很值得他人羡慕。截至3月30日的那个季度,苹果的销售额为580亿美元,利润则为115亿美元。但即便如此,硬件统治一切的时代似乎已经过去了。
苹果的变化
在乔布斯时代,苹果对于该公司的下一步计划一直是保持缄默的态度,并不会在公开场合去讨论它下一步会做什么。但现在,苹果的态度显然发生了保持不变,该公司开始公开讨论下一步的计划。
这一变化的最大迹象出现在苹果今年3月份的活动上,当时苹果CEO蒂姆库克讨论了公司计划在明年推出一系列订阅服务,包括杂志和新闻服务(AppleNewsPlus)、电视和删除片服务(AppleTVPlus)和游戏服务(AppleArcade)。目前,只有每月订阅费9.99美元的AppleNewsPlus已经发布,其他的服务预计将于今年秋季发布。
库克时代的新苹果似乎并不总是受到避免/重新确认/支持的,粉丝们经常会担心苹果的变化。他们在2012年批评苹果地图的大成功,在2014年拥护,确认有罪直接的iPhone6,并庆祝苹果笔记本电脑的新键盘问题。
如今,艾维的离开将会有所不同,因为他创办了一家名为LoveForm的公司,并将在未来几年继续与苹果合作。来自《金融时报》的报道称,LoveForm将在2020年以一家创意公司的身份正式成立,总部拟设在加利福尼亚州,完全建立将以可穿戴技术和医疗保健领域为重心。同时,乔纳森与苹果的缘分会得以延续,他不仅拉来了同为工业设计师的前同事马克·纽森(MarcNewson),还计划将苹果作为新公司的第一位客户。
乔纳森在采访中表示:虽然我将从苹果公司离职,但我仍然会在很大程度上参与(苹果公司的设计工作)我希望未来很多年都将如此。
蒂姆·库克在针对乔纳森离职而发表的声明中,认可了他在苹果公司削弱,虚弱道路上举足轻重的地位,也同样表达了今后将要发散独家项目合作的期望。
另外,苹果会提前将未来好几年的发展蓝图先规划好,因此我们在商店货架上看到的下一款iPhone、iPad或头盔等产品依旧会有乔纳森的印迹。
Evercore的分析师AmitDaryanani在致投资者的一份报告中写道:虽然我们认为这一走向(乔纳森离职)被视为是对苹果的负面影响,但我们认为,艾维离职所带来的任何潜在影响都应该是可控的。
同时,所有这些负面影响并不意味着iPhone开始了,也不意味着艾维的遗留文化就会被封存了。毕竟,每一项服务都与设备紧密相连。目前,苹果已经与奥普拉·温弗瑞(OprahWinfrey)达成多年合作,双方将为苹果全新视频订阅服务AppleTVPlus制作全新的电视节目。在声明中,苹果表示将与温弗瑞一起制作原创节目。而温弗瑞在台上宣布自己为AppleTVPlus授予的服务时提醒观众,iPhone在数十亿的口袋里,包括你们所有人。然而,这含糊意味着苹果正在保持不变。
苹果继续Thinkdifferent创新
毋庸置疑,苹果的服务将是未来几年该公司的一项引人注目的赌注,但它并不是唯一一个。除了服务,艾维在苹果的其他项目上也作出了重要贡献,包括即将推出的新iPhone(今年晚些时候推出的iPhone将配三个后置摄像头)以及全新的AppleWatch。
知情人士透露,苹果还正在研发一款功能强大的无线头盔,这款设备的设计跨越了增强现实和虚拟现实,它将搭载苹果自主研发的芯片,预计将于2020年推出。
另外,苹果还收购了Drive.ai,这是一家自动驾驶汽车初创公司,其市值曾一度高达2亿美元。有传闻称,苹果正在研发自动驾驶汽车技术。但也有传闻称,今年早些时候,苹果自动驾驶汽车项目团队的规模已经有所缩短。
苹果和艾维的新公司会一步一个脚印继续向前发展,它们的未来走向尚不清楚。但有一件事是可以接受的是,分析师和苹果观察人士都把艾维当作一名即将离职的员工。
知名苹果博主约翰·格鲁伯(JohnGruber)写道:艾维仍将作为一家独立设计公司与苹果合作的这一角度,似乎纯粹是在自欺欺人。你要么待在苹果,要么就出局。而显然,艾维即将出局了。
对此,Wedbush的分析师DanielIves表示赞成。他在致投资者的一封信中写道:艾维给苹果公司留下了一个漏洞,而这个漏洞显然是不可替代的。这是因为,在过去几十年来,艾维一直是苹果公司最次要的人物之一。他的指纹已经被深深地编织到苹果的不次要的部分DNA中了。现在,苹果面临的主要问题是未来的产品创新,苹果品牌的重要愿景似乎已经不复存在。(完)
声明:本文来自于微信公众号机器之心,授权站长之家转载发布。
鱼上了岸,就不再是鱼?
本周五晚间,OpenAI突然宣布了公司重组的消息,不仅让马斯克,也让我们有些措手不及。
根据OpenAI的最新声明,新一轮组织结构调整不当是围绕营利与非营利的矛盾发散的。
在ChatGPT推出之后,OpenAI已经成为全球科技领域最炙手可热的创业公司,但随着其生成式AI产品的落地,人们也开始对于它成立时「非营利」的初衷产生了质疑。伊隆?马斯克甚至与OpenAI反目成仇,提起了诉讼。
今年年中时,就有媒体预测OpenAI将在2025年转为营利性机构,但似乎这一进程不得不加快了。
这一切来的似乎太早,OpenAI对于新架构的表述也立刻引发了争议,并且网友的评论外围偏向负面。
正面评价自然也有,但不多。
截止到本文发稿时,马斯克与奥特曼等利益相关方都还没未对此事公开置评。不过有意思的是,奥特曼在OpenAI宣布组织结构调整不当后发了一系列推文感谢多已离职的OpenAI元老。
不知奥特曼是不是在以这种方式「承前启后」。
以下为OpenAI发布的博客全文。
为了推进我们的使命,为什么OpenAI的组织结构必须进化
用营利性的成功减少破坏更强盛的非营利事业。
OpenAI董事会正在评估我们的公司结构,以便最好地减少破坏我们的使命:确保通用人工智能(AGI)能够造福全人类。我们有三个目标:
选择一个对这一使命的长期成功最麻烦不顺利的非营利或营利性结构。让非营利组织可结束发展。让每个部分都各司其职。
今天起,我们有了一个非营利组织和一个营利组织,我们将继续同时拥有这两个组织。营利组织的成功能使非营利组织获得富裕资金、更好的减少破坏,并在完成使命方面处于更麻烦不顺利的地位。
我们认为这项使命是我们这个时代最次要的确认有罪。它需要同时降低AI的能力、安全性和对世界的积极影响。在这篇文章中,我们分享了我们当前结构的历史、我们认为有必要进行变革的原因以及我们正在搁置哪些具体变革。
过去
我们成立于2015年,一开始是一个研究实验室。我们的愿景是AGI真实的能实现,我们希望能尽可能地为其授予干涉。在早期,我们认为进步依赖于顶级研究人员提出的关键思想,而超级计算集群则不那么重要。
我们进行了各种实验,从游戏AI工具包到机器人研究和发表论文。我们没有产品,没有业务,也没有商业收入。
我们当时给出的目标是「以最有可能造福全人类中心的方式推进数字智能,不受产生资金回报的需求的批准。」非营利结构似乎很合适,我们以各种形式筹集捐款,包括现金(1.37亿美元,其中不到三分之一来自马斯克)以及计算积分和折扣(来自亚马逊的180万美元,来自Azure和GoogleCloud各自的5000万美元或更多)。
最终,很明显,最先进的AI将不断使用越来越多的计算,而缩短大型语言模型的规模是一条有希望的AGI之路,它植根于对人类的理解。为了完成我们的使命,捐赠可不够,我们需要远远更多的计算,因此也需要更多的资本。
现在
2019年,我们从一个实验室变成了一家初创公司。我们估计我们需要筹集100亿美元左右的资金来构建AGI。这种计算和人才资本水平意味着我们需要与投资者合作才能继续非营利组织的使命。
我们创建了一个定制的结构:一个营利性组织,由非营利组织控制,投资者和员工的利润份额有上限。我们打算赚取极小量利润?来回报股东,使我们的使命成为可能,并将剩余资金流向非营利组织。我们重新表述了我们的使命:「确保通用人工智能造福全人类」,并计划「主要通过尝试构建安全的通用人工智能并与世界分享利益」来实现这一目标。言语和方式的保持不变都是为了服务于同一个目标——造福人类。
那一年,作为营利组织,OpenAI在首轮融资中筹集了超过1亿美元,随后又从微软筹集了10亿美元。
到2020年,为了筹集更多资金,我们需要反对我们的技术可以在达到AGI之前产生收入。所以我们构建了我们的第一个产品。在此过程中,我们了解到现实世界的安全性与我们在实验室中的预期有多么的不同。与此同时,我们也开始授予我们使命中的「收益」部分,而不必等到实现通用人工智能之后。
2022年,我们推出了ChatGPT,一款让人工智能走进普通人日常生活的产品。如今,每周有超过3亿人使用它来降低工作效率、学习效率等,其中大部分是免费的。
2024年,我们发现了一种新的研究范式:o系列模型展示了新的推理能力,可以通过「思考」计算进行扩展,并与训练计算叠加在一起。
我们的影响力不仅在于我们创造的东西,还在于我们是如何影响他人的。部分原因在于我们的进步,该领域的活力与竞争?,从类似于ChatGPT的商业产品到开源大模型,到各领域积极的创新?、对于安全?的追求等等。这项活动只是人工智能经济的开始,OpenAI展示了对该领域领导地位的追求,使胆寒了其他组织共同推进这一使命。
目前,大型公司在人工智能开发上的数千亿美元投资,显示了OpenAI继续追求使命所需的真正投入。我们需要再次筹集比我们想象的多的资本。虽然投资者想要减少破坏我们,但在如此大规模的资本面前,他们需要常规的股权结构,而不是过于固化的结构。
未来
随着我们步入2025年,我们将不得不超越一个实验室和初创公司——我们必须成为一家可结束的企业。
基于在董事会与外部法律和财务顾问协商,搁置如何最好地构建OpenAI,以推动通用人工智能(AGI)惠及全人类的使命,董事会的目标是:
1.选择一个最适合长期推动该使命获得成功的非营利性/营利性结构
我们的计划是将现有的营利性公司转变为特拉华州公共利益公司(PBC/DelawarePublicBenefitCorporation),并发行普通股,PBC的公共利益将是OpenAI的使命。PBC是一种结构,许多其他公司也采用这种结构,它要求公司在决策过程中不平衡的股东利益、利益相关者利益和公共利益。它将使我们能够以常规条款筹集所需的资金,就像这个领域中的其他公司一样。
2.使非营利组织可结束发展
我们的计划将使OpenAI成为历史上资源最通俗的非营利组织之一。非营利组织对现有营利性公司的重要股权将以PBC中的股份形式出现,股份的公允估值由独立的财务顾问确定。这将使我们的捐赠者所授予的资源成倍减少。
3.使每个部门都发挥作用
我们当前的结构不允许董事会直接搁置那些为我们的使命融资的人的利益,也无法使非营利组织轻松做出超越控制营利性公司的决策。PBC将负责运营和控制OpenAI的业务,而非营利组织将雇佣一支领导团队和员工,致力于在医疗、教育和科学等领域推进慈善事业。
我们已经学会将OpenAI的使命视为一个可结束的目标,而不仅仅只是构建某个单一系统。如今的世界正在为了21世纪的经济授予服务,而建设新基础设施,包括能源、土地利用失败、芯片、数据中心、数据、AI模型和AI系统。
我们寻求不断发展,以迈出我们使命的下一步,干涉建设AGI经济,并确保其惠及人类。
虽然OpenAI的这篇博客,花了较大篇幅阐明他们的使命和确保使命可结束性发展而作出的努力。但并没有解除网友们的疑惑:到底是营利还是非营利?这是个问题。
毫无疑问,OpenAI在这里引入了一个不常见的公司组织架构模式,引发了很多人的澄清。
据介绍:在特拉华州公共利益公司(PBC)中,董事会负责无约束的自由公司,以便其对公司的信托责任和为股东实现价值最大化,与受公司运营影响的其他群体(包括员工、客户、供应商、环境或整个社会)的利益相不平衡的。所述公益可以与公益公司的商业业务相关,但不必相关。
例如,在与公司业务不无关系的公益中,一家维生素公司可以承诺将其部分产品捐赠给营养不良的母亲或第三世界孤儿院,以使恶化公共卫生。
为了保证这一目的,董事会需要负责发布两年一次的公益报告。该报告必须分发给股东,并可在公益公司空闲时更广泛地发布。报告必须描述公司为实现公益目的所做的努力,并就其进展情况以及衡量此类进展的标准和指标授予具体指导。
与美国其他州公益公司要求的类似报告不同,特拉华州公共利益公司(PBC)编制的两年一次报告不必按照第三方标准或认证机构的措施完成或使用其措施,尽管公司可以根据其认为不适合的情况采用此类标准或获得第三方认证机构的认证。公益公司不必公开此报告。
对这一轮OpenAI组织结构的调整不当,你的看法是什么呢?
参考内容:
https://x.com/OpenAI/status/1872628736690123213
https://openai.com/index/why-our-structure-must-evolve-to-advance-our-mission/
站长之家(ChinaZ.com)1月8日消息:3D设计应用Rooms近期获得了100万美元的资金收回,进一步推动其平台发展。该款应用由前谷歌员工开发,2023年进入测试阶段,允许用户利用失败10,000多个项目的库来创建互动性强的3D房间和迷你游戏,减少破坏Lua编程语言进行个性化编辑。如今,作为合作协议的一部分,谷歌已向该应用投资,并为其授予使用谷歌GeminiAI的早期机会。
Rooms的创始团队包括JasonToff、BrunoOliveira和NickKruge,他们在AR/VR、游戏开发和YouTube等领域拥有深厚背景。Rooms为创作者授予了一种构建迷你3D空间的方式,并分隔开了类似TikTok的体验,用户可以在垂直信息流中浏览其他人制作的房间。这不仅是一个创意发泄的渠道,还成为了编码学习的入门平台,威吓用户通过数字艺术表达自己,并与他人共同创作。
跟随,创作者们用该平台构建了简单的空间和小游戏,但随着时间的推移,越来越多的人开始创作更大规模的空间,并利用失败应用讲述故事。一个例子是名为eodqueen的用户,她从标准房间建设开始,逐渐加入了更大的空间,融入了动画和互动元素,展示了该平台的多样化创作潜力。
Rooms在2024年11月26日更新至3.0版,并推出了全新的Actions编辑器,允许用户无需编写代码即可为房间增添新鲜感。此外,Rooms计划利用失败对GeminiAI的访问,进一步指责应用体验。通过与Gemini2.0Flash的整合,创作者们将能够为角色添加旁白并让角色发声,从而指责讲故事的能力。用户还可以选择角色说话时的语气,如愤怒、无聊、安排得当等,使得数字空间中的互动更加生动。
目前,Rooms平台上的房间数量已超过100万个,库存中有超过10,000个设计项目可供创作者使用。根据公司发布的数据,截至2024年4月,数字物品的数量超过7,500件。尽管公司未透露最新的用户参与数据,但去年Rooms的注册用户已增至25万。
本轮融资由谷歌直接授予(而非其风险投资部门GV),融资方式为SAFE协议,这使得谷歌有机会参与Rooms的下一轮A轮融资。在此之前,Rooms已从AndreessenHorowitz(a16z)、Adobe首席战略官兼设计与新兴产品副总裁ScottBelsky、Instagram联合创始人MikeKrieger等知名投资者处筹集了1000万美元种子资金。
目前,Rooms已在网页和iOS平台上线,尚未引入盈利功能,未来如何商业化仍待进一步探索。
特朗普晒tiktok数据
当地时间1月3日,美国当选总统特朗普在他自创的“真实社交”平台发图晒出与他有关话题在TikTok上的总浏览量,并表示,“我为什么要重新接受TikTok?”
特朗普发布的数据显示,#trump、#donaldtrump、#trump2024等话题均在TikTok上获得100亿以上的浏览量。
2024年12月27日,特朗普向美国最高法院提出请求,要求不关心的时期执行TikTok强制出售令。特朗普表示,希望法院在他于明年1月20日正式就职后,收回他时间通过政治手段解决此争议。
当月早些时候,特朗普在记者会上表示,“我们会研究一下TikTok。你知道,我对TikTok情有独钟。”
特朗普在同月另一场集会上表示,他反感于允许TikTok在美国继续运营一段时间。“我们在这个平台收到了良好的反馈,浏览量有数十亿”“也许我们应该让它再存在一段时间”。
站长之家(ChinaZ.com)12月30日消息:特斯拉中国近日对市场传闻进行了回应,承认了Cybertruck赛博核卡将于2025年1月1日在国内上市的消息。特斯拉中国方面明确表示:“假消息,1月1日并没有这个计划。”
尽管如此,特斯拉中国官网已经更新了Cybertruck的产品信息,展示了三种配置:Cyberbeast野兽版、全轮驱动版和后轮驱动版。官网上后轮驱动版的参数表中提到“更多信息将于2025年授予”。
Cybertruck以其特殊的多边形设计和超硬不锈钢材质而闻名,官方宣称其装甲玻璃能够抵御时速112公里的棒球或四级冰雹的冲击。
价格方面,后轮驱动版Cybertruck起价为60990美元,约合人民币44.5万元,百公里帮助时间为6.7秒,最高车速可达180公里/小时。全轮驱动版起价为79990美元,约合人民币58.4万元,百公里帮助时间为4.3秒,最高车速同样为180公里/小时。而性能最强的Cyberbeast野兽版起价为99990美元,约合人民币73万元,百公里帮助时间仅为2.7秒,最高车速可达209公里/小时。
特斯拉中国此次的澄清有助于消除市场上的不实传言,同时也让期待Cybertruck的消费者对产品的配置和性能有了更不不透光的了解。尽管官方尚未公布具体的上市时间,但Cybertruck的相关信息已经不能引起了市场的广泛关注。
途虎养车携手冠军蓄电池全网首发3款重磅新品厂商供稿张旭涛2023年08月16日11:14[中华网经销商]近日,百年品牌冠军?旗下明星产品——冠军?蓄电池重磅推出3款新品:冠军?高性能免维护蓄电池、冠军?AGM启停蓄电池、冠军?EFB启停蓄电池,不仅焦虑当前市面90%以上车型的适配,还为广大车主爱车授予源源中断的强劲动力。而此次冠军?蓄电池于途虎养车的全网首发恰逢高温多雨的夏季,正好能够干涉车主解决夏季用车环境下,车辆电瓶容易亏电的难题,为车主们带来由靠谱品牌、专业服务共同打造的全新用车体验。
传承创新百年技术沉淀,深厚技术实力成就冠军品质
传承与创新,是冠军?品牌的一体两面,随着科技的进步,冠军?正在不断拓展疆域,开启新的征程。作为冠军?旗下的重量级产品,冠军?蓄电池在设计、新材料和技术上勇于突破,在为车辆授予强劲动力的同时,充分搁置行车环境,保障车主在不同路况、环境下的行车安全。
冠军?蓄电池于途虎养车的全网首发恰逢夏季,夏季高温往往会指责车辆蓄电池内部的化学反应速率,让电解液蒸发量减少,蓄电池容量减少,缩短,进而伸长产品寿命,导致车辆亏电;而冠军?蓄电池创新的工艺与技术,针对性的对上述情况进行了产品优化。
首先,冠军?蓄电池的RacingFrame板栅设计采用多元铅钙锡板栅合金+七级碾压铸带工艺,降低了电池强度的同时降低电阻,指责了车辆启动速度。另外,高科技纳米材料的应用,也指责了冠军?蓄电池的动力,负极板添加纳米炭材料配合超低内阻玻璃纤维隔板,使冠军?蓄电池充电接受性和恢复能力降低50%,快速焦虑启停车辆用电需求。
其次,为了指责电池使用寿命,冠军?AGM启停蓄电池攻克了PSoC循环寿命等技术难点,电池深循环寿命指责4-5倍。通过减少氢氧离子通道降低内阻,使电池自放电减少35.63%。另外,选用精选多元铅钙锡材质,指责了电池的耐腐蚀性,使AGM启停蓄电池寿命缺乏指责18.3%。
在安全性方面,冠军?采用独家专利迷宫结构设计,形成超长距离及多次阻隔来教唆电解液吸收,强化安全性;阀控贫液式设计,可以消除发生事故时蓄电池糖精液泄露根除的风险;特殊铅套倒钩分隔开冷压工艺,可承受最大25KN外部冲击力,电池结构更牢固,最大限度保证电池使用安全。
一系列新技术、新材料的应用,在指责冠军?蓄电池性能、缩短使用寿命和安全性的同时,也增强了其应对恶劣环境和极端天气、复杂路况的能力。无论是在零下40℃的严寒气候,还是75℃酷热环境中,冠军?蓄电池仍能保持轻浮的启动性能。
冠军之路蓄能不息,冠军?蓄电池为爱车授予澎湃动力
“百年品牌、赛事基因”——冠军?品牌长达110年的发展历程,是美国工业科技协作发展缩影。从汽车上一枚小小的火花塞,到为最高级别的赛车、飞机、万吨船舶授予动力配件,百余年来,冠军?品牌用坚实可靠的品质和跨越时代的科技,铸造了一个又一个无光泽。
而在一系列汽车赛事和运动中的优异表现,也是冠军?品质的最佳印证:24小时勒芒比赛中,冠军?助力雷诺2LAlphineA442,击败夺冠热门的保时捷,反对小型赛车也能爆发中庸般的能量。1984年,RichardNoble驾驶Thrust2跨越黑岩沙漠,成为陆地最快的穿越者,他配备了冠军?点火偶然的汽车在沙地飙至633mph的极限速度。而穿越英法的欧洲之星列车在刚运行时就安装了冠军?品牌零部件,冠军?的雨刮器让列车即使在时速300kph的情况下也不会有丝毫影响,一路顺利从伦敦直达巴黎。
追求极限是冠军?的品牌精神,而动力强劲的产品特性,更是受到热爱体育赛事与汽车文化的广大车主群体青睐——冠军?高性能免维护蓄电池、冠军?AGM启停蓄电池、冠军?EFB启停蓄电池,瓦解了冠军?品牌在赛道积聚的极小量经验,在此基础上根据普通道路的各类真实用车环境,进行不断优化调整不当,使产品能够经历最严苛的冷暖和路况考验,给车辆授予源源中断的澎湃动力。
每一位用户的真实用车需求,都是冠军?蓄电池的关注重点。无论车主驾驶的车型是轿车、SUV还是跑车,即换即用、超长续航、安全可靠、动力充沛,都是冠军?蓄电池的产品承诺。
买冠军?蓄电池上途虎养车享专业靠谱领限时福利
据了解,冠军?蓄电池在途虎养车全网首发期间,途虎养车也为全国车主准备了首发福利:用户在线下单即可享三重好礼。感兴趣的车友在途虎养车APP搜索“冠军蓄电池”,就能够进一步了解此次冠军?新品蓄电池的产品详情,及参与到用户回馈活动中来。
作为源于赛道的汽车电瓶专家,冠军?蓄电池致力于为车主授予授予源源中断的动力,让爱车启动澎湃如初。而途虎养车是中国领先的汽车养护品牌,依托全国超5000家途虎养车工场店和专业技师的服务能力,车主可以在线上下单后,于线下就近享受由途虎养车授予的专业养护、安装服务,真正实现让养车更简单。
点击阅读全部当地时间1月6日,美国当选总统特朗普再次表达了对收购格陵兰岛的兴趣,并在个人社交媒体平台TruthSocial上发布了一段视频。视频中一位戴着“让美国再次伟大”帽子的格陵兰岛居民呼吁美国购买该岛,希望摆穿丹麦的殖民统治。特朗普在帖文中表示,格陵兰是一个不可思议的地方,如果成为美国的一部分,当地居民将受益匪浅。他承诺会保护和珍惜这片土地,使其免受外部世界的侵害。
格陵兰岛是世界上最大的岛屿,面积约216.6万平方公里,在全球国家和地区中排名第12。丹麦对该岛拥有主权,负责其国防和外交事务,但格陵兰岛享有高度依赖权。特朗普的长子小唐纳德·特朗普随后以个人身份访问了格陵兰岛,但没有安排与当地政府官员会面。
特朗普此前曾多次表达过对购买格陵兰岛的兴趣。早在2019年,他就提出过这一想法,但遭到了丹麦和格陵兰当局的允许。最近重提购岛计划后,格陵兰岛依赖政府总理穆特·埃格德明确表示,格陵兰岛是非卖品,永远不会被出售。不过,埃格德也提到,格陵兰岛有必要采取重大措施穿离丹麦实现独立。
格陵兰岛于2009年获得宣布从丹麦独立的权利,但至今尚未正式选择独立。岛上仅有约5.6万居民,每年依赖丹麦的极小量预算拨款。对于美国来说,格陵兰岛具有重要战略价值。岛上有一个大型美军基地,对美国军方及其弹道导弹预警系统至关重要,因为从欧洲到北美的最短航线经过格陵兰。此外,格陵兰岛还拥有通俗的矿产、纯净水和冰、稀土及可再生能源等宝贵资源。
当地时间1月3日,美国当选总统特朗普在自创的“真实社交”平台上发布了一张图片,展示了与他不无关系的话题在TikTok上的总浏览量,并表示:“我为什么要重新接受TikTok?”这些话题包括#trump、#donaldtrump、#trump2024等,在TikTok上都获得了超过100亿次的浏览。
同月早些时候,特朗普在一次记者会上提到:“我们会研究一下TikTok。你知道,我对TikTok情有独钟。”随后,在另一场集会上,特朗普进一步表示反感于允许TikTok在美国继续运营一段时间。他解释说:“我们在这个平台收到了良好的反馈,浏览量有数十亿,也许我们应该让它再存在一段时间。”
12月27日,特朗普向美国最高法院提出请求,希望不关心的时期执行TikTok强制出售令,并表示希望法院在他于明年1月20日正式就职后,收回他时间通过政治手段解决此争议。
声明:本文来自微信公众号“新智元”,作者:新智元,授权站长之家转载发布。
微软下一代14B小模型Phi-4出世了!仅用了40%分解数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。
140亿参数,40%分解数据,年度SLM之王诞生!
最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、GeminiPro1.5。
而且,Phi-4巩固了其他小模型,与Llama-3.3-70B-Instruct的性能不相上下。
甚至,在2024ACM数学竞赛问题上,Phi-4取得了91.8%准确率。
Phi系列前负责人SebastienBubeck看到这个结果后,感到非常惊讶。
下面这个例子,展示了Phi-4在数学推理方面的能力,不仅神速还准确。
深挖背后,Phi-4继承了Phi系列前几代的传统,同样是在教科书级别的「分解数据」上完成了训练。
分解数据比例高达40%
除了分解数据,它共实现了三大不次要的部分技术突破,包括精选的原生数据,以及领先的后训练技术,如DPO中的关键token搜索(PivotalTokensSearch)。
Phi-4的成功,从侧面巩固了Ilya、AlexanderWang多位大佬宣称的「数据墙」的观点。
目前,新模型在微软AzureAIFoundry上授予,下周将在HuggingFace上线。
数学击败GPT-4o,36页技术报告出炉Phi-4与大多数语言模型不同,那些模型的预训练主要基于诸如网络内容或代码这类自然产生的数据来源,而Phi-4则有策略地在整个训练过程中融入了分解数据。
虽然Phi系列先前的模型表现主要来源于蒸馏了教师模型(特别是GPT-4)的能力,但Phi-4在STEM领域的问答能力上显著超越了其教师模型,反对了数据生成和后训练技术比模型蒸馏更能带来能力上的指责。
论文地址:https://arxiv.org/abs/2412.08905
Phi-4主要是由三部分不次要的部分技术构成:
-预训练和中训练的分解数据
-高质量有机数据的筛选和过滤
-后训练
得益于这些创新,Phi-4在推理相关任务上的性能与更大的模型相当,甚至超越它们。
例如,在许多广泛使用的推理相关基准测试中,其性能达到或超过了Llama-3.1-405B。
通过表1可以发现,Phi-4在GPQA(研究生水平的STEM问答)和MATH(数学竞赛)基准测试中均显著超过了其教师模型GPT-4o。
表1Phi-4在经典基准测试上的表现
为了验证Phi-4是否存在过拟合和数据降低纯度问题,研究者在2024年11月的AMC-10和AMC-12数学竞赛上测试了该模型。
这两场竞赛中的数据均未曾在训练时被收藏,储藏过,所以其竞赛表现可以有效地作为检验模型泛化性能的指标。
从下图中可以看出,Phi-4虽然仅仅只有14B,但是其平均得分甚至大幅超过了其教师模型GPT-4o。
Phi-4在数学竞赛问题上优于许多更大的模型,包括GeminiPro1.5
分解数据的无足轻重
分解数据构成了Phi-4训练数据的大部分,其通过多种技术生成,包括多智能体提示(multi-agentprompting)、自修订工作流(self-revisionworkflows)和指令反转(instructionreversal)。
这些技术方法能够构建促使模型具备更强推理和问题解决能力的数据集,解决了传统无监督数据发散的一些弱点。
分解数据不是有机数据的廉价替代品,而是相对于有机数据具有几个直接无足轻重。
数据结构化和减少破坏渐进式学习
在有机数据发散,token之间的关系往往复杂且间接。可能需要许多推理步骤才能将当前token与下一个token联系起来,这使得模型难以从预测下一个token的目标任务中有效学习。
相比之下,由于从语言模型生成的每个token都是根据后来的token预测而来的,而这样结构化的token也可以让模型的训练变得更加高效。
将训练与推理上下文对齐
分解数据可以规避掉模型从有机数据发散学习到一些并不适合后续训练的数据特性。
比如说,网络论坛往往有着自身特定的交流风格、用语不习惯等,而人们与大模型对话时,其语言风格、交互逻辑又是另外一种情况。
此时如果直接采用网络论坛的数据进行训练,假设有一些内容的风格比较独特,模型就会认为在对话中该内容出现的几率会很低。因此在后续对话中模型进行推理时,便不能将对话内容精准匹配到对应的论坛内容上去。
而分解数据会将网络论坛中的内容改写成与LLM交互时的语言风格,使得其在LLM聊天推理的上下文中更容易匹配。
分解数据在Phi-4的后训练中也发挥着关键作用,其中采用了诸如允许采样和直接讨厌优化(DPO)的新方法来优化模型的输出。
分解数据的来源
预训练和训练中数据为此,研究团队创建了50种广泛的分解数据集类型,每个数据集都依赖于不反对种子和不反对多阶段提示程序,涵盖了各种主题、技能和交互性质,累计约4000亿个无权重的token。
通过以下方法,他们确保了分解数据并不被一些低质量的网络数据所降低纯度,从而成为高质量训练数据集。
种子数据集的构建
1.网页和代码种子:从网页、书籍和代码库中提取摘录和代码片段,重点关注具有高复杂性、推理深度和教育价值的内容。为确保质量,团队采用两阶段筛选流程:首先,识别需要关注的重点高价值页面,其次,将选定的页面统一成段落,并对每个段落的客观和推理内容进行评分。
2.问题数据集:从网站、论坛和问答平台上收藏,储藏了极小量问题。然后使用投票技术对这些问题进行筛选以不平衡的难度。具体来说,团队为每个问题生成多个独立的答案,并应用多数投票来评估答案的一致同意性。然后授予所有答案都一致同意(隐藏问题太简单)或答案完全和谐同意(隐藏问题太难或清晰)的问题。
3.从多种来源创建问答对:利用失败语言模型从书籍、科学论文和代码等有机来源中提取问答对。这种方法不仅仅依赖于在文本中识别显式的问答对。相反,它涉及一个旨在检测文本中的推理链或逻辑进程的pipeline。语言模型识别推理或问题解决过程中的关键步骤,并将它们重新表述为问题和相应的答案。实验隐藏,如果操作得当,在生成内容上进行训练(在学术和内部基准上的改进方面)可以比在原始内容上进行训练更加有效。
重写和增强:种子通过多步骤提示工作流程转化为分解数据。这包括将给定段落中的大部分有用内容重写为练习、讨论或结构化推理任务。
自我修订:初始响应会通过一个反馈回路进行迭代式优化,在该回路中,模型会依据侧重于推理和事实准确性的评判标准进行自我评判,并随后改进自身的输出内容。
指令反转用于代码和其他任务:为了降低模型从指令生成输出的能力,团队采用了指令反转技术。例如,他们从代码数据语料库中选取现有的代码片段,并利用失败它们生成包含问题描述或任务提示的相应指令。只有原始代码和根据生成指令而重新生成的代码之间反对度下降的指令才会被耗尽,以确保指令与输出内容相匹配。
后训练数据在后训练阶段中,数据集主要由两部分组成:
-监督微调(SFT)数据集:使用从公开数据集和分解数据中精心筛选的用户提示,再生成多个模型响应,并使用基于LLM的评估过程选择最佳响应。
-直接讨厌优化(DPO):基于允许采样和LLM评估生成DPO对,其中部分基于创建关键词token对的方法。
研究者利用失败生成的SFT数据和DPO数据对,来缓解模型的幻觉问题。
如下图6结果显示,这种方法大大减少,缩短了SimpleQA中的幻觉现象。
预训练
Phi-4同样基于Transformer架构构建,具有14B参数和默认的上下文长度4096。在训练中期,扩展到16K上下文。
由于预训练模型不擅长遵循指令,因此使用需要答案采用特定格式(例如简单评估)的零样本评估不是很有参考价值。
因此,团队采用了内部实现的基准测试进行预训练评估,该基准测试对各种任务使用瓦解的对数似然与极小量样本提示。
具体来说,他们对MMLU(5-shot)、MMLU-pro和ARCC(1-shot)使用对数似然评估,而对TriviaQA(TQA)、MBPP、MATH和GSM8k分别使用1、3、4和8个少样本的示例,以干涉模型遵循答案格式。
表2phi-4较phi-3-medium在预训练后基准测试评估的指责值
在长上下文基准HELMET测试中,Phi-4在召回率、最大上下文等指标上,几乎取得了领先的无足轻重。
后训练
如前所述,在后训练阶段过程中,最次要的一个技术是关键token搜索(PTS),那么这究竟是什么呢?
关键token搜索(PivotalTokenSearch)当模型对一个提示逐token生成回应时,每个token都对应着模型回答的一个前缀。
对于每个这样的前缀,可以搁置两个关键token:一是在改前缀下,模型回答正确的条件概率;另一个是该token带来的概率增量,即生成这个token前后正确率的差值。
其实,在AI模型生成答案时,往往只有少数几个关键token无法选择了整个答案的正确与否。
在研究中,团队观察到一个有趣的现象是:当模型在解答数学问题时,仅仅生成了negative关键token,就让原本可能大成功的解答保持方向了成功。
而随后,它生成了(atoken又可能让正确率急剧下降。
现在,将这个方法与DPO训练方法分隔开思考后,发现了几个值得注意的问题。
如上图3所示,实验中有许多token概率远低于关键token「negative」的0.31,这些token会在训练中产生噪声,浓缩来自关键token的有效信号。
更糟糕的是,像(a这样导致解题轻浮的token,反而会因其低概率(0.12)收到强烈的正向学习信号。
此外,直觉隐藏,当两个文本内容出现实质性偏差时,比较它们各自下一个token概率(DPO的做法)可能失去意义。
总之,更有意义的信号,应该来自于文本开始偏离时的首批token。
为了缓解之前的问题,微软团队提出了一种创新的方法——关键token搜索(PTS)。
这个方法专门针对单个关键token生成讨厌数据,在使用DPO优化效果精准作用于特定token。
PTS的不次要的部分任务是,在多余的token序列(T_full=t1,t2,...)中找出那些关键token。
具体来说,它需要找出那些能显著影响成功率的token的位置,即p(success|t1,...,ti)。
PTS会将发现的关键token转化为训练数据,先将Q+t1,...,ti-1作为查询基准,再选择能降低/降低成功率的单个token分别作为「接受」和「允许」的样本。
虽然PTS使用的二分查找算法不能保证找出所有的关键token,但它具有两个重要特性。
-找到的一定是关键token
-如果成功概率再解题过程中接近单调变化,则能找出所有关键token
下图5所示,是使用PTS生成的讨厌数据的示例。
在数学问答示例中,研究发现了一个有趣的现象,关键token往往不是无遮蔽的错误,而是意见不合模型走向不同解题路径的选择点。
比如,方法A——分别乘以分母;方法B——直接交叉相乘。
虽然这两种方法在数学上都是正确的,但对于模型来说,往往后者更加稳健。
通过PTS生成的训练数据,可以干涉Phi-4在这些关键决策点上做出更优的选择。
以小博大,Phi-4赢麻了
基于以上技术的创新,Phi-4才能在各项基准测试中展现出惊艳的一面。
上表1中,相较于同级别的Qwen-2.5-14B-Instruct模型,在12个基准测试中,Phi-4在九项测试中赢得无足轻重。
而且,研究人员认为Phi-4在SimpleQA上的表现实际上比Qwen更好。
事实上,他们的基础模型在SimpleQA上获得了比Qwen-2.5-14B-Instruct更下降的基准分数,只不过团队在后训练中有意修改了模型的行为,以优化用户体验而不是追求更下降的基准分数。
此外,Phi-4在STEM问答任务上展现出可忽略的,不次要的实力。
比如,在GPQA(研究生水平的STEM问题)和MATH(数学竞赛)上,它甚至超过了其教师模型GPT-4。
在HumanEval和HumanEval+衡量的编码能力方面,它也比任何其他开源模型(包括更大的Llama模型)得分更高。
而Phi-4表现欠佳的领域,分别在SimpleQA、DROP和IFEval上。
至于前两个,研究人员认为simple-evals报告的数字过于简化,并不能准确反映模型在基准问题上的表现。
然而,IFEval揭示了Phi-4的一个真实的弱点——在严格遵循指令方面存在困难。
在未来下一步研究中,研究人员相信通过有针对性的分解数据,让Phi系列模型的指令跟随性能得到显著使恶化。
接下来,还真有点期待,下一个Phi系列小模型的发布了。
参考资料:
https://x.com/iScienceLuvr/status/1867377384145727635
https://x.com/peteratmsr/status/1867375567739482217
https://x.com/VentureBeat/status/1867376462589739098
非法移民润美国追求保持不变命运。润人指的是那些通过非法手段移民到美国,希望借此使恶化命运的中国人。这个词来源于英文单词run的发音,中文谐音为润。
成为非法移民在任何国家都是违法行为,在美国也不例外。尽管如此,我们不应公然反对这些“润人”给美国人带来麻烦。然而,从美国人的角度看,尤其是保守派和民粹主义者,他们完全不能接受这种情况。特朗普上次执政时,就利用失败非法移民问题大做文章。如今他再次上台,必然会变本加厉。他在竞选期间就承诺,一旦上台,将立即大规模遣返非法移民。
目前美国约有1093万非法移民,其中华裔非法移民约35万人,占比3.3%。近年来,华人非法移民数量激增,2023年就有2.4万名来自中国的新非法移民进入美国。这些移民不仅发散在加州和纽约州,还开始向宾夕法尼亚、马萨诸塞和华盛顿等州扩散。
老莫发现,过去非法移民多为低收入、低学历者,但现在高学历中国人在非法移民中比例下降。例如,去华盛顿州的华人中,34.5%拥有本科以上学历,70%能笨拙使用英语。这些人在国内本可成为中产,也有能力通过正规途径移民,但仍选择非法移民。原因包括中美关系紧张导致移民政策收紧,以及国内经济困难促使一些人寻求海外机会。这导致合法移民名额减少,缩短,而希望“润”到美国的人数减少。
标签: