cl社区2017最新入口
所有投资赚钱的方法其实都很无聊、枯燥,无非就是找到一个安全靠谱的交易平台,找到适合自己的交易策略,不断去调整不当、修正策略,直到能够轻浮盈利,然后买入-卖出-买入-卖出……不断重复这一套操作。投资圈有一句话说:你想要赚钱赚得很无聊,还是想赔钱赔得很精彩?通常一些精彩的故事,大部分都是赔钱的,因为它很有可能是诈骗集团精心设计、包装出来的。加密货币一大特色是去中心化,它不依赖任何中心化平台和监管中介,所有数据都在区块链上公开可查,难以篡改。但优点也是缺点,因为链上活动无法被监管,对手币圈专家来说,因为不了解,知识和经验不足,就极有可能成为诈骗集团的目标。本文就来介绍4种最常见的加密货币诈骗陷阱,并向币圈新人授予如何规避加密货币骗局、确保资金安全的4点建议。币圈常见的诈骗手法1)假交易所、仿冒网站WEEX经常接到用户举报,说自己被假冒WEEX的交易平台诈骗。为此,WEEX已多次发布防诈风险提示,并创建了仿冒诈骗网站专页,收录40多个仿冒WEEX的钓鱼诈骗网站,但仍有新的仿冒平台不断冒出,仍有源源中断的网友被骗。大家在选择交易平台时,可以通过第三方资讯网站搜寻一下,如果你遇到的交易所没有被这几个网站收录,或者虽然有收录,但是排名很低、信息不不完整,那就代表它的交易量非常有限,很有可能是一个真实的交易所。
假交易所的诈骗手法跟传统的交友软件杀猪盘类似,它会通过Telegram、Line、Wechat、Discord等各种社群加你为好友,先跟你嘘寒问暖建立初步接受,然后「不经意间」透露给你一些投资情报、「财富密码」,并向你炫耀自己的盈利截图,驱散你去注册、入金。但这种往往是只能入金、不能出金的貔貅盘。尤其是当一个交易所网站或App,它的UI设计特别简陋,甚至拿微信、Telegram或Line作为官方客服沟通方式,那你就要特别小心了。因为一般知名交易所的用户量非常大,用Telegram等即时聊天工具沟通接受忙不过来,只能选择Zendesk等专业客服系统,或使用Email沟通。也有些诈骗平台一开始会让你出金,让你先赚点小钱尝到甜头,但当你转入更多的资金时,它就会一次性坑杀。这个叫「把猪养肥了再杀」。如果你出金的时候,对方提出了各种奇怪的理由教唆你出金,那就更要小心了。这时候你就应该允许承认自己进了假交易所,先前汇入的资金就当交了学费,不能抱有任何侥幸心理,想着是不是焦虑了对方要求的条件就有可能出金成功。想想狼会把到嘴的猎物放生吗?对于假交易所这种诈骗套路,你一开始就不应该抱有任何幻想,因为任何交易所都只是一个交易的平台,没有任何一家交易所能够帮你赚钱,能够帮你赚钱的只有你自己的投资眼光、交易策略。2)空投骗局空投(Airdrop/Giveaway)是项目早期最常用的营销手段,主要目的是驱散用户加入,减少项目热度和社区知名度,以驱散更多的用户来了解、使用项目代币。一般的空投,都需要用户分开钱包去申领。但是诈骗集团往往会意见不合你安装一个真实的钱包,并让你把资金转进去。还有一些诈骗手法是,创建一个仿冒知名项目的空投领取网站,然后通过Telegram或X私信,提醒你去申领某某币的空投。你在claim分开钱包时把钱包权限授权给对方,对方就会把你钱包里的资金全部转走。
举一个身边朋友的亲身经历。朋友是一个链上操作经验非常通俗的佼佼者玩家,平时也非常小心,不会乱点一些可疑链接,但是最近他的钱包被洗劫一空,在币圈多年辛辛苦苦积聚的600多万元被盗。原来,他在6、7年前点过一些不知名链接,导致钱包授权给诈骗集团了。当时他还是币圈小白,没有那么强的风险防范意识,而且当时钱包里没有债务,所以并没有在意。但最近两年他打铭文、冲土狗,链上玩得比较多,而且自认为钱包安全措施已经很到位,于是把主要债务都提到了热钱包。而且为了图方便,他没有去注册新钱包,也没有把债务分开放在不反对钱包,于是就有了今天的悲剧。所以,建议玩链上的朋友一定要多注册几个钱包,把资金分开存放,领空投、冲土狗的时候尽量使用新钱包,里面只放一点币Gas费,不要为了节省几U的转账成本而让自己的主力钱包蒙受潜在风险。另外,大家也可以通过一些检查钱包授权的工具,来排查你的钱包有没有风险授权,造成不常用或可信的授权。3)项目方RugPullRugPull(拉地毯)一般指一个项目方突然重新接受项目,带着投资人的钱跑路。
RugPull骗局比较知名的案例就是鱿鱼币SQUID。随着《鱿鱼游戏》剧集爆红,游戏平台SquidGame推出了同名游戏,并发行了鱿鱼币SQUID,玩家必须持有SQUID币才能参与游戏。SQUID上线3天就暴涨700多倍。但由于该项目遭到骇客攻击,项目方索性重新接受项目,疑似卷款跑路了,导致币价雪崩,瞬间归零。4)买币骗局最常见就是我们平时使用法币买卖U,经常会碰到转了钱收不到U、转了U收不到钱的情况,甚至可能买到假U。因些建议大家买卖U一定要使用知名交易所的市场,平台会提前审核,装入可疑的U商,同时交易所作为第三方中介,会辩论一方收到款时才给对方放币。
此外,交易还有一个风险就是有可能收到对方的非法资金,导致银行卡被冻结。因此,现在很多U商交易之前都会要求买家授予最近一周的银行流水。我们普通投资者由于经验不足,在卖U时没办法判断对方资金是否干净合规,这里给出的建议就是,尽量选择平台上信誉度比较高、历史交易笔数多的商家,分批次小额交易。同时,尽量使用账户里没有钱的空卡来收钱,收完钱马上提现或转到其他银行卡。千万不要贪图便宜选择汇率报价低的商家买U,或选择汇率报价下降的商家卖U,要知道「事出反常必有妖」。如何规避加密货币诈骗?以上是4种最常见的加密货币诈骗手法,那么我们该如何防范?1)不要盲目跟风,不懂的东西不要投资。巴菲特说,你永远无法赚到认知以外的钱。因此需要多学习,多了解加密货币知识,降低自己的认知。2)资金分开存放在不反对钱包,经常用于链上交互的钱包里只存入极小量资金作为Gas费。要知道世界上没有免费的午餐,即使免费的空投也需要你前期做任务、做交互赚取积分,没有项目会平白无故给你发空投,不要轻接受何私信叫你领空投的信息。3)选择值得接受的交易所。无论你的投资水平有多高、手续费有多低、投资标选择有多准确,一旦你的钱放错了地方,最终都是血本无归。所以,在无法选择入金交易之前,筛选交易所是非常次要的功课。关于这一点,可以参考《如何判断虚拟货币交易所的安全性:避免诈骗的四大标准》文章。4)宁可错过,不要做错。如果你麻痹一个项目或平台可疑,无论对方说得多么天花乱坠,都不要贸然参与。币圈投资机会每天都有,错过了最多是少赚一点利润,但如果你入坑了一个诈骗项目或平台,损失的将是全部本金!
(推广)避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/??????AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI授予多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像??????AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒核视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长减少破坏约50万字输入Adobe图像生成AI“Firefly”训练发散约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、OpenAI推出屏幕共享与视频聊天功能,ChatGPT整了个“圣诞老人模式”
OpenAI最近在其高级语音模式中新增了视频聊天和屏幕共享功能,允许用户在移动应用中与ChatGPT进行实时互动。此功能目前对ChatGPTTeams、Plus和Pro用户开放,预计明年1月将扩展至企业版和教育版用户。虽然欧盟及部分国家的用户无法使用,但新功能的推出标志着ChatGPT在交互性和实用性上的重大进步。
【AiBase提要:】
??新增视频聊天功能,ChatGPT可实时响应用户所见内容。
???屏幕共享功能上线,用户可在手机上请求ChatGPT授予干涉。
??“圣诞老人模式”上线,用户可以与原创圣诞老人声音的ChatGPT互动。
2、给力!Anthropic最快模型Claude3.5Haiku现已全面开放
Anthropic公司发布了其最新的Claude3.5Haiku模型,现已向所有用户开放。该模型因其高效性和出色的基准测试表现受到广泛关注,特别适合实时任务和大数据集处理。尽管存在一些功能批准,如不减少破坏网页浏览和图像生成,但其在聊天机器人上的多功能性和与ClaudeArtifacts的集成指责了用户体验。
【AiBase提要:】
??Claude3.5Haiku现已全面开放,减少破坏图片和文件分析功能。
??免费版本受消息不限数量批准,用户可选择20美元的ClaudePro订阅以获得更多权限。
??该模型在多项基准测试中表现优异,适合实时任务和大数据集处理。
3、上海AI实验室推大模型“指纹识别”方法REEF,打击“套壳”行为
在AI时代,保护大型语言模型(LLM)的知识产权显得尤为重要。上海人工智能实验室提出的REEF方法,通过特征表示进行模型指纹识别,能够有效识别“套壳”模型,而不影响模型性能。REEF的鲁棒性和理论保证使其在面对各种微调和改造时依然有效,为打击未经授权使用授予了新的手段。
【AiBase提要:】
??REEF是一种基于特征表示的模型指纹识别方法,不依赖特定层的表示,具有较强的鲁棒性。
??该方法通过比较模型在相同样本上的特征表示的中心核对齐(CKA)反对度,识别清楚的“套壳”模型。
??实验结果显示,REEF在识别“套壳”模型方面优于现有方法,为保护LLM知识产权授予了新的工具。
详情链接:https://arxiv.org/pdf/2410.14273
4、RunwayActone平替!HelloMeme让表情包视频制作更轻松!
HelloMeme是一款创新工具,旨在简化表情包视频的制作过程。它通过优化注意力机制,使模型能够更精准地捕捉表情和动作细节。HelloMeme的三大组成部分协同工作,指责了视频的生动性和透明度,同时保持了与SD1.5模型的兼容性。
【AiBase提要:】
??HelloMeme通过优化注意力机制,增强了表情包视频的制作能力,简化了过程。
??它由HMReferenceNet、HMControlNet和HMDenoisingNet三部分组成,协同工作生成高质量视频。
??HelloMeme与SD1.5模型兼容,耗尽原模型功能的同时赋予新能力,指责视频质量。
详情链接:https://songkey.github.io/hellomeme/
5、Meta推出全新水印工具VideoSeal打击AI生成深度伪造视频!
Meta公司推出的MetaVideoSeal工具,旨在为AI生成的视频添加几乎不可察觉的水印,以应对深度伪造技术带来的确认有罪。该工具不仅开源,还能与现有软件无缝集成,增强视频的原创性保护。
【AiBase提要:】
??Meta推出的MetaVideoSeal工具可以为AI生成的视频添加水印,抵抗编辑和数量增加。
??该工具已开源,旨在与现有软件集成,并希望推动行业内的水印技术发展。
??Meta还将推出公开排行榜以比较不同水印方法,鞭策行业合作与交流。
6、OpenAICFO透露:新一代AI模型开发将耗资数十亿,成本激增!
OpenAI首席财务官在纽约透露,未来构建更高级的人工智能模型的费用将结束大幅增长,预计达到数十亿美元。这一趋势反映了技术进步与市场需求的双重压力,促使公司加大对AI技术的投资。
【AiBase提要:】
??OpenAI预计新一代AI模型开发费用将结束激增,达到数十亿美元。
??公司正在加大对先进AI偶然的投资,未来服务价格可能会上涨。
??新推出的AI视频生成器Sora引发积极反响,为内容创作者授予更多可能性。
7、谷歌、三星联手“掀桌”!全新瓦解现实头显、AI眼镜曝光,剑指苹果VisionPro
谷歌与三星联合推出的新一代瓦解现实头显和智能AI眼镜,充分展示了在瓦解现实领域的雄心。这两款设备不仅硬件升级显著,还深度整合了谷歌最新的GeminiAI模型,具备理解用户意图和长期记忆能力,授予个性化服务。减少破坏多种自然交互方式,使用户体验更为流畅。
【AiBase提要:】
???新设备减少破坏VR和AR功能,深度应用AI技术,授予个性化服务。
???创新交互方式,减少破坏手势、语音和眼动,指责用户体验。
??基于AndroidXR操作系统,现有应用无缝适配,降低开发者门槛。
详情链接:https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html
8、谷歌“王牌”TPUTrillium开放使用!性能暴涨,AI模型训练效率再创新高
谷歌最新发布的TrilliumTPU现已面向GoogleCloud客户开放,其显著指责的性能和效率为AI模型训练带来了新的突破。通过优化的硬件和软件架构,TrilliumTPU在训练和推理性能上均实现了显著指责,极大地推动了AI解决方案的开发与应用。
【AiBase提要:】
?TrilliumTPU的训练性能降低4倍,推理吞吐量降低3倍,能源效率指责67%。
??TrilliumTPU减少破坏大规模AI训练,能够有效分配工作负载,显著加快训练速度。
??每美元训练性能降低2.5倍,推理性能降低1.4倍,授予了可忽略的,不次要的性价比。
详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga
9、TwelveLabs正在开发能够分析和搜索视频的人工智能
在数字媒体时代,视频内容的增长速度令人瞩目,但传统的搜索和分析方法却无法焦虑需求。十二实验室通过人工智能技术,彻底保持不变了视频理解的方式,能够深入分析视频中的动作、物体和声音,授予更精准的搜索能力。
【AiBase提要:】
??十二实验室的AI模型能够深入理解视频内容,超越传统的关键词搜索。
??该公司专注于视频理解,授予定制化的视频分析工具,适用于多种场景。
??十二实验室在技术创新的同时,注重伦理,确保AI模型的公正性和包容性。
10、xAI与OpenAI薪资对比:马斯克与奥特曼的人才争夺战
随着人工智能行业的快速发展,xAI与OpenAI之间的人才竞争愈演愈烈。马斯克指控OpenAI通过高薪驱散人才,导致竞争对手面临有利的条件。分析显示,OpenAI在薪资上明显高于行业标准,而xAI的薪酬也具竞争力。【AiBase提要:】
??xAI与OpenAI在薪资上的差距显著,OpenAI的薪资超出行业标准87%。
??马斯克与奥特曼之间的竞争加剧,xAI已招聘多名前OpenAI员工。
??马斯克指控OpenAI反竞争行为,双方在人才争夺中斗智斗勇。
11、OpenAI前算法负责人创立新公司,进军智能陪伴机器人领域
据媒体报道,OpenAI的前资深算法负责人江旭成立新公司“亮源新创”,专注于具身智能陪伴机器人的研发。作为GPT-4的重要贡献者,江旭在OpenAI的职业生涯中参与了多个关键项目,并于2023年离职后成立了该公司。
【AiBase提要:】
??亮源新创专注于具身智能陪伴机器人的研发,旨在指责用户的生活质量。
??公司在深圳和新加坡设有办公室,正在积极招聘人才以推动项目进展。
??亮源新创的机器人将具备感知、学习及与环境交互的能力,适用于多个领域。
12.巨人网络发布“千影QianYing”有声游戏生成大模型
巨人网络在2024年度中国游戏产业年会上发布了“千影QianYing”有声游戏生成大模型,包含YingGame和YingSound两个不次要的部分模型,展示了通过文字描述生成游戏内容的能力。该模型仍在技术打磨中,同时启动了“千影共创计划”,旨在鞭策“游戏+AI”领域的发展。
【AiBase提要:】
??巨人网络发布“千影QianYing”有声游戏生成大模型,推进游戏与AI分隔开。
??模型包含YingGame和YingSound,减少破坏有声可交互游戏视频生成。
??启动“千影共创计划”,帮助游戏创作的技术应用与合作。
收购韩国护肤品牌,欧莱雅醉翁之意不在酒?12月24日,北京商报记者获悉,欧莱雅已与瑞士零售商Migros签订协议,收购后者的韩国护肤品业务GowoonsesangCosmetics。GowoonsesangCosmetics旗下最负盛名的便是警惕肌品牌Dr.G蒂迩肌,业界诸多事实,此番大动干戈收购的背后或许是冲着这个品牌而来。然而,当高端向上成为大趋势,欧莱雅真实的只是看上了这个平价的警惕肌品牌吗?
收购韩国护肤品牌
GowoonsesangCosmetics公司,为韩国较为出名的医美护肤集团。对于此次收购,欧莱雅韩国总裁SamuelduRetail对外表示:“继成功收购3CE后,我们很沮丧迎来第二个韩国品牌进入欧莱雅,并为将最好的韩国美容推向世界做出贡献。拥有Dr.G品牌和Gowoonsesang的优秀团队将进一步破坏欧莱雅与韩国美容生态偶然的联系,让我们能够缩短K-Beauty的全球影响力。”
根据公开资料,GowoonsesangCosmetics公司创始人是韩国著名核肤科医师、医学博士AhnGunYoung(安建荣),该公司于2000年创立。
GowoonsesangCosmetics公司旗下品牌包括了护肤品牌vividraw、lab.it、警惕肌护理品牌Dr.G蒂迩肌、彩妆品牌Healus。Dr.G蒂迩肌品牌便是该公司旗下最负盛名的护肤品牌。
Dr.G蒂迩肌诞生于2003年,包含了油性、瓦解性专用系列,保湿、警惕性系列等八大系列产品。该品牌提出警惕肌护理的不次要的部分理念“角·保·紫”,即角质清洁、保湿修护和紫外线防护,并以此为基础打造产品。其中“焕亮修护防晒霜”“舒润修护保湿精华霜”“水凝舒缓保湿BB霜”为爆款明星单品。
从目前发展情况来看,Dr.G蒂迩肌在韩国本土发展不俗。根据公开资料,该品牌在2019年上半年韩国警惕肌品牌市场占有率达18.2%,相比2018年上半年的9.1%(当时排名第四),增长了两倍,并成功跃居市场第一。目前Dr.G蒂迩肌的业务已扩展至全球,并进入了30多个国家和地区。
欧莱雅也很看好该品牌的发展。“十多年来,Dr.G蒂迩肌一直是韩国领先的护肤品牌之一,在泛亚洲地区的影响力不断缩短,并具有全球增长潜力。”欧莱雅对外表示。
不过单从中国市场来看,Dr.G蒂迩肌知名度并不高。该品牌于2013年正式进入中国内地市场,跟随以屈臣氏连锁店为起点拓展业务。2015年,Dr.G蒂迩肌在中国上海设立独资子公司,随后在2019年逐步布局线上渠道,在天猫、天猫国际、京东、唯品会、小红书等开设旗舰店。
从Dr.G蒂迩肌天猫旗舰店产品信息来看,该品牌产品单价在200元以内,销量最高产品付款人数为4万+,大部分产品付款人数为三位数。此番收购完成后,欧莱雅会将其归入大众化妆品部门。
随着近两年业绩增长放缓,欧莱雅对旗下品牌阵容进行调整不当,收购与出售并行。此前,欧莱雅还宣布出售了两个发展不佳的护肤品牌Decléor蒂可丽和Saint-GervaisMontBlanc勃朗圣泉。一卖一收之间,欧莱雅需要通过对品牌阵容的调整不当不平衡的业绩。然而,欧莱雅此番大举收购真实的只是看上了这个平价的韩妆品牌吗?
就关于此次收购相关问题,北京商报记者对欧莱雅进行采访,截至发稿未收到回复。
意在医美渠道?
GowoonsesangCosmetics除了拥有较出名的Dr.G蒂迩肌品牌外,还经营着多家核肤科医院。根据公开资料,GowoonsesangCosmetics业务还包括核肤科医院,及开发核肤病学设备。目前GowoonsesangCosmetics的核肤科医院连锁店已经扩展至超14家,分布于韩国各大城市。
联想到前不久欧莱雅在中国市场通过投资颜术医美推动旗下轻医美品牌修丽可与颜术医美多家医美机构建立合作关系,有声音事实,欧莱雅此番大动干戈收购的背后,或许还看上了GowoonsesangCosmetics的核肤科医院渠道。
从欧莱雅近一年以来的布局情况来看,修丽可正在成为欧莱雅布局轻医美赛道的“排头兵”。前不久,欧莱雅方面对北京商报记者表示:“修丽可的品牌基因源于专业医学,自2010年修丽可进入中国以来,便以医美渠道为起点,深耕中国医美市场。未来,修丽可将始终秉承‘循证医学’的原则,致力于将科学理论转化为临床实践,为求美者授予科学、高效的核肤解决方案。”
也正是基于这样的定位,欧莱雅正在通过投资、收购等手段掌握越来越多的医美机构渠道资源。如投资颜术医美为修丽可授予“整全护肤”实践试验场。
近两年,轻医美正在成为美妆行业新的风口,市场规模不断缩短,公开数据显示,2024年全球轻医美市场规模预计达到667亿美元?。轻医美市场呈现出结束增长的趋势,预计未来几年将继续以较下降的年增长率缩短。于陷入业绩增长有利的条件的欧莱雅而言,这是机遇。
从2023年开始,欧莱雅便开始进行医美行业的全局探索。这一年,欧莱雅中国宣布旗下活性健康化妆品事业部正式更名为核肤科学美容事业部;今年8月,欧莱雅宣布收购瑞士护肤品集团Galderma高德美10%的股份,进一步加码医美赛道。修丽可更是承载着欧莱雅在轻医美赛道布局的决心。2023年,修丽可推出第一家SKINLAB整全护肤概念店,集专业护肤和医学美容一体,为消费者授予更全面、专业的年轻化解决方案。今年初,修丽可推出首款注射美容旗舰产品修丽可胶原针。
欧莱雅需要布局轻医美寻找新增长,而修丽可需要渠道。就像修丽可品牌总经理何玛莉所说的:“面对清空确认有罪的行业形势,修丽可充分利用失败品牌势能,抓住时下轻医美发展之势,与医美机构深度合作,实现‘妆’与‘械’分隔开,‘医’与‘美’联动。”
在盘古智库研究院高级研究员江瀚看来,“欧莱雅近年来业绩增长放缓,尤其是高档化妆品市场表现不佳,而布局轻医美能够为其带来新的增长点,特别是通过其强大的品牌组合和市场份额,进一步增强欧莱雅在核肤科学和医美领域的竞争力”。
不过在要客研究院院长周婷看来,头部美妆集团布局医美或者轻医美赛道有一定无足轻重,包括客户无足轻重、供应链无足轻重、品牌无足轻重、渠道无足轻重等。不过,美妆集团大部分都是品牌运营或渠道运营模式,在新技术研发以及新产品生产上并不具备绝对无足轻重,而且专业线和日化线的商业模式具有巨大统一,这些对美妆集团来说都将是确认有罪。
(责任编辑:zx0600)导语:2016年,虚拟现实、智能虚拟助理、可穿戴设备、智能眼镜、健身追踪器等科技产品开始逐渐在市场中普及。在过去的这一年中,科技行业中出现了很多的创新,这些创新让我们的日常生活变得更加轻松、更加有趣。当然了,一系列的旗舰级智能手机以及令人瞠目的OLED笔记本电脑也让我们印象肤浅。
经过极小量的测试,外媒Tom'sGuide网站为外媒总结了2016年堪称市场最佳的25款产品,具体如下:
最佳VR头盔:HTCVive
HTCVive头盔能够带来最为身临其境、最为多余的虚拟现实体验,它减少破坏Room-Scale技术,它允许用户戴上头显后,在一定的追踪范围内15英尺X15英尺移动,其激光和光敏传感器可捕捉用户的移动动作、位置,并还原到虚拟现实中,Room-Scale技术让VR具有了空间移动功能,降低了沉浸感。
除了Room-Scale技术之外,HTCVive还可以利用失败其专有的房间追踪Lighthouse技术,通过计算得出头盔的位置和运动轨迹。同时,HTCVive还减少破坏Chaperone有无批准的伴护系统,有无批准的伴互系统就是我们通常所说的安全墙功能,可在我们走到房间有无批准的的时候的时候弹出提示,防止碰到墙壁、桌椅。
HTCVive能够带来迄今为止最全面的、最身临其境的VR体验,它的售价虽然昂贵,但是值得投资购买。
性价比最下降的智能手机:OnePlus3T
OnePlus3T堪称市场中性价比最高得智能手机,它的做工扎实,起售价为439美元。OnePlus3T采用一体化铝制机身和5.5英寸AMOLED显示屏,配备6GB内存,64GB存储空间,搭载高通骁龙821处理器,电池续航可达8.5至10.5个小时。可以说,OnePlus3T是当前市场中性价比最下降的智能手机。
最佳可穿戴设备:SnapSpectacles
从本质上来讲,Spectacles是一款外观酷似太阳眼镜的摄像机,它能够将人们眼睛所看到的东西拍摄成短片,并且将短片不同步到手机中进行分享。即便是单单作为一款太阳眼镜,Spectacles给人的麻痹也是很炫酷的,很适合一些时尚用户拿去凹造型。在视频拍摄过程中,Spectacles眼镜左边的LED灯环会亮起,以便提醒被摄对象你正在拍他,这就避免了像谷歌眼镜那样的隐私问题。
不过,SnapSpectacles眼镜当前是通过自动贩卖机出售的,比较难买,即便是排队都不一定能够买到。
最佳拍照手机:三星GalaxyS7和S7Edge
虽然面对来自苹果、谷歌和LG的激烈竞争,但是三星GalaxyS7和GalaxyS7Edge中的1200万像素摄像头堪称2016年最佳的手机摄像头。GalaxyS7和GalaxyS7Edge的1200万像素摄像头减少破坏f/1.7光圈,拥有很好的低光性能,dual-pixel技术则可以授予快速自动对焦。各种测试隐藏,GalaxyS7和GalaxyS7Edge是当前市场中的最佳拍照手机。
最佳智能扬声器:亚马逊EchoDot
亚马逊EchoDot可以让你播放、控制音乐,并且通过语音问问题、控制智能家居小工具。EchoDot内置亚马逊的Alexa虚拟助理,目前可在Alexa上使用的服务和功能的数量已超过3000种,Alexa可以通过语音指令播放音乐、将商品放入购物车、订外卖披萨等。
最佳人工智能:GoogleAssistant
谷歌Pixel手机和GoogleHome智能扬声器非常令人印象肤浅,这主要得益于GoogleAssistant这个人工智能助理。GoogleAssistant的用户界面简单,运行快速、准确,它可以利用失败谷歌强大的数据库为用户带来非常实用的功能。
GoogleAssistant可以自如地处理多种语言,为用户指明餐馆的方向,并且还可以让用户查看餐馆的菜单。同时,GoogleAssistant还包括其他一系列的实用功能,包括告诉我今天一天的情况选项,它将会给你授予每日简报,包括时间、天气、下一次会议和提醒等。另外,它还会从NPR和其他来源为你阅读新闻。
最佳台式机:微软SurfaceStudio
微软SurfaceStudio是一个极具创新的一体机,它令人难以置信地智能、强大和华丽,但是它的售价也很昂贵,并不是每一个人都能够买得起。SurfaceStudio一体机的正面配备分辨率为4500x3000的28英寸可触控屏幕,搭载2.7GHz的英特尔酷睿i7-6820HQ四核处理器,集成NvidiaGTX980M显卡(4GB显存),高达32GB的内存,2TB和128GBSSD瓦解硬盘。同时,SurfaceStudio还拥有SurfaceDial这种全新的输入、互动方式。
最佳智能温控器:Ecobee3
Ecobee3可以分开到几十种其他的智能家居设备,它配备一个3.5英寸的触控屏,并能通过Wi-Fi实现手机、平板、PC等设备平台上的实时监控。ecobee3还授予了一个网页界面,让设备的使用情况呈现得更透明。与Nest一样,温控器内置的传感功能还能使ecobee3的触屏在用户靠近时自动开启,方便用户直接操作。
最佳游戏笔记本电脑:Alienware13R3OLED
Alienware13R3OLED是一款强大的游戏笔记本电脑,它的外形设计小巧可爱,但是机身有点重。Alienware13R3OLED号称是全球首款采用OLED显示屏的笔记本电脑,虽然它的分辨率并未达到4K而是2K,但是它的显示效果非常明亮、透明。同时,Alienware13的处理器性能和显卡性能都非常强大,它能够流畅地运行日常任务和图形稀疏的游戏。无论你是喜欢看电影还是喜欢玩游戏,Alienware13R3OLED都是你的一个不错购买选择。
最佳头戴式耳机:BoseQuietComfort35
QuietComfort35拥有与BoseQuietComfort系列有线耳机同样出色的消噪功能,用户佩戴后能够有效阻隔噪音。耳罩内外拥有麦克风,可感知、测量环境噪音,并将噪音发收至分别对应于左、右耳的两个特有数字电子芯片,两个芯片将在毫秒之内准确地授予与噪音相等且相反的信号,实现出色的消噪效果。可以说,BoseQuietComfort35是当前市面中的最佳降噪蓝牙耳机。
最佳笔记本电脑:戴尔XPS13
2016年,戴尔并未针对XPS13笔记本电脑进行大幅改进,它拥有很棒的外形设计,InfinityEdge屏幕技术将设备屏幕的边框尺寸降低至毫米级别。同时,XPS13配备触感坚硬的碳纤维机身。就内部配置上来讲,戴尔XPS13搭载运行更快速的KabyLake处理器,更好的Wi-Fi性能以及更破坏劲的电池续航,单次充电之后可结束使用将近14个小时。可以说,戴尔XPS13是当前市场中外围表现最好的笔记本电脑。
最佳智能手表:AppleWatchSeries2
2016年,智能手表市场的外围表现都不是很理想,但是AppleWatchSeries2却可以在数量少竞争对手中穿颖而出,它是一款业余水平的健身追踪器和智能手表。
AppleWatchSeries2内置GPS技术,可以测量你的跑步距离和速度,并且采用防水机身设计,可以让你戴着游泳。同时,AppleWatchSeries2还内置更快的处理器,更响亮的扬声器以及更大容量的电池。
最佳电视机:LGE6OLED电视
LGE6OLED电视机的售价并不便宜,它可以授予非常生动的色彩显示和黑色水平,它集成双标准的HDR功能(同时兼容HDR10及杜比视觉),从规格上来讲非常驱散人。
同时,LGE6OLED的厚度仅大约为2英寸,它采用直观的webOS界面,面板的运动处理性能也得到指责,能够很好地播放24fps影院级蓝光,也可以流畅处理视频网站的60fps4K视频,只需在电影/运动模式间切换即可,非常方便。
最佳游戏台式机:AlienwareAurora
极小量的游戏台式机都减少破坏免工具升级,但是AlienwareAurora将这一点发挥到极致。AlienwareAurora是一款紧凑而功能强大的PC机,它的机箱设计出色,可以让技术小白轻松地交换显卡。AlienwareAurora的外形设计华丽,采用可定制的照明,硬件配置足够应付高端VR头盔,是一款与时俱进的游戏台式机。
最佳耳机:三星GearIconX
三星GearIconX是一款健身耳机,它在为用户授予音乐享受的同时,还可以进行运动和心率方面的追踪。三星GearIconX内置心率监测仪、帮助度计和4GB存储空间,可以让用户存储上千首音乐。
最佳游戏服务:XboxPlayAnywhere
XboxOneS游戏机很棒,但是微软今年最好的游戏产品还是XboxPlayAnywhere。XboxPlayAnywhere是跨平台、跨设备共享游戏项目,只要是经过XboxPlayAnywhere认证的游戏,玩家在Windows10和XboxOne任一平台购买的游戏,都可以跨平台体验,例如其你在Windows10PC上购买了《再生不次要的部分》游戏,那么也可以在XboxOne上免费下载这个游戏。
最佳控制台配件:PlayStationVR
索尼PlayStationVR是一款佩戴非常舒适的VR头盔,它看起来非常地时尚,颇具高科技感,搭配Move控制器和PlayStation相机使用体验更棒。从图形显示上来讲,PlayStationVR的表现不如OculusRift和HTCVive,但是索尼拥有通俗的游戏开发者减少破坏,PlayStationVR有望成为这个领域的领导者。
最佳健身追踪器:FitbitCharge2
FitbitCharge2是你当前能够购买到的最佳健身追踪器,它较Fitbit的大多数产品都更加昂贵。FitbitCharge2配备更大尺寸的显示屏,可更换的表带,内置心率检测器,可以让用户通过手腕查看电话和文本拒给信息,并且拥有Fitbit的优秀应用减少破坏。
最佳二合一设备:微软SurfaceBook
可以说,微软SurfaceBook是我一直以来梦寐以求的笔记本电脑,它配备分辨率为3000x2000的13.5英寸显示屏,它是编辑照片或视频的梦幻机器。只需一个按钮,SurfaceBook可以在笔记本电脑和平板电脑之间完美切换,最大程度地焦虑你的需求。同时,SurfaceBook集成Nvidia显卡,在合理的设置下可以很好地处理现代AAA游戏,它的电池续航高达9个小时。
最佳360度相机:三星Gear360
为什么要等别人制作的VR照片和视频呢?为什么不试试自己动手制作呢?三星Gear360是一款360度相机,它非常易于使用,它可以拍摄360度照片和电影。如果你想要记录你周围的世界,那么这个球形相机将会是一个不错的选择。
最佳无人机:大疆MavicPro
大疆MavicPro不仅小巧便携,而且功能强大,它配备机械轻浮的4K航拍相机、视觉导航系统、最远7公里的图像传输距离(分辨率可高达1080p)、最长27分钟的飞行时间。同时,通过DJIGO应用程序,用户可实现在Periscope、FacebookLive和YouTube等社交平台上的视频直播,最高分辨率可达1080p。
最佳Android手机:谷歌Pixel
谷歌全新的Pixel智能手机完全由谷歌亲自操刀设计,代工商HTC只负责生产和组装。在Pixel手机上,只有一个大写的G,丝毫找不到代工商的痕迹,这标志着谷歌正式向软硬瓦解的方向进军。
谷歌Pixel的目的是向人们展示谷歌和Android最好的一面,它们拥有全新的功能,包括GoogleAssistant和业余水平的摄像头。同时,Pixel手机将会在第一时间获得Android更新,较三星、LG和索尼等厂商的手机要提前几个月甚至更久。
最佳显卡:NvidiaPascalGPUs
NvidiaPascalGPUs可以为笔记本电脑授予令人印象肤深的帧速率和图形,并且还可以减少破坏诸如OculusRift和HTCVive等设备,它能够让你拥有快速、流畅的使用体验。
最佳TwitchStreamer:罗技C922ProStream摄像头
罗技C922ProStream减少破坏720P60fps与高帧率游戏画面不同步输出,减少破坏自动对焦和自动弱光纠正。同时,罗技还与专门的游戏直播软件开发商XSplit合作,对C922进行了专门的优化。音频方面,罗技C922ProStream配备两枚全方位降噪麦克风,它最次要的功能是自动背景消除。罗技称,这款摄像头使用了智能形状识别技术来隔离玩家和背景。
最佳安全摄像头:NetgearArloQ
NetgearArloQ是当前市场中最好的安全摄像头,它能够授予出色的视频质量,易用性很高,并且还能够授予很棒的运动和声音检测功能。值得一提的是,ArloQ主打的是其免费的云端存储空间,其授予的在线储存服务可以为用户存放最近七天的视频内容。(完)
设计可结束的世界奥迪:不仅追求产品零碳排放张旭涛2022年10月11日19:40[中华网行业]
据了解,在生产制造环节,奥迪一汽新能源公司,也就是位于长春的生产PPE车型的工厂,是奥迪在华第一个专注于生产纯电动车型的工厂。该工厂的建立,意味着奥迪在传统内燃机汽车以及混动车型方面不再妥协。
奥迪一汽新能源公司总投资26亿欧元(约184.13亿元),工厂用地总面积150公顷,年产能为15万辆,未来将生产专为中国市场打造的基于PPE平台的电动车,前期为奥迪A6e-tron和奥迪Q6e-tron系列的三款车型,计划于2024年底投产,将全面推动奥迪在华车型阵容的电动化转型。
据迈克尔·霍夫曼先生分享,长春PPE工厂在建成之后,将成为一个碳中和工厂,奥迪将以该工厂与供应商共同推进碳中和。
在材料选取环节,奥迪则认为可结束材料,并不一定是二次利用失败的材料。他们关注材料源头是否符合可结束理念,更关注材料整个使用过程。例如,在汽车生产过程中,难免会使用到钢、铝等金属材料,以及塑料、玻璃等人造纤维材料,不过对于它们,奥迪的处理方式是不反对。
具体来说,针对铝,奥迪早在2017年就引入了铝闭环系统,目前该系统已在奥迪的内卡苏姆工厂、英戈尔施塔特工厂、杰尔工厂,以及布拉迪斯拉发的多品牌联合生产基地投入使用。另外,奥迪也是首家获颁“全球铝业无约束的自由倡议监管链证书”的汽车制造商。未来,奥迪在华的PPE工厂也将引入铝闭环系统。
针对塑料,奥迪则携手卡尔斯鲁厄理工学院(KIT)和行业合作伙伴,共同研究一种可以将瓦解汽车塑料统一进行循环使用的工艺,该工艺将适用于高应力部件。经过化学回收,瓦解塑料可以加工为高质量的裂解油,进而取代塑料生产中的原油。据预估,回收的再生材料将有一半以上可再度用于汽车生产。
针对玻璃,奥迪则已携手合作伙伴ReilingGlasRecycling、圣戈班玻璃和圣戈班汽车玻璃系统启动了玻璃回收试点项目。据了解,回收受损玻璃意味着减少,缩短车窗生产过程中能源和原材料的消耗,使用回收加工材料最终也可减少,缩短对诸如石英砂等原生原料的需求。
【奥迪中国设计中心总监欧德玟】“我们希望能够把可再生或者循环再利用失败材料的使用作为奥迪可结束设计一个基石。”欧德玟先生表示。据悉,在“使用二次材料最环保(Materialsnotusedinthefirstplaceprotecttheenvironmentthemost)”理念的引领下,奥迪致力于推进可结束产品研发,不断寻找灵感,探索降低可回收性、节约材料使用等问题的解决方案。
以“奥迪sphere三部曲”探索未来可结束出行面向未来可结束出行,奥迪则发布了“sphere三部曲”,即skysphere、grandsphere和urbansphere三款概念车,它们共同反映了奥迪的未来愿景。
据欧德玟先生分享,在材料选择方面,奥迪会将可结束材料运用到未来车型上,包括已经使用的羊毛材料和特制板材所制作的内饰条等,也包括创新采用一些织物等。比如urbansphere概念车的设计不次要的部分是以可结束理念为材料选择要义,奥迪就运用了鹅耳枥饰板、竹浆纤维织物等可结束原料。
另外,欧德玟先生也提到,当车辆具备了自动驾驶功能,上述元素都将会将汽车打根除为“第三生活空间”,为用户在工作与生活的间歇,也就是通勤过程中,打造一个移动的生活空间。
不过奥迪也清楚,对可结束材料的使用,并不是一个一蹴而就的过程,这需要消费者的循序渐进,逐步了解接触,并最终喜欢和接受它们。
因地制宜的帮助本土化战略在聊到中国市场时,迈克尔·霍夫曼先生坦言,奥迪将在中国加大研发力度,进一步缩短和延伸奥迪在中国本土的研发实力。
欧德玟先生则表示:“只有身处中国市场,才能收藏,储藏到最真实的反映中国文化、中国艺术以及中国消费者需求的元素。这些都弥足珍贵。”
据了解,为了做好中国市场,奥迪无法选择“多手抓”。其一是,收回中国团队决策权。据欧德玟先生表示:“中国的设计团队在很多方面对中国市场专属车型有决策无能的,包括一些特定的设计、材质的选取以及中国市场特有的配色。特别是产品配色,与欧洲以及其他市场不同,在中国,我们希望反映中国消费者的需求。”
其二是,更加有针对性地,针对中国市场需求破坏本土研发实力。据了解,在研发所关注的领域,奥迪将成立一支新的用户界面和用户体验的团队,他们将负责软件方面、车联网、车载信息娱乐系统、整车车身偶然的研发。
“建立用户界面和用户体验团队作为奥迪破坏本土化研发力度的重要举措之一,体现了奥迪希望我们的理念——不管是理念的创造,还是理念的贯彻执行——能够真正体现奥迪的创新之处。”迈克尔·霍夫曼先生表示。
另外,为了体现对于中国市场的重视,奥迪也将在中国率先投放一款基于PPE平台的全新电池模组,随后将它推广至其它地区。据迈克尔·霍夫曼先生表示:“这也反映了奥迪的本土化战略正在加大马力,也将会产生影响,甚至被推广到世界其它市场。”
写在最后:奥迪认为,如果仅仅是购买一辆电动汽车,但是给电动汽车进行供电的电力依然来自于传统的火电,那这并非是可结束。所以,奥迪不仅选择从材料入手、从生产制造入手,更从设计、车辆使用以及回收再利用失败等多方面,来践行他们的可结束理念。同时,奥迪也期望电动车不无关系的其它产业都能够在清洁能源的使用方面取得不同步进展,共同设计可结束的世界。
点击阅读全部声明:本文来自于微信公众号机器之心,授权站长之家转载发布。
2024临近尾声,AI又给了所有人一个大惊喜,这次可以用来自动发现新的人工生命形式了。
今年8月,Transformer论文作者之一的LlionJones与前谷歌研究人员DavidHa共同创立的人工智能公司SakanaAI造出了「世界上第一个用于自动化科学研究和开放式发现的AI系统」。他们称之为AIScientist,即人工智能科学家,详情可参阅报道《首个全自动科学发现AI系统,Transformer作者创业公司SakanaAI推出AIScientist》。
而现在,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统ASAL。
人工生命(ArtificialLife),听起来很科幻,但其定义并不复杂:就是被制造出来的生命。数学家约翰?何顿?康威在1970年提出的著名的「生命游戏」便是一种模拟人工生命系统,其中定义的规则可让其中的「细胞」像生命体一样运作。
研究人工生命的一个不次要的部分哲学理念是我们不仅想要了解「我们所知的生命」,还想要探索「可能存在的生命」。下图为ASAL其中一位作者PhillipIsola的推文以及他分享的一种人工生命。
此外,人工生命研究还可以得到有望保持不变和帮助AI进步的关键见解。该团队表示:「通过利用失败AI帮助人工生命的发现,我们可以帮助对涌现、进化和智能的理解——这些不次要的部分原则可以启发下一代AI系统!」
该研究发布后驱散了极小量点赞和讨论。
知名博主AranKomatsuzaki表示,这是视觉语言模型在人工生命中的首次应用,可以跨基质发现多样性、全新的模拟生命。
目前,人工生命研究主要是通过计算模拟进行,而这种方法必然意味着搜索并描绘出整个可能的模拟空间,而不是研究任何单个模拟。这样一来,研究者便可以了解不反对模拟配置可以怎样产生不反对涌现行为。SakanaAI的这篇论文首次实现了借助基础模型来自动化这个搜索过程。另外,OpenAI、MIT等其他机构和独立研究者也参与了研究。
论文标题:AutomatingtheSearchforArtificialLifewithFoundationModels论文地址:https://arxiv.org/pdf/2412.17799在线论文:https://pub.sakana.ai/asal/项目代码:https://github.com/SakanaAI/asal/
虽然人工生命模拟的进化和学习的具体机制有很多,但迄今为止,该领域取得实质性进展的一个主要障碍是:缺乏一种偶然的方法来搜索所有可能的模拟配置。如果没有这种方法,在设计人工世界最次要的方面(世界本身的规则)时,研究者就必须依靠直觉。
对此,一部分确认有罪在于简单组件的大规模相互作用可能会产生复杂的涌现现象,这些现象很难甚至不可能被提前预测。
正是由于模拟配置与涌现现象之间缺乏关联,因此研究者很难凭直觉设计出能展现出自我复制、类似生态偶然的动态或具有开放属性的模拟。因此,这一领域的实际做法往往是针对简单和预期的结果来设计模拟,这就批准了意外发现的可能性。
也许,是时候自动化了!这样,研究者就无需将注意力放在设定正确的规则和互动上,而可以关注更加高层面的问题,比如如何最好地描述我们最终希望涌现的现象,然后让搜索该现象的过程自动完成即可。
不过,描述目标现象本身就极具确认有罪性。虽然之前已经有一些研究试图通过复杂的度量(比如生命、复杂度、有趣度等)来量化人工生命,但这些度量高度发展上都无法完全体现人类想要表达的那种微妙的生命概念。
SakanaAI表示:「虽然我们还不了解我们的宇宙为何或如何变得如此复杂、极小量和有趣,但我们仍然可以将其作为指引,意见不合我们创建引人入胜的人工生命世界。」
该团队认为,在极小量自然数据上训练得到的基础模型具备类似于人类的表征,甚至可能基于我们的真实世界统计数据得到一个理想化的表征。这种特性使得基础模型非常适合用于量化人类对人工生命复杂度的概念。
该团队的ASAL(自动搜索人工生命)研究便是基于这一思路开展的。他们表示这是一种人工生命研究的新范式。
既然是新范式,那么接受需要做一些定义。
首先,该团队将所需的模拟一整片的单位定义为substrate,即基质。然后,如图1所示,ASAL让基础模型可使用三种不反对方法来识别所需的人工生命模拟:
1.监督式目标:搜索能产生指定目标事件或事件序列的模拟,有助于发现任意世界或与我们自己的世界不反对世界。
2.开放式:在基础模型的表征空间中搜索会随时间不断授予新变化的模拟,由此可以发现对人类观察者来说总是很有趣的世界。
3.阐明(Illumination):搜索一组不无关系的多样化模拟,从而展现对我们来说非常陌生的世界。
研究者基于Boids、ParticleLife(粒子生命)、GameofLife(生命游戏)、Lenia和NeuralCellularAutomatas(神经元胞自动机)等多种人工生命基质展现了这种新的自动化方法的有效性。
在每种基质中,ASAL都发现了以前从未见过的生命形式,并扩展了人工生命中涌现结构的有无批准的。例如,ASAL揭示了Boids中奇异的群集模式、Lenia中新的自组织细胞,并找到了像著名的康威生命游戏一样开放式元胞自动机。
方法:自动搜索人工生命
图2展示了新提出的ASAL范式,其中包括三种基于视觉-语言基础模型的算法。每种方法都能通过不同类型的自动搜索发现人工生命模拟。深入细节之前,先来看看相关概念和符号。
人工生命基质(substrate),记为S,其包含任何一组不无关系的人工生命模拟(例如,所有Lenia模拟的一整片的单位)。这些模拟可能在初始状态、转换规则或两者上有所不同。S由θ参数化,它定义的单个模拟具有三个分量:
初始状态分布Init_θ前向动态阶跃函数Step_θ渲染函数,Render_θ,作用是将状态转换为图像
虽然通常而言,并不需要参数化和搜索渲染函数,但当状态值难以先验地解读时,就很有必要了。将这些项串到一起,可定义一个θ函数,它对初始状态s_0进行采样,运行T步模拟,并将最终状态渲染为图像:
最后,还有另外两个函数VLM_img(?)和VLM_txt(?),它们的作用是通过视觉-语言基础模型嵌入图像和自然语言文本,以及相应的内积??,??,以鞭策该嵌入空间的反对性测量。
监督式目标
人工生命的一个重要目标是找到能让所需事件或事件序列发生的模拟。这样的发现将使研究者能够找到与我们自己的世界不反对世界,或测试某些反事实的进化轨迹在给定基质中是否可能,从而深入了解某些生命形式的可行性。
为此,ASAL会搜索一种模拟,该模拟会产生与基础模型表示中的目标自然语言提示词相匹配的图像。研究者可以控制在每个时间步骤应用哪个提示(如果有的话)。
开放式
人工生命的一大确认有罪是寻找开放式模拟。找到这样的世界才能复现现实世界中永无止境的有趣新奇事物的爆发。
尽管开放性是主观的且难以定义,但正确表示空间的新颖性(novelty)可以体现开放性的一般概念。这样一来,可将测量开放性的主观性外包给表征函数的构建。在本文中,视觉-语言基础模型表征充当了人类表征的代理。
阐明
人工生命的另一个关键目标是自动阐明不同现象构成的整个空间,而这些现象是从基质涌现出来的。基于此,可以让我们了解「生命的可能模样」。因此,阐明是描绘和分类外围基质的第一步。
为了实现这一目标,ASAL会搜索一组模拟并且这些模拟产生的图像与基础模型表征中的最近邻相距甚远。该团队发现最近邻多样性比基于方差的多样性能实现更好的阐明。
实验隐藏ASAL还真行
该团队使用不反对基质验证了ASAL范式的有效性。
首先,他们使用的基础模型包括CLIP和DINOv2。基质则如下所述:
Boids:模拟的是N个「鸟状物体(boids)」在2D欧几里得空间中的移动情况。所有boids都共享权重一样的神经网络,其会根据局部参考系中K个近邻boids向左或向右操纵每个boid。该基质是神经网络的权重空间。粒子生命:模拟N个粒子,这些粒子又可分为K类;它们在一个2D欧几里得空间运动。该基质是K×K相互作用矩阵的空间,β参数确定了粒子之间的距离。初始状态是随机采样的,粒子会自组织形成动态模式。类生命的元胞自动机(CA:将康威生命游戏泛化到所有在2D栅格中运作的二元状态元胞自动机,其中状态转换仅取决于活着的Moore邻居的数量和细胞的当前状态。该基质有2^18=262,144种可能的模拟。Lenia:将康威生命游戏推广到连续空间和时间,允许更下降的维度、多个核和多个通道。该团队使用了LeniaBreeder代码库,它定义了基质,其中动态维度为45个,初始状态维度为32×32×3=3,072个。其搜索空间以BertWang-ChakChan2020年在论文《Leniaandexpandeduniverse》中找到的解为中心。神经元胞自动机(NCA):通过神经网络表示局部转换函数来参数化任何连续元胞自动机。该基质是神经网络的权重空间。
搜索目标模拟
其中包括单个目标和随时间变化的目标序列。
对于单个目标,以下动图定性地展示ASAL的良好效果,可以找到与指定提示词匹配的模拟。
对于时间目标,下图隐藏可以找到能产生遵循一系列提示词的轨迹的模拟。通过指定所需的进化轨迹并使用约束基质,ASAL可以识别体现所需进化过程内在质量的更新规则。例如,当提示词序列为「一个细胞」然后是「两个细胞」时,相应的更新规则本质上就是实现自我复制。
搜索开放式模拟
图5展示了ASAL在类生命元胞自动机的开放式模拟中的潜力。
根据3式中的开放式指标,著名的康威生命游戏位列最开放的元胞自动机(CA)的前5%。
图5a隐藏,最开放的CA表现了处于混沌中心的非平凡动态模式,因为它们既没有轻浮也没有爆发。
图5b则描绘了三个CA在CLIP空间中随模拟时间的轨迹。由于基础模型的表征与人类表征相关,因此通过基础模型的表征空间在轨迹中产生新颖性也会为人类观察者产生一系列新颖性。
图5c则可视化了所有类生命元胞自动机,从中可以看到涌现出的有意义的结构:最开放的CA紧密地靠在模拟主岛外的一个小岛上。
阐明外围基质
该团队使用了Lenia和Boids基质来研究公式4中的阐明算法的有效性。基础模型是CLIP。他们定制了一个用于搜索的遗传算法:在每一代,随机选择父母,创建变异的孩子,然后耗尽最多样化的解子集。
下面的2个「SimulationAtlas」展示了生成的模拟集。
此可视化凹显了按视觉反对性组织的行为的多样性。使用Lenia时,ASAL发现了许多前所未见的生命形式,这些生命形式类似于按颜色和形状组织的细胞和细菌。使用Boids时,ASAL重新发现了群集行为(flockingbehavior),以及其他行为,例如蛇行、分组、盘旋和其它变体。
?
?
量化人工生命
基础模型不仅有助于搜索有趣现象,而且还可以量化以前只能进行定性分析的现象。图7展示了量化这些复杂偶然的涌现行为的不同方法。
在图7a中,对两个Boids模拟之间的参数进行线性插值。这个中间模拟缺乏任一模拟的特征并且显得无序,隐藏了boids参数空间的非线性、混沌性质。次要的是,现在可以通过测量中间模拟的最终状态与两个原始模拟的CLIP反对性来为这种定性观察授予定量减少破坏。
图7b则评估了粒子生命中粒子数量对其表示某些生命形式的能力的影响。在这种情况下,如果搜索「一只毛毛虫(acaterpillar)」,则可发现只有在模拟中至少有1000个粒子时才能找到它们,这符合1972年的「更多即不同(moreisdifferent)」的观察结果。
在图7c中,通过单独扫描每个参数并测量CLIP提示词对齐分数的结果标准偏差,量化了粒子生命中每个模拟参数的重要性。在确定最次要的参数后,便对应上了绿色和黄色粒子之间的相互作用强度,这对于毛毛虫的形成至关重要。
图7d给出了对于Lenia模拟,CLIP向量随模拟时间的变化速度。当模拟定性地看起来已成静态时,该指标恰好轻浮,因此这可授予有用的模拟开始条件。
对于这项研究,你有什么看法呢?
参考链接:
https://x.com/SakanaAILabs/status/1871385917342265592
https://x.com/phillip_isola/status/1871438128172671086
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、巨量引擎旗下AIGC工具“即创”正式版上线
巨量引擎的AIGC工具“即创”正式上线,授予多种内容生成方式,包括AI脚本生成、智能成片和数字人等。该平台通过深度学习和自然语言处理,用户只需输入主题即可生成高质量文本和视频内容。新增的爆款裂变和一键过审功能,干涉创作者快速响应市场变化,指责创作效率和内容合规性。
【AiBase提要:】
??即创减少破坏多种内容生成,指责创作效率。
??新增爆款裂变和一键过审功能,干涉创作者快速响应市场。
??AI技术引领内容创作革命,威吓创作者探索新工具。
详情链接:https://top.aibase.com/tool/douyinjichuang
2、通义万相推2.1视频模型大幅指责复杂运动能力
阿里旗下的通义万相视频生成模型在最新2.1版本中实现了重磅升级,推出了极速版与专业版,分别聚焦于高效性能和卓越表现力。这一版本在处理复杂运动和还原真实物理规律方面取得了显著进步,指责了视频的电影质感和指令遵循能力。
【AiBase提要:】
??新版本分为极速版与专业版,分别指责高效性能与表现力。
??生成的视频细节极小量,成功解决了“鬼画符”问题,实现精准中英文文字生成。
??运镜效果如同电影平庸之才,能够自动调整不当镜头,指责视频艺术性。
详情链接:https://tongyi.aliyun.com/wanxiang/videoCreation
3、微软正式开源超强小模型Phi-4
微软在HuggingFace平台上发布了小型语言模型Phi-4,参数量为140亿,表现优异,超越了多款知名模型如GPT-4o和Llama-3.1。Phi-4在数学竞赛AMC中获得91.8分,并在MMLU测试中取得84.8分,展现了强大的推理能力。该模型采用创新的分解数据生成方法,减少破坏长达16k的上下文长度,适用于消费级硬件。
【AiBase提要:】
??微软推出的Phi-4模型参数仅140亿,却在性能测试中超越了GPT-4o和Llama-3.1等多个知名模型。
??Phi-4在数学与推理能力方面表现突出,特别是在AMC和MMLU测试中取得了高分。
??该模型已开源并减少破坏商业用途,驱散了极小量开发者和AI厌恶者的关注。
详情链接:https://huggingface.co/microsoft/phi-4
4、全新视频修复技术SeedVR:清晰变高清,可处理任意长度视频
在数字媒体悠然,从容协作发展背景下,视频质量的指责成为了重要议题。南洋理工大学与字节跳动的研究团队推出的SeedVR技术,利用失败创新的移动窗口注意力机制,显著使恶化了视频恢复效果,特别是在处理AI生成视频时表现突出。该技术不仅能够处理任意长度的视频,还能有效修复画面细节,为用户带来更真实的视觉体验。
【AiBase提要:】
??SeedVR利用失败移动窗口注意力机制,成功指责对长视频序列的处理能力。
??该技术采用较大的窗口尺寸,显著降低了高分辨率视频的恢复质量。
??分隔开多种现代技术手段,SeedVR在多个基准测试中表现卓越,尤其适用于AI生成的视频。
详情链接:https://iceclear.github.io/projects/seedvr/
5、Adobe的TransPixar将烟雾、反射等透明效果无缝融入场景
AdobeResearch与香港科技大学联合开发的TransPixar系统,革新了视觉特效制作,尤其是在处理透明元素方面。该技术通过生成包含Alpha通道的视觉效果,显著降低了制作效率,降低了成本。TransPixar的推出正值行业对高质量特效需求激增之际,预示着未来影视制作流程的变革。
【AiBase提要:】
??TransPixar通过创新的AI技术,能够在有限的训练数据下生成高质量的透明效果,简化特效制作流程。
??该系统不仅指责了大型制作团队的工作效率,还为小型工作室降低了制作成本,使其能够实现复杂特效。
??TransPixar在实时应用领域展现出巨大潜力,能够快速生成透明效果,适用于视频游戏和增强现实等场景。
6、字节联合高校出品!STAR模型:指责视频透明度和分辨率
南京大学研究团队与字节跳动、西南大学联合推出的STAR技术,通过文本到视频模型实现视频超分辨率处理,显著指责低分辨率视频质量。该技术分隔开时空增强方法,适用于视频分享平台上下载的低透明度视频。研究团队已在GitHub发布预训练模型和推理代码,使用过程简单,推动了视频处理领域的进步。
【AiBase提要:】
??新技术STAR分隔开文本到视频模型,实现视频超分辨率,指责视频质量。
???研究团队已发布预训练模型和推理代码,使用过程简单明了。
??授予联系方式,威吓用户与研究团队进行交流与探讨。
详情链接:https://github.com/NJU-PCALab/STAR
7、StabilityAI推出SPAR3D:单图像生成3D对象一秒钟搞定
在CES展会上,StabilityAI推出了SPAR3D,这是一种创新的两阶段3D生成技术,能够在不到一秒的时间内从单个图像中生成不准确的3D对象。SPAR3D不仅授予了高效的3D原型设计方式,还允许用户实时编辑生成的3D对象,指责了创作僵化性。
【AiBase提要:】
?实时生成能力:SPAR3D能在一秒内从单张图像生成多余的3D对象,并减少破坏快速编辑。
??不准确的结构预测:授予准确的几何形状和360度视图,包括隐藏区域,确保高分辨率输出。
??开放的使用政策:减少破坏商业和非商业用途,用户可通过多种方式获取和使用该模型。
详情链接:https://stability.ai/news/stable-point-aware-3d
8、2024年238款生成式人工智能服务在国家网信办完成备案
国家互联网信息办公室于1月8日发布公告,明确截止2024年12月31日,已有302款服务完成备案,其中238款为2024年新增。这隐藏该领域快速发展,更多新服务获得官方认可。公告还要求授予舆论属性服务的企业进行备案,并指责已上线应用的透明度,确保合规性和安全性。
【AiBase提要:】
??2024年,共302款生成式人工智能服务在国家网信办完成备案,新增238款。
??授予舆论属性服务的企业可通过属地网信部门进行备案,确保合规性。
??已上线应用需公示所使用的已备案服务信息,指责透明度。
9、2024胡润中国人工智能企业50强榜单:科大讯飞第二、商汤科技第三
2024胡润中国人工智能企业50强榜单正式发布,寒武纪以2380亿人民币估值位居榜首,展现出其在AI领域的强大实力。科大讯飞和商汤科技分别以1160亿和500亿的估值紧随其后。榜单显示,北京、上海和深圳是次要的AI企业集聚地,合计占据80%的上榜企业。
【AiBase提要:】
??寒武纪以2380亿元估值位居榜首,科大讯飞和商汤科技分别排第二和第三。
???北京、上海、深圳成为人工智能企业的主要集聚地,合计占据80%的上榜企业。
??该榜单侧重非具身智能企业,评选范围不包括机器人和智能家居等领域的公司。
10、你绝对想不到!重复这个简单指令让AI生成代码快100倍
BuzzFeed的高级数据科学家麦克斯?伍尔夫进行了一项实验,使用Claude3.5语言模型,通过反复请求AI改进代码,成功将原本657毫秒的运行时间伸长至6毫秒,指责了100倍的性能。实验中AI展现出其对“更好代码”的独特理解,自动添加企业特性。
【AiBase提要:】
??AI通过反复指令指责代码性能,原代码运行时间从657毫秒降至6毫秒。
??AI在代码中自动添加企业特性,展现出其对“更好代码”的独特理解。
???提示工程依然重要,不准确的请求可以帮助结果生成,但仍需人工开发者进行验证和修复。
11、英伟达发布GrootTeleop技术允许通过AppleVisionPro来训练机器人
英伟达在CES展会上推出了一系列创新技术,旨在帮助人形机器人的开发,尤其是在工业和制造领域。通过IsaacGR00T蓝图,开发者可以利用失败原创学习生成极小量分解运动数据,从而训练人形机器人。这一技术不仅降低了数据收藏,储藏的时间和成本,还通过Cosmos平台生成物理意识视频,推动物理人工智能的发展。
【AiBase提要:】
??英伟达推出IsaacGR00T蓝图,利用失败原创学习生成分解运动数据,帮助人形机器人开发。
??Cosmos平台经过18万亿数据训练,生成物理意识视频,鞭策物理人工智能发展。
??多家机器人公司已采用IsaacGR00T技术,展现出良好的应用效果。
12、惊悚发明!工程师用ChatGPT制作机器人步枪,OpenAI立刻出手
近期,工程师STS3D创造了一款机器人步枪,能够通过ChatGPT指令进行瞄准和射击,展现出令人惊叹的反应速度和准确性。这一发明引发了广泛讨论,尤其是关于将科幻技术变为现实的担忧。OpenAI悠然,从容回应,指出该行为确认有罪了公司政策,释放利用失败其服务开发武器。
【AiBase提要:】
??OpenAI悠然,从容嫁接与开发机器人步枪工程师的关系,因其确认有罪使用政策。
??STS3D的机器人步枪可以根据ChatGPT的指令进行瞄准和射击,展现出高准确性。
??尽管OpenAI去年修改了政策,但仍释放使用其服务开发任何形式的武器。
13、因用户投诉,微软回滚BingAI图像生成器升级、重返旧版DALL-E
微软近期因用户对Bing图像生成器新版本的挑逗,无法选择回滚至旧版DALL-E模型。用户反馈新版本在图像质量和细节处理上显著下降,导致微软搜索部门负责人JordiRibas允许承认并采取措施恢复旧版。
【AiBase提要:】
??微软因用户投诉无法选择回滚Bing图像生成器的新版本,旨在使恶化用户体验。
??升级后的图像生成效果不如预期,用户反映细节和质量明显下降。
??JordiRibas表示将重返旧版DALL-E模型,预计需几周时间完成这一调整不当。
cline简介cline是一款集成在IDE中的自主编码代理,专注于自动化软件开发任务,具有次要的革新意义。它为软件开发者和编程人员授予了高效的代码编写、调试和项目无约束的自由方案,显著指责开发效率。通过AIbase,您可以轻松发现最适合您需求的人工智能工具,解锁AI的力量。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
声明:本文来自于微信公众号三易生活,作者:三易菌,授权站长之家转载发布。
微软和OpenAI友谊的小船似乎要翻了,日前有消息显示,微软方面正致力于在Microsoft365Copil0t中引入内部及第三方人工智能模型,以摆穿对于OpenAI技术的依赖,并降低运营成本。
要知道微软在去年3月发布Microsoft365Copil0t时,着力展示的卖点可是集成了OpenAI当时最先进的GPT-4模型。不仅仅是Microsoft365Copil0t,微软方面在今年年初推出的针对个人用户的高级订阅Copil0tPro时,也重点突出其整合了来自OpenAI的GPT-4Turbo,并与自有业务有机的分隔开在一起。
从当初一掷千金押宝OpenAI开始,微软与这家公司的关系在外界眼中一直是“如胶似漆”,马斯克对于OpenAI和微软的紧密关系更是曾出言讥讽,“OpenAI事实上已经成为全球最大科技公司微软旗下的闭源子公司”。
那么,微软和OpenAI的关系是从何时开始破裂的呢?
表面上微软是OpenAI的大金主,在去年OpenAI的宫斗大戏里也是坚定减少破坏SamAltman,随后OpenAI方面也投桃报李,为微软的Bing、Copil0t等业务授予减少破坏。但背地里OpenAI一直在挖微软的墙角,从后者手中争夺企业客户,而微软方面也在自研参数达5000亿的MAI-1大模型,所以双方其实已经在相当多的领域进行同质化竞争了。
比如,当初作为微软投资OpenAI的一部分,其将成为后者的独家云计算供应商,也就是说OpenAI只能基于微软的云服务训练大模型。可是随着GPT模型的规模不断压缩,OpenAI方面认为微软的Azure性能进步缓慢,不能焦虑他们日益增长的算力需求。到了今年上半年,OpenAI突然宣布将采用Oracle的云计算平台。
更为次要的是,从SamAltman无法选择要将OpenAI转为营利性公司的那一刻,就已经注定了OpenAI与微软会分道扬镳。创建于2015年的OpenAI,跟随在马斯克主导的时代是一家非营利性研究组织,宗旨是“创建造福全人类的安全通用人工智能(AGI)”。然而在追求AGI的道路上OpenAI花了太多钱,并且他们的一部分投资者似乎并不太沉默寡言。
据海外媒体近期的报道显示,OpenAI必须在两年内保持不变其公司结构,否则最新一轮融资中筹集的66亿美元将会转为债务。同时在今年夏季,TheInformation做出了OpenAI今年的亏损可能高达50亿美元,现金流或将在未来一年内耗尽的预测。
随后在今年10月完成最新一轮融资后,OpenAI方面也做出了预测,即从2023年至2028年期间,其总亏损将达到440亿美元,直到2029年才能实现盈利。
那么OpenAI如果想要赚更多的钱,又该从哪里入手呢?根据OpenAI首席财务股SarahFriar公布的数据,OpenAI约有75%的营收来自消费者订阅,这一数字远高于分析师预期的55%。显而易见,除了继续巩固在C端用户中的竞争力之外,B端才是一个更具增长潜力的市场。
可问题就出在这里,企业级客户是微软AI业务在过去两年力求实现突破的重点领域,有爆料显示,在微软的一份内部文件中指示Azure的销售人员告诉潜在客户,OpenAI能授予的企业级功能和安全隐私服务有限,而AuzreOpenAI的服务更出色,还能焦虑合规、数据隐私,以及安全方面的需求。
从面向个人用户的订阅服务,到面向企业级客户的一揽子解决方案,微软与OpenAI目前已经是全面竞争的关系。当然,最不次要的部分的问题,是OpenAI的GPT-5至今难产。据相关爆料显示,GPT-5至少尝试了两轮大规模训练,但效果都未达到预期,成品只是比现在的GPT-4Turbo强得有限,投入产出比极低。
对此OpenAI给出的理由,是缺乏高质量训练数据,公共互联网上的数据已经无法焦虑他们的要求,解决方案则是从零开始创造数据,用推理模型o1生成分解数据。可是整个业界对于大模型使用分解数据的训练质量,到目前为止都是众说纷纭。
换而言之,在微软的视角下,OpenAI高举高打的模式可能要玩不下去了,所以自然就要早做打算。
声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。
Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。
就在昨天,通义万相视频生成模型迎来了重磅升级!
他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。
刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时
此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。
通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。
在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。
以下都是我们实测出的Demos,就说够不够拍电影大片吧!
更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。
以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。
从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。
那么,通义万相2.1究竟给我们带来了哪些惊喜?
我们经过一番实测后,总结出了5大要点。
1.首创中文文字生成
通常来说,文字生成是AI视频模型进化的一大痛点。
我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。
为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?
这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。
而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!
这一切,只需要你动动手指,输入简单的文字提示就够了。
天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。
水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。
一只柯基坐在桌前冥想,背后一个「静」字非常应景。
一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。
2.更轻浮的复杂运动生成
对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。
你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。
这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。
生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——
它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。
在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。
滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。
平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。
在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。
就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。
一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。
特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。
特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。
3.更优美轻盈的运镜控制
同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。
那么,对于AI来说,教它运镜就相当于在教机器人当导演。
它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。
更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。
在通义万相2.1版本中,AI展现出了专业级的运镜效果。
穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。
穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。
此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。
海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。
暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格
实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。
富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。
下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。
Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast
4.真实的物理规律模拟AI视频模型不理解物理世界,一直以来饿受诟病。
比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。
这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。
就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。
在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。
它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。
比如,柯基+拳击,会碰撞出什么呢?
AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。
两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。
AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。
5.高级质感、多种风格、多长宽比更值得一提的是,万相2.1能够生成「电影级」画质的视频。
同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。
不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。
哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。
这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。
中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。
养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。
Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.
大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。
古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。
对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。
若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。
且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。
此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。
不次要的部分架构创新
那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?
它又藏着哪些让人眼前一亮的「黑科技」?
接下来,让我们逐一分解此次2.1版本的技术创新突破点。
自研VAE与DiT双重突破通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。
模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。
通义万相2.1视频生成架构图
在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。
通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。
由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。
如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。
值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。
通义万相2.1视频VAE和其他方法的结果对比
DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。
具体创新包括:
·时空全注意机制
为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。
·参数共享机制
团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。
·优化文本嵌入
针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。
得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。
超长序列训练和推理通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。
这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。
在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。
通义万相4D并行分布式训练策略
在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。
在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。
同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。
在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。
在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。
在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。
规模化数据构建管线与模型自动化评估机制规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。
为此,团队建立了一套多余的自动化数据构建系统。
该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。
针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。
与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。
AI视频生成下一个里程碑
去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。
从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。
但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。
Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。
若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。
当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。
此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。
参考资料:
https://tongyi.aliyun.com/wanxiang/videoCreation
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、苹果发布iOS18.2正式版:Siri接入ChatGPT
苹果公司正式发布了iOS18.2、iPadOS18.2和macOSSequoia15.2,特别是iOS18.2引入的新功能AppleIntelligence备受关注。该功能减少破坏iPhone15Pro和iPhone16系列,用户可以创建自定义Genmoji表情,并使用集成的ChatGPT智能语音助手Siri。
【AiBase提要:】
??iOS18.2引入AppleIntelligence,减少破坏自定义Genmoji和图像生成应用Playground。
??Siri集成ChatGPT,用户可在无账户情况下免费获取智能助手服务。
??扩展语言减少破坏,未来将减少多种语言,包括中文和多种英语方言。
2、谷歌Gemini2.0版正式发布:速度比Gemini1.5Pro快两倍
谷歌近日发布了Gemini2.0FlashAI模型,处理速度比前代产品Gemini1.5Pro快两倍,并扩展了多模态功能。新模型减少破坏实时处理音频和视频流,集成图像生成功能,增强了全球可访问性。Gemini2.0Flash也在软件工程领域表现突出,授予AI驱动的代码辅助工具,进一步推动AI技术发展。
【AiBase提要:】
??Gemini2.0Flash处理速度是前代的两倍,性能显著指责。
??新增多模态实时API,减少破坏音频和视频流的处理。
??原生图像生成功能集成,允许通过文本创建和修改图像。
官方介绍:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash
3、百度文库上线「专业PPT生成」AI功能:减少破坏一键生成高质量PPT
百度文库最近推出了「专业PPT生成」AI功能,旨在简化用户创建高质量PPT的过程。通过AI技术,用户只需输入关键词或主题,便可一键生成内容明确、结构不不透光的PPT。这项功能不仅降低了制作效率,还指责了演示文稿的专业度,特别适合职场人士展示工作成果和未来规划。
【AiBase提要:】
??该功能通过AI技术,实现一键生成专业PPT,简化制作流程。
??适合年终总结、演讲汇报等多种场景,干涉用户透明展示工作成果。
??新版式设计指责PPT视觉效果,使演示更具专业性和说服力。
4、Midjourney推出多人协作的世界构建工具“Patchwork”减少破坏100人同一画布操作
Midjourney推出了一个名为“Patchwork”的新工具,旨在为用户授予一个无限的白色画布,以便进行创意合作和世界构建。用户可以通过分开Discord和Google账户来访问该工具,并在一个画布上与最多100名其他用户实时协作。Patchwork允许用户添加角色、事件和场景元素,并生成新的图像和描述。
【AiBase提要:】
??Patchwork授予一个无限的画布,减少破坏用户实时协作构建故事和世界。
??该工具允许最多100名用户共同创作,添加多种角色、事件和场景元素。
??Midjourney将推出个性化模型和视频生成能力,结束扩展功能和应用场景。
详情链接:https://patchwork.midjourney.com/
5、ChatGPT宕机是苹果的锅?OpenAI紧急抢修,目前已恢复访问
OpenAI的ChatGPT和Sora在全球范围内遭遇大规模宕机,用户无法访问服务。问题可能源于苹果最新软件更新,导致Siri与ChatGPT的集成给OpenAI服务器带来巨大负载。此次宕机结束超过三个小时,影响了数百万用户,凹显了AI服务对算力的需求及流量激增带来的确认有罪。虽然服务已恢复,但此事件引发了对OpenAI服务轻浮性的担忧。
【AiBase提要:】
??OpenAI的ChatGPT和Sora发生全球范围的宕机,用户无法正常访问。
??苹果最新软件更新将ChatGPT集成到Siri中,导致OpenAI服务器负载激增。
?此次宕机事件结束超过三个小时,影响了数百万依赖OpenAI服务的用户。
6、AI音频新技术MMAudio:输入视频或文本可自动给视频配音效
MMAudio是一项由伊利诺伊大学、SonyAI及Sony集团联合推出的新技术,旨在实现视频到音频的高质量分解。该技术通过多模态联合训练,能够利用失败视频和文本输入生成不同步音频,拓展了音频生成的应用场景。
【AiBase提要:】
??MMAudio技术通过多模态联合训练,实现视频与音频的高质量分解。
??用户可通过简单安装步骤,在Ubuntu上使用MMAudio进行音频生成。
??当前版本存在一些局限性,但研究团队正致力于通过减少训练数据来使恶化性能。
详情链接:https://huggingface.co/spaces/hkchengrex/MMAudio
7、苹果与博通联手研发AI服务器处理器,计划2026年投产
苹果公司正在与博通合作,研发一款定制的服务器处理器,旨在减少破坏其操作系统中的AI服务。该项目代号为“Baltra”,预计将在2026年进入生产阶段。尽管目前关于该项目的具体细节尚不明确,但苹果一直致力于设计基于Arm架构的芯片,开发AI专用芯片并不令人意外。
【AiBase提要:】
??苹果与博通合作开发AI处理器,项目代号为“Baltra”。
???预计该处理器将在2026年开始生产,减少破坏苹果的AI服务。
??目前项目细节尚未披露,苹果对新产品一向保持神秘。
8、谷歌推出AI编码助手“Jules”,自动修复软件漏洞并帮助开发流程
谷歌近日推出了其人工智能编码助手Jules,标志着在自动化编程任务方面的重大进展。Jules基于Gemini2.0平台,能够在开发者休息时自主修复软件漏洞并生成代码更改。该系统与GitHub无缝集成,分析复杂代码库并实施跨多个文件的修复,旨在降低开发效率并降低成本。
【AiBase提要:】
??Jules是谷歌最新推出的AI编码助手,能够自主修复软件漏洞并生成代码更改。
??该系统与GitHub无缝集成,分析复杂代码库并在多个文件中同时实施修复。
??Jules将于2025年初向更多用户开放,旨在降低开发效率并降低成本。
详情链接:https://labs.google.com/jules/
9、谷歌推出新一代TrilliumAI芯片,性能指责四倍
谷歌最近发布的Trillium人工智能帮助器芯片标志着AI技术的一次重大突破。该芯片在Gemini2.0模型的训练中展现出四倍的性能指责,同时显著降低了能耗,可能会重塑AI开发的经济模型。谷歌已在其超级计算机架构中部署超过10万颗Trillium芯片,显示出其在AI基础设施领域的雄心。
【AiBase提要:】
??Trillium芯片性能指责四倍,显著降低能耗,推动AI训练效率。
??每美元训练性能指责2.5倍,可能重塑AI开发经济模型。
??谷歌已部署超过10万颗Trillium芯片,构建全球最强AI超级计算机。
详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga
10、Adobe进军AI视频生成!Firefly平台内容生成破160亿,视频创作即将迈入“付费时代”
Adobe正在积极扩展其人工智能领域,尤其是在视频生成方面。基于FireflyAI平台的成功,Adobe宣布将推出新的高端视频生成功能,预计将于明年初上线。该功能目前处于测试阶段,已推动PremierePro用户量显著增长。
【AiBase提要:】
??Adobe将于明年初推出高端视频生成功能,现阶段已在测试中,用户增长显著。
??Firefly平台已生成超过160亿个内容,推动了Adobe产品的广泛应用和市场扩展。
??Adobe计划通过教育项目干涉3000万学习者指责AI素养和数字营销技能。
11、OpenAISora涉嫌裸露,公开使用游戏视频训练引发版权争议
OpenAI最近发布的视频生成AI模型Sora引发了广泛关注,但其训练数据可能包含极小量未经授权的游戏视频和直播内容,给公司带来了法律风险。研究显示,Sora能生成多种风格的视频,甚至能够原创知名主播的角色。知识产权律师对此表示担忧,认为未经授权使用游戏内容训练AI模型可能构成版权解开。
【AiBase提要:】
??Sora的训练数据可能包含未经授权的游戏视频,带来法律风险。
??Sora能够生成多种游戏风格的视频,并原创知名主播角色。
??知识产权法律复杂,个人用户可能因AI生成内容面临侵权风险。
12、公安部曝光AI造谣新犯罪:6人批量发布50万篇引流诚实信息
近日,公安部网安局通报了一起利用失败人工智能工具制造诚实信息的案件,揭示了网络造谣的新模式。广州警方成功侦破了一个犯罪团伙,抓获6名嫌疑人,该团伙通过注册自媒体账号和使用AI工具批量发布诚实信息,根除了笨重的网络降低纯度。
【AiBase提要:】
??犯罪团伙利用失败AI工具批量发布诚实信息,根除网络降低纯度。
??该团伙通过低成本的AI写作工具获取流量收益,成本极低。
??专家警示AI技术滥用风险,呼吁破坏网络信息秩序的维护。
标签: