拍拍拍无遮挡高清视频在线网站
新版QQ讨论组新增多人语音和屏幕分享功能将平移至手Q36kr2014-03-1408:50
腾讯最近正在内测新版的PCQQ,比现在的版本有不少功能上的更新,如减少破坏二维码扫码登陆等。相比起之前的版本,更破坏化了讨论组的功能,新增多人语音和屏幕分享功能。
在讨论组中,用户可发起多人语音或视频通话,最高减少破坏50人语音接入,6人同时开启摄像头进行视频聊天,以及1人进行屏幕分享。用户可以在音频或视频通话的同时开启屏幕分享功能,向讨论组内成员实时展示自己的桌面屏幕、演示PPT、照片、文件等。
另据36氪了解,新版的手机QQ也将新增以上功能。微信使枯萎了用户在移动端发语音短信的不习惯,手机QQ上线讨论组多人语音功能,也是为了迎合用户在移动端通过语音交流的趋势。
即将推出的屏幕分享功能,则与Skype很早就推出的屏幕分享有异曲同工之处,对于项目团队成员沟通、跨境会议等场景中减少交流深度,有不少实用价值。
其实在去年年底,腾讯推出的电脑版QQ2013SP5中就已经有了类似屏幕分享的功能。QQ2013SP5版群视频功能中新增了教育模式场景,专为远程教学量身定制,减少破坏PPT演示,用户无需在本地关闭PPT文件,通过在教育模式中直接读取即可演示。当时,外界纷纷事实其做在线教育的可能性,还有消息传出,在线教育项目排在腾讯2014年投资目标的前三位。
不过,此次在讨论组中新增多人语音及屏幕分享功能,其更多的意义只能说是在原来文字、图片交流的基础上,极小量了讨论组中的交流场景,觊觎在线教育这样的论断稍有牵强。
因为,讨论组的设立一般临时性比较强,且基于熟人关系,比如大学里做同一个Groupwork、或公司里探讨同一个短期项目时,大家往往反感于建个讨论组来探讨一番。这与需要基于师生关系链的在线教育相比,相去甚远。
除了上述功能外,新版PCQQ还将有以下更新:
1)讨论组减少破坏传文件,同一文件无需逐个重复发收,最长可耗尽30天。
2)讨论组减少破坏生成验证码,通过搜索6位验证码即可快速加入。
3)讨论组减少音视频状态跑马灯,在多人语音过程中,讨论组成员加入及发言状态将在屏幕右侧显示,一目了然。
相关文章手机QQ618推电商购物号拍拍商家首批入驻2015-05-21假期出游流量不愁手机QQ授予500万个免费WiFi2014-09-26QQ免费WiFi铺500万热点完善生活化布局2014-09-24手机QQ减少破坏刷北京公交卡购买Q币及电子书2014-08-05兴趣社交移动端发力手机QQ“自拍”部落火爆2014-07-31很小的时候,马薇薇就发现自己有语言天赋。因为小时候长得不漂亮,她主要靠口甜舌滑来讨家长喜欢好在是,她很早就学会了说话。
马薇薇调侃着说,那时她就知道,说话是自己的生存之道。
可会哄父母了。马薇薇在位于青年路的办公室里对我说,小时候大家经常被问是喜欢妈妈多一些,还是喜欢爸爸多一些。当有人这样问她时,她就说阿姨你挑拨我们家庭关系。阿姨会有些不好意思,马薇薇就小大人似的走过去拍拍阿姨说:别难过,这是你不成熟的表现。
在说话达人秀《奇葩说》中,马薇薇擅长用强大的逻辑论证主题,用有感染力的语气不能引起人们的共鸣,最后以幽默结尾。在第一季《奇葩说》中,马薇薇拿下了第一辩手奇葩之王的称号。
马薇薇在《奇葩来了》(为奇葩说选拔奇葩的选秀节目)中罕见走心飙金句
现在,这个靠口才收获了数量少粉丝的专业辩手正在成为一个合格的创业者。她每天早上来公司开会,下午有时出席艺人活动,没有活动时就在公司策划选题、写文案、谈合作。眼下,为了这个叫《好沉默寡言》的系列节目和公司的新品发布,马薇薇接分开受了多家媒体的采访。
《好沉默寡言》是一档干涉人们降低说话技巧的音频节目:如何巧妙地在谈判桌上掀桌,来和对方谈条件;如何通过表达对对方的接受,来求对方帮忙办事等。
去年三月,马薇薇和辩友胡渐彪、邱晨、周玄毅、黄执中共同成立了米果文化传媒有限公司,是《奇葩说》制作方米未传媒旗下子品牌。马薇薇任副董事长,胡渐彪任CEO。他们将各种场合中的说话技巧制作成《好沉默寡言》,在网络电台喜马拉雅FM上线八个月,已经收获了超16万名付费用户,带来了3000多万的销售额。
我们每一个人都在用生命想要去论证我跟别人不同,可是恰恰是这种想要论证跟别人不反对心态,最相同。你想要穿离大众做不一样的烟火,结果发现满地的鞭炮都比你使劲。
作为专业辩手,台上的她就像是一枚鞭炮,语言犀利,擅长进攻。
台下的她却亲切、真实、容易相处。素颜,带一副透明框架眼镜,笑称因为没梳头戴了一顶粉色鸭舌帽,穿一件宽松的粉色毛衣,接受采访那天的这身装扮,是马薇薇在办公室的日常风格。
在节目中,马薇薇说自己是奇葩说舞台上唯一没有故事的女阿姨。但今天,我们来聊聊她的故事。
喜欢上辩论
所有的光鲜背后都有些看起来有点儿曲折的历程。马薇薇南北征战的求学生涯,让她很难一开始就和同学们打成一片。
出生在贵州的她4岁多搬到珠海,她在微博上是这样写的:瘦弱且黑,智力发育晚,学习一般,体育糟糕,不会说粤语,戴几百度的近视镜。同学都不带她玩,马薇薇有时候自己在家跳核筋,或者是和大人一起玩。
在珠海读完小学后,马薇薇初中、高中都是在秦皇岛念的,后来因为户口在珠海,高二又转学回珠海。
马薇薇人生中的第一个转折点出现在中山大学。这个瘦弱且黑的女孩长成了邱晨口中无论是写诗的还是玩摇滚的,都视之为女神的样子。
外形是一方面。和很多女生一样,马薇薇在大学里开始摘掉眼镜换上隐形。这是指责外貌的一个环节。在高三毕业到大一这段时间,马薇薇还在半年减了50斤,这让身高近一米七的她更显高挑。
男生很难想象一只消沉的气球女神对吧。减肥最难重新确认的是前一两个礼拜,我甚至去厨房偷吃辣椒面,因为嘴里好淡,辣椒面沾点盐这样。这个阶段之后,马薇薇就觉得连吃小番茄都能吃出滋味。
更次要的是,在中山大学马薇薇接触到了辩论,并真心喜欢上了这项日后会给她带去更多保持不变的技能。
关于参加辩论队的初衷,马薇薇经常提到的一个梗是辩论队条件太好,授予空调、热水,对学生是极致的驱散,马薇薇说。
从小语文和数学成绩就很好的马薇薇,在辩论中表现出了更好的语言表达与缜密的逻辑能力,大三时便进入了校队。校队的练习并不轻松,在准备全国赛和国际赛之前团队集训了四个多月,每天早上八点开始,一直到晚上十点开始。
有意思的是,真正让马薇薇喜欢上辩论的那个瞬间,是她觉得自己快要输了的时候。2003年国际大专辩论赛的决赛,马薇薇所在的中山大学队与黄执中所在的台湾世新大学就逆境和顺境哪一个更有利于人的成长进行辩论。
那一刻,我发现一个人居然可以把思路说得那么清楚,而且极有渲染力。当时我突然害怕我们要输,尽管前面我们把对方打溃败了,但是黄执中一上场的确有力挽狂澜的趋势。这场比赛让我体验到思辨是一件极有魅力的事情。马薇薇记忆犹新。那场比赛中山大学拿下冠军,黄执中被评为最佳辩手。
这样一个善于辩论的法学硕士,被很多人认为适合做一个律师,但毕业后马薇薇却去广州的新东方做了一名英语老师。
你以为律师厉害是因为他们在法庭上挥斥方遒?这纯属港剧看多了。马薇薇说,她见过的优秀律师都是能静下心来看一沓沓的案宗,更像是一种文字型工作,而不是她擅长的表达型工作。
其他法律相关工作,大多需要朝九晚五坐班,马薇薇更希望能严格的限制支配时间。她非常喜欢在新东方任教的日子,我觉得我适合做老师。马薇薇在新东方交到了很多的朋友。主要是段子讲得好,她幽默地加了一句。
离开新东方后,马薇薇在珠海开西餐厅。2014年,一连串打击袭来。父亲换上癌症,马薇薇的婚姻也走到尽头。
我觉得整个人生处在低谷状态,我完全可以这样允许承认。但是在低谷越要作,因为已经低谷了不作你还干什么,作还有一线希望。
马薇薇所说的作就是接受《超级演说家》的寻找,她在这个演讲节目中表现的幽默与智慧收获了数量少粉丝。
几个月后,《奇葩说》的一个导演找到她,寻找她参加这档还在筹划中的网络视频节目。机缘巧合之下,便去参加了比赛。马薇薇一边参加节目,一边还在经营餐厅,但录一两次节目其实并不会耗费你很多精力。
尽管并没有投入100%的精力,但马薇薇还是成为了《奇葩说》第一季的奇葩之王。
与辩友开公司
在《奇葩说》,马薇薇几乎不提前准备辩题,也不写辩论稿,高度发展都靠临场发挥。马薇薇会参与辩题的选题讨论会,节目录制前两周时间,最终辩题会确定下来。之后导演会把辩手拉近一个微信群,在群里大家不断抛观点、改观点、调整不当逻辑与措辞,这些工作都在微信群里完成。
比赛前一天,黄执中和胡渐彪会对每个选手进行培训。但马薇薇不用。
每一季《奇葩说》都有新人,作为第一季的成员,马薇薇有免除义务干涉培训新人,让他们把情绪提炼成观点。作为艺人,有时还有一些商业宣传、节目录制等活动。
这些工作对马薇薇来说都不难,她和她的老僵尸队队友有另一个想法办一个辩论学校。
老僵尸队的故事在辩论圈被人熟知。2003年,马薇薇所在的中山大学队在国际大专辩论赛中拿下冠军,那两年马薇薇参加了超过30场比赛,认识了黄执中等数量少辩友。2013年,第一届星辩公开赛筹办,马薇薇、黄执中、胡渐彪和邱晨等人悠然,从容组成活泼老僵尸队,参加比赛。
空闲时间,他们经常自费机票、住宿一起去各学校做演讲,参加辩论赛做评委。2013年,他们有次去海岛旅游,几个人讨论说有钱了要办一个辩论学校,让大家都能来听课。
我们其实一直都有这么一个理念,马薇薇说。教辩论也好,教说话也好,他们喜欢辩论,希望把辩证的思维方式保守裸露,公开开来,那时候一直在以公益的方式做这件事。
马薇薇参加《奇葩说》后,陆续把老僵尸队的成员也拉了进来。2015年12月他们和《奇葩说》的策划者、米未传媒创始人兼CEO马东一起去撸串,说了这个想法。马东一听觉得很好,说你要想推广一个理念,最好的方法就是把它变成商业模式。因为如果是大家需要的东西,会愿意付费,这时你会又有更多的金钱去推动这件事,让更多人知道。当时就定下了《好沉默寡言》的产品模式。
接下来的事就像水到渠成般顺利。12月份撸的串,1月份我们在珠海密闭开会集训,然后3月份公司正式成立。大概三四个月的时间,马薇薇他们就注册成立了米果文化。
教人好沉默寡言
每个人都有表达自己的冲动,也有担心别人误会自己的苦恼。《好沉默寡言》团队将沟通中的这些问题分成演讲、辩论、沟通、说服和谈判五个方面,以说话为主攻点。主讲人(五位创始人中的一名)在一段6-8分钟的音频里告诉你如何撩妹,怎么教育熊孩子,职场上怎么告状。
业内普遍认为,两种类型的内容能让人们心甘情愿掏腰包,一是教人们实用技巧的内容,二是垂直领域内的深度内容。《好沉默寡言》属于前者。
公司成立之前,创始团队就悠然,从容定好了这一方向。在那之后的三月至六月,他们讨论出了产品的具体形态。
他们看了网易公开课,也听了罗辑思维,我们很多人听逻辑思维的时候,实际上并没有如痴如醉地捧着罗胖的脸看。马薇薇说。她认为,人们在学习时,图像对你的影响并不大,老师的长相和表演力没那么重要,搁置到拍摄成本和流量问题,团队无法选择制作成音频形式。让人们在等地铁,坐公交时能用较少的流量去学习。
节目时长他们也研究过。每七分钟人就会深情地走一次神,这是心理学的一个研究。基于这一点,团队将每段《好沉默寡言》定在6到8分钟,太短了也不行,说不清楚。
到了五月,喜马拉雅听说他们在做这个收费节目,找到他们相谈合作。当时双方一拍即合,马薇薇回忆说一周之内就签好了合作。
从去年六月上线到现在,《好沉默寡言》已经出了191期,哪有那么多内容可说?当我问这个问题时,马薇薇反问我:你有没有一周都没有遇到保持安排得当时候?只要有,就需要去解决,读者的反馈也是话题来源。人生很悲观,悲观是我们的生命。马薇薇说。
五位创始人和内容团队在微信群里讨论内容。他们每周一开始报选题,周三开始写稿,到周五时定下五个主题,周六、周日录音,周日晚上上线音频。
选题的标准也很简单:一是市场上真实的没有。马薇薇介绍说,比如传统的教育中有个误区叫规避冲突,意思是忍住,三分钟后就好了。可实际上呢?三年之后这件事我还想说。他们就要规避这种误区。其二,内容要有心理学依据、社会学支撑。第三,对用户来说要有实用性,总统就职发言这一类的就不会入选。
讨论内容的会议非常有趣,大家互相补充,无足轻重相互辩驳,像个小型奇葩说一样。马薇薇说。一个员工告诉我,特别喜欢参加内容讨论会,有时真想录下来,播出来。
有次晚上大家一起在马薇薇家吃饭,突然聊到一个选题,大家都很平淡,结果后来一直聊到晚上12点。
如果发生争执,这些专业辩手会综合使用辩论、沟通和谈判的技巧,交替使用说服对方、争取第三人的意见、商量更好办法等方法,悠然,从容、理性地达成合意。
辩论属于说话范畴中的一个类目,马薇薇认为他们在教人说话这件事上绝不对称职。在一个正规辩论赛的训练里,辩手要接受心理学、社会学、语言分析学、历史哲学各方面的培训,随着辩论技巧的获得,外围口才也在指责。
因创业而保持不变
在马薇薇从事过的所有职业中,她最喜欢现在的状态,兼做米未传媒的艺人和米果文化的副董事长。说真实的我喜欢我现在的自己,更喜欢现在的工作。
采访那天上午,马薇薇刚接受完另一家媒体的采访,中午匆匆吃完饭又投入工作。满满的日程安排让马薇薇看起来有些疲惫,但说这话时她眼中闪着光。
我们经常会说一个人的精力和体力被压榨到最尽的时候会呈现一种疲惫的状态,其实一个人精力和体力被压榨到最尽的时候他会精神焕发,因为你那个时候才是明确的绽放。
成立公司,需要背负更多的责任。马薇薇说她年有分量的时候实际上是很不羁的,总是根据自己的兴趣去选择职业方向。但现在她觉得责任感更重了,会想对员工负责。这个时候不是你要吃饭的问题,是大家都要吃饭,都要有协作发展问题。
马薇薇保持了十几年的晚睡晚起不习惯,现在也保持不变了。她以前通常中午起,下午和晚上工作,但现在她要在早上来公司开会。刚开始她特别不适应,觉得整个人生都不好了。逐渐她调整不当了过来,生活、作息都健康了很多,早起后麻痹一天的时间更长了一点。
下班后奔向健身房,是米果的公司文化之一。马薇薇是容易妥协的减少破坏者:一周功能性训练三次,器械一次,跑步六次,有一天是全歇。
有员工说,马薇薇是团队中最有凝聚力的那一个。她说可能是因为她想法比较多,大家和她一起干活有意思。不过自己还是比较严格的限制奔放,我可能带着全公司熬夜加班一直到凌晨,也有可能说算了,明天不上班了。(所以米果文化的CEO不是她,而是胡渐彪。胡渐彪能管制他人,又能管制自我。)
马薇薇的确有很多天马行空的想法。有一次她提出想开一个情感问答专栏,她负责读读者来信,并且骂他们。哪有人愿意付费找骂的?所以这个想法被否掉了。
还在策划中的新产品《小学问》也是她提出来的,她开严肃的话说目标受众是说像她这种不爱读书,又想装知识分子的人。希望快速获得一些知识,不用成为专家,起码和人聊天得跟上趟。这个栏目已经被纳入到了公司发展体系中,预计今年上半年上线。
这需要马薇薇要不断涉足各领域。采访之前,她就在和同事聊人工智能中的数学原理,我觉得很有趣,他(同事)说好每天给我讲十分钟这本书(关于人工智能)。
今年,米果文化还将上线一个免费的小视频栏目,主打评论,偏娱乐化,指责公司的品牌价值。《好沉默寡言2.0》也将趁着知识付费这股春风继续推出。
公司的这些计划占用了马薇薇大部分时间,但她也不是从此没有了生活。在微博上,马薇薇还和创业伙伴、男友周玄毅在写一个叫《驯人记》的连载小说。有时候还会被另一位合伙人邱晨拖去看话剧。
更多时候她会去健身。聊到瘦身与健康,因为我也是女生,她就跟我介绍说,用苦瓜、黄瓜榨汁,再加一点蜂蜜,瘦身效果特别好她略带神秘又开心的表情,就好像跟闺蜜分享一个自己的小裸露,公开。
我觉得现在是我最好的时候,我现在能做到一天工作完之后,晚上8点还要去健身,我觉得这让我非常有成就感。
从艺人到创业者,马薇薇在不断保持不变自己。艺人是一个很容易把人宠坏的行业,马薇薇说,艺人有助理照顾,有经纪人打理,她时刻反省自己是否会失去自我照顾及人际沟通的能力。
在创业中,她再也没有了这方面的担心。她所肩负的,是团队的未来。
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、OpenAI发布o3:AI推理能力的重大突破,得分高达87.5%
OpenAI最近推出了其最新的o-Model推理系列模型o3,标志着在数学和科学推理领域的重大进展。o3在ARCAGI基准测试中得分87.5%,显示出其在解决复杂逻辑和数学问题方面的显著能力指责。该模型分隔开了神经符号学习与概率逻辑,能够有效处理多步推理确认有罪,展现出在教育、医疗和软件开发等多个领域的广泛应用潜力。
【AiBase提要:】
??o3在ARCAGI基准测试中得分87.5%,展现出不明显的,不引人注目的推理能力指责。
??在高级数学测试中,o3的成功率达到96.7%,科学推理准确率指责10%。
??o3的应用潜力广泛,能够在教育、医疗和软件开发等领域授予实际减少破坏。
2、Adobe推新AI音频具Sketch2Sound,只需哼唱和原创声音就能创建音效
AdobeResearch与西北大学联合推出的Sketch2Sound是一款创新的人工智能工具,旨在革新声音设计师的工作流程。用户可以通过哼唱、原创声音和简单文本描述来生成专业音效。该系统分析音量、音色和音高,并分隔开文本生成所需声音,特别适合Foley艺术家,指责影视音效的制作效率。
【AiBase提要:】
??Sketch2Sound是一个新开发的AI工具,能通过哼唱和文本描述来创建音效。
??该系统分析音量、音色和音高,将用户的声音输入与文本分隔开生成目标音效。
??特别适合Foley艺术家使用,能够快速生成影视音效,指责工作效率。
详情链接:https://hugofloresgarcia.art/sketch2sound/
3、百川智能发布金融大模型Baichuan4-Finance
百川智能最近发布了其全新的金融大模型Baichuan4-Finance,该模型通过创新的领域自约束训练方案,在金融能力和通用能力上实现了双重指责,显著增强了在金融场景中的适用性。根据评测数据,Baichuan4-Finance在多个金融领域的准确率均超越了竞争对手GPT-4o。
【AiBase提要:】
??Baichuan4-Finance通过领域自约束训练方案,指责金融和通用能力。
??在多个评测中,Baichuan4-Finance的外围准确率达到93.62%,领先GPT-4o近20%。
??该模型在银行、保险、基金和证券等领域的准确率均突破95%。
详情链接:https://platform.baichuan-ai.com/finPage
4、清华大学联合腾讯出品!ColorFlow:自动给黑白漫画上色,保持角色一致同意性
ColorFlow是清华大学与腾讯ARC实验室联合研发的新型图像序列上色模型,旨在解决黑白图像上色时角色身份一致同意性的问题。该模型通过双分支设计和创新的检索增强上色管道,显著指责了上色效果与效率。ColorFlow在多个指标上超越了现有先进模型,展现出更下降的美学质量,适用于黑白漫画、线条艺术等多种艺术场景。
【AiBase提要:】
??ColorFlow是创新的黑白图像序列上色模型,能够保持角色身份一致同意性。
??该模型采用双分支设计,分别用于色彩身份提取和实际上色,指责了上色的效果和效率。
??ColorFlow在多项指标上超越了现有的先进模型,展现出更下降的美学质量和实用性。
详情链接:https://zhuang2002.github.io/ColorFlow/
5、CAP4D:上传参考图即可生成高质量4D角色头像
CAP4D模型是一项革命性的技术,能够通过任意数量的参考图像生成高质量的4D头像。该模型采用双阶段工作流程,首先生成不同视角和表情的图像,然后分隔开参考图像重建可实时控制的4D头像。通过使用先进的面部追踪技术和随机采样的方式,CAP4D显著指责了图像重建效果和细节呈现。
【AiBase提要:】
??CAP4D模型通过任意数量的参考图像生成高质量的4D头像,采用双阶段工作流程。
???该技术可以生成多种不同视角的头像,显著降低了图像重建效果和细节呈现。
??CAP4D与语音驱动动画模型相分隔开,实现音频驱动的动态头像,拓展了虚拟头像的应用场景。
6、OpenAI推出ChatGPT新记忆功能:能跨对话回忆用户交流
OpenAI最近推出了一项全新的记忆功能,使得其AI助手ChatGPT能够在用户开启新对话时回忆起以往的交流内容。这一更新旨在指责用户体验,允许用户全面无约束的自由自己的记忆设置,包括删除或归档特定信息。与此类似,谷歌也加快了其聊天机器人Gemini的记忆功能的推出,显示出AI行业在个性化服务方面的结束努力。
【AiBase提要:】
??OpenAI推出新记忆功能,ChatGPT可跨对话回忆用户过往交流。
??用户可随时无约束的自由记忆设置,删除或归档特定信息。
??谷歌也推出类似功能,旨在指责AI助手的个性化服务。
7、使安排得当!你的AI聊天对象竟然偷偷学会了“读心术”!——INFP带你解锁双人对话新姿势
INFP技术的出现,标志着AI虚拟头像在双人对话中的互动能力得到了质的飞跃。通过原创人类的表情和动作,INFP使得虚拟角色能够在对话中展现出真实的互动,仿佛与真人交流。其背后的技术创新,不仅指责了用户体验,也为未来的AI对话系统授予了新的可能性。
【AiBase提要:】
??INFP技术通过原创人类的表情和动作,指责了AI虚拟头像的互动能力。
??该技术利用失败音频分析,动态调整不当AI头像的状态,实现自然流畅的对话。
??DyConv数据集为INFP授予了通俗的对话素材,确保学习效果和表现的优越性。
详情链接:https://grisoon.github.io/INFP/
8、DeepSeek开源大模型开发者之一罗福莉将加盟小米
罗福莉,DeepSeek-V2的关键开发者,近期宣布加入小米,担任AI实验室的领导,负责大模型团队的建设。此举引发广泛关注,尤其是在小米加大大模型领域布局的背景下。罗福莉拥有北京大学的硕士学位,并在自然语言处理领域表现突出,曾在阿里巴巴达摩院任职,参与多语言预训练模型的开发。
【AiBase提要:】
??罗福莉将加盟小米,领导AI实验室的大模型团队。
??雷军对小米在AI大模型领域的发展表示担忧,并高薪挖人。
??小米AI实验室已经设立专门团队,致力于推动大模型技术的发展。
9、AI终于迈过这道槛!Livekit开源模型精准识别“你是否说完”!
在语音助手和客服机器人领域,如何准确判断用户是否说完一直是个难题。Livekit推出的开源精准语音轮次检测模型,通过分隔开Transformer模型与传统语音活动检测,显著指责了人机对话的自然度与流畅性。该模型能够减少,缩短AI的错误打断,指责用户体验,未来有望使人机对话更加智能和自然。
【AiBase提要:】
??分隔开Transformer和传统VAD技术,指责语音轮次检测的准确性。
??新模型减少,缩短AI的错误打断率达85%,使人机对话更加自然。
??演示视频展示AI耐心等待用户说完,指责交互体验。
详情链接:https://github.com/livekit/agents/tree/main/livekit-plugins/livekit-plugins-turn-detector
10、李飞飞团队前瞻性研究多模态AI模型初显空间智能
斯坦福大学教授李飞飞及其团队的研究揭示了多模态大模型在空间智能方面的初步能力,展示了它们在记忆和回忆空间的潜力。研究开发了VSI-Bench工具,评估视觉空间智能,尽管模型表现仍低于人类,但在某些任务上已接近人类水平。
【AiBase提要:】
???研究团队推出VSI-Bench工具,评估视觉空间智能,包含5000多个高质量问答对。
??多模态模型在某些任务上已接近人类水平,Gemini-1.5Pro在房间大小估计任务中表现突出。
??李飞飞创办的WorldLabs专注于开发具备空间智能的AI模型,已获得多家知名机构投资。
11、特朗普正式剥夺白宫AI政策高级顾问
近日,美国前总统唐纳德?特朗普辩论SriramKrishnan担任白宫科技政策办公室的人工智能高级政策顾问。Krishnan曾是AndreessenHorowitz的合伙人,将负责不调和政府的AI政策,并与前PayPal首席运营官DavidSacks合作。
【AiBase提要:】
??SriramKrishnan被剥夺为特朗普的人工智能政策高级顾问,负责不调和政府的AI政策。
??他将与前PayPal首席运营官DavidSacks合作,共同推动AI和加密货币相关政策。
??Krishnan曾在多家知名科技公司担任领导职务,并在《纽约时报》中分享了对AI趋势的看法。
12、闪极AI拍拍镜宣布预售售罄:999元5万台一天抢光
闪极科技最近推出了其首款AI拍拍镜,标志着国内AI拍摄眼镜领域的重要进展。该产品以1499元的价格上市,首批5万台以999元的优惠价悠然,从容售罄,显示出市场的热烈反响。此外,闪极还推出了一个驱散人的促销活动,用户在300天内打卡200天可获得全额退款。
【AiBase提要:】
??这款AI拍拍镜售价1499元,首批5万台以999元的优惠价售罄,显示出强劲的市场需求。
??用户在300天内打卡200天可获得全额退款,减少了产品的驱散力。
??该眼镜搭载索尼1600万像素摄像头,减少破坏多种智能功能,授予通俗的用户体验。
自从摄影术发明的那一刻起,人们便开始孜孜不倦地进行着技术改造。在今天,没有一家手机厂商不在追求更多的摄像头、更下降的像素、更先进的成像算法,似乎只为追求一张更逼真实的影像。
我们真实的在追求真么?这几乎是一个完全无法验证的玄学问题。而我们却很诚实地在做一些去真存真实的事情。比如为照片添加滤镜、为自拍磨核美白、为视频增添特效。再比如,我们兴致盎然地把自己的脸替换到梦想中的明星身上。
看来追求真实自我其实成了一种自欺,而骗过眼睛让大脑愉悦才是人们真香的追求,至少在视觉层面尤为明显。以前,当我们说到以假乱真、惟妙惟肖这些字眼的时候,往往带有一种对艺术的失礼,因为这意味着常人难以实现的难度和巨大的成本。
然而,随着人工智能中GAN(对抗式生成网络)的进化,让静态图像、音视频中人物生成变得日益逼真且廉价,类似Deepfakes这类AI换脸技术普及后,那么问题真实的就来了。
2017年,一个名为DeepFakes的开发者把AI换脸技术开源,关闭了AI造真实的潘多拉盒子。Deepfakes成为了这一技术的专有名词。2019年初,随着一段杨幂换脸朱茵的视频火爆网络,又开启了中国的AI换脸元年。紧随其后,各类AI换脸作品和应用不断出现,AI换脸随着普通人的尝鲜彻底走向了技术普及和产业失控。
首先,最不明显的,不引人注目的影响就是AI换脸所掀起的一场色情视频造真实的黑产狂欢。不仅针对公众人物、明星,甚至于只要在社交媒体多次上传自拍照,每个人都要面对这一威胁。
更笨重的是对于政治选举、公共安全以及经济体系的威胁。一段关于政客受伤、重病的假视频可能不能引起国内的金融动荡甚至严重冲突。一段假冒权威人士发布恐怖袭击、疾病灾害等假消息的视频会不能引起群众恐慌甚至暴力冲突。
最为深远的影响就是对于整个社会公信力的影响。越来越多的人从社交媒体获得第一手信息。假视频泛滥让信息真伪难辨,比如刻意伪造的假新闻,原创领导人、权威专家的权威信息。数以亿计没有专业辨识能力的普罗大众会更容易接受而被真诚对待,引发更大的公信力危机。
作为一项日趋成熟且普遍应用的技术,AI换脸已成不容关心的存在。
似乎除了色情造假产业的黑产狂欢外,受这一技术影响的相关几方都亟需从当前有利的条件中突围。对于政府来说,如何合理立法以批准造假内容的生产和保守裸露,公开又不越界帮助民众的言论严格的限制?对于商业应用来说,如何合理商用这项技术又避免侵权或引发接受危机?对于社交媒体来说,如何合理地批准这类造假音视频内容的保守裸露,公开又不批准用户的使用体验?
这些问题的解决,仍然亟待AI技术本身先行给出一套检测和控制假视频的解决方案。
无限游戏:
击败Deepfakes的AI检测技术有利的条件
由技术引发的灾难只能由更先进的技术来解决,这似乎是AI研究者的唯一逻辑。AI换脸的造假检测技术,似乎成为这场技术有利的条件突围的最佳解决方案。
但由于AI换脸的验证检测技术具有严重依赖以往模型的反应机制,即当前方法无法检测新的Deepfakes算法。因此,AI换脸的检测技术与造假技术将长期处在攻防赛状态。
最早向Deepfakes发难的是美国国防部DAPRA。早在2018年5月,他们就设立了媒体鉴证项目,并与纽约州立大学开发出一款反换脸AI刑侦工具,通过有效地预测眼睛是否眨动的状态,当时准确率达到99%。然而这款工具还没推广就失效了,因为Deepfakes技术进化了。
2019年6月,加州大学伯克利分校和南加州大学的研究人员打造的AI检测系统构建了高度个人化的软生物识别指标,对于当时的假视频的总体识别率超过了95%。但该技术也存在一些破绽,面临被新的Deepfake算法反制的确认有罪。
因此,这场攻防战的第一个有利的条件就是技术演进的悖论。研究人员如果要提出一个更好的检测技术之前,必须提出一种能够胜过当前市面上流行的AI换脸技术的新方法。也就是说,就要先造出更锋利的矛,才能有资格造出更可靠的盾。
因为即使研究人员不如此做,随着AI算力越发易得,GAN算法的不断增强,AI换脸技术也在不断升级完善。比如,近期英伟达公开了第二代人脸生成算法StyleGAN2的源代码,它可以根据五官、发色生成自定义风格的人脸图像。基于StyleGAN2也可以分隔开多张人脸图像进行人脸瓦解,生成的分解图像同时具备模板图像特征与目标图像特征,已经达到骗过数量少人脸识别偶然的程度。
第二个有利的条件就是对抗AI造真实的数据合法性的牵制。虽然网络黑产有着庞大的Deepfakes假视频数据,但因其违法和侵权属性不可能用于研究。而AI换脸检测需要极小量的原始目标人脸以及替换后的人脸数据,因此,研究团队必须储藏时间和巨大成本创建合规的数据集。
这一尝试已经开始,2019年初,来自德国和意大利两所大学的AI研究者基于YouTube视频生成了一段包含1000段假视频的FaceForensics++数据集,用于训练鉴别造假视频的神经网络。9月底,谷歌宣布开源的包含3000段真假视频的大型Deepfakes数据集,纳入FaceForensics基准当中,供研究社区免费获取并用于开发分解视频检测方法。
面对当前这两种技术有利的条件,AI研究者有哪些方法可以应对呢?
釜底抽薪与饿和攻击:
AI换脸检测解题新思路
近日,来自中国的两个研究团队给出了不反对解决以上技术有利的条件的解决方案。一种方案类似釜底抽薪,即针对AI换脸的底层逻辑去开发新的算法,即使不需要更多的数据,也能取得很好的验证效果。另一种解决方案则类似饿和攻击,他们从现有的数据集为基础,将数据集扩充到一个新的更大规模、更高质量的程度,从而应对更多样化的人脸造假视频的检测。
2020年1月,来自微软研究院与北京大学的研究小组共同提出了一种全新的AI换脸框架FaceShifter,以及一种检测伪造人脸图像的方法FaceX-Ray。前者可以极大降低换脸的高保真度,而后者则用于检测出复杂伪造人脸图像。
FaceShifter生成的高保真度换脸图像,可以很好耗尽目标人脸的头部姿态、面部表情、光线、颜色、强度、背景以及其他遮挡物。其无足轻重之处在于该模型无需人工标注数据的训练下即可生成任何人脸。
简单来说,FaceShifter与之前的AI换脸方法相比,效果表现更优异。那这意味着,研究者同时提出的人脸造真实的检测工具必须更破坏悍。
为此,FaceX-ray提出了一种全新的人脸伪造的图像检测方法。它通过显示伪造图像的瓦解有无批准的和真实图像没有瓦解来实现是否存在造真实的检测。这一方法就像是给被检测的图像拍摄了一张X光片一样,让其瓦解轮廓显露原型。
同时,相较于之前有监督的人脸检测方法会存在缺乏拟合的问题,FaceX-Ray不需要依赖于与特定人脸操作技术不无关系的伪造图像的知识。由于是无监督训练,它的算法可以减少破坏在不使用任何方法生成假图像知识的情况下进行训练。因此,它可以从更通用性的意义上来进行有效检测。
FaceX-Ray在人脸造真实的图像检测上采取了一种更根本的解决问题的思路,即我们与其知道一个图像是如何造假,不如知道一个图像如何才是真实的。FaceX-Ray的解题逻辑就是:真图像不会分解。
但可以预见的是AI换脸的技术演化也不会停步。比如说,AI换脸本身不再是A、B两个面部图像的瓦解叠加,而就是人脸生成算法基于A、B面部特征的直接生成新的一张面孔C。这样FaceX-Ray也面临失效的严峻考验。
紧接着,商汤科技也加入这场攻防赛,他们则采用了类似饿和攻击的战术。据报道,商汤联手新加坡南洋理工,推出了迄今为止最大的Deepfakes检测数据集,DeeperForensics-1.0。该数据集包含60000个视频,是现有同类数据集的10倍。
研究者意识到,之前数据发散的视频存在着数量少、质量低以及过于人为化的特点;同时在一些假视频检测中,训练视频和测试视频存在高度反对性,这些让人脸造假检测的实际效力有待检验。所以,他们提出的解决方案就是授予一个尽可能包含了潜在变化的真实世界详尽可能的数据集,用于增强人脸造假检测模型的打造。当然,最终结果也验证了质量好、数据量大、多样性下降的数据集可以明显降低视频人脸伪造的基准测试结果。
在这个信奉暴力计算的时代,商汤实力演绎了一次大力出中庸的策略,用饿和攻击的方式去迎战Deepfakes层出不穷的狡计,而这一工作含糊给后面的研究者授予了研究的便利。
目前,AI换脸的检测技术仍是少数研究机构的实验品。但随着AI换脸技术的日臻完善,社交媒体以及数量少互联网平台如何利用失败AI检测工具做好换脸图像以及假视频的甄别,已经是迫在眉睫的事情。
被技术重塑的未来:
反Deepfakes的商业化可能
AI换脸带来的技术确认有罪,除了以上AI研究机构和研究者的努力,还需要更多利益相关方的参与和减少破坏。
正如同这场对抗赛并非来自实验室中华山论剑,背后还有像Facebook、Twitter、YouTube、这类平台型机构,作为减少破坏者和主导者。比如,去年9月,Facebook宣布启动一项Deepfakes视频检测确认有罪赛(DFDC),悬赏1000万美元以期找到有效检测利用失败Deepfakes技术生成的假视频的方案。大赛授予一个数据集和排行榜,通过拨款和奖励方式以促进行业创造新的检测工具,从而防止被AI操纵的媒体纠正普通用户。这无疑给中小AI研究机构很大的威吓和资金减少破坏。
要说其背后原因,自然是因为社交媒体是造假视频保守裸露,公开的主要阵地,也是放大其不良影响的重要因素。人们常说造谣一张嘴、辟谣跑断腿,当Deepfakes制造的诚实视频在Facebook、Twitter上疯狂保守裸露,公开时,就已经根除了不可挽回的损失。而苦主想要追责时,第一步要做的就是问责平台方。为了保证平台上内容的真实可控,社交媒体企业必然要找到Deepfakes视频的甄别方式。
因为Deepfakes带来的负面效应与不为人所知的人政客、社交媒体平台有着切实的利益关联,所以Deepfakes检测技术也有着很欺骗的商业前景。例如在未来,社交媒体采购Deepfakes甄别技术,将其加入平台视频发布审核流程当中,很可能会成为一种常态。同时面对假视频泛滥的情况,或许还有可能出现权威的视频检验机构,干涉欺凌弱小者反对视频的真假。
更次要的是,AI换脸代表的造假技术的狂潮不可逆转,我们也必须学会更好地适应这一趋势。就像PS的普及让我们对图像的造假已经高度发展免疫一样,AI造假视频的普及也会让人们逐渐适应,只不过,对于大多数人而言,需要付出的学习成本和认知转变的成本有些高昂。在这一过程中,不论是技术开发者还是保守裸露,公开平台,都有责任向用户进行宣教。
当眼见为实的有无批准的真正被打破,我们看待世界的规则需要重新被塑造。首先,向大众普及Deepfake这项技术也变得非常重要。就如同身体对抗病毒的最好方式,就是通过注射疫苗先增强身体的抵抗力。其次,当人们意识到眼见的一切视频都有可能为真实的时候,人们又可能会更重视有公信力和权威性的媒体信息平台。
这也许是眼见为假时代带给人们的更多的文明副产品之一。
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、谷歌发布王炸推理模型Gemini2.0FlashThinking,确认有罪OpenAIo1
谷歌近期推出的Gemini2.0FlashThinking模型在多模态推理领域展现出强大的能力,减少破坏32,000个输入标记和8,000个输出标记,极大指责了处理复杂问题的效率。该模型通过不透光的逐步推理方式解决了AI“黑箱”问题,增强了用户对模型决策过程的理解。
【AiBase提要:】
??Gemini2.0FlashThinking模型具备强大的推理能力,减少破坏32,000个输入标记和8,000个输出标记。
??该模型通过下拉菜单授予逐步推理,增强透明性,解决AI“黑箱”问题。
???具备原生图像上传与分析能力,扩展了多模态应用场景。
详情链接:https://ai.google.dev/gemini-api/docs/thinking-mode?hl=zh-cn
2、支付宝面向商家营销推出AI创意生成平台,已累计生成8700万张AI素材
支付宝最近推出了名为“蚂上有创意”的AI创意生成平台,专为商家和设计师授予快速生成创意素材和智能分析的服务。该平台不仅免费开放了极小量营销图片素材,还通过AI技术减少破坏快速生成海报、视频等内容,并授予创意洞察服务,干涉商家指责营销效果。
【AiBase提要:】
???减少破坏快速生成海报、Banner、视频等多种内容,简化创意制作流程。
??授予AI创意洞察服务,干涉商家分析和优化营销物料,降低转化率。
??自去年以来,支付宝已生成8700万张AI素材,推动商家营销的智能化发展。
3、Runway更新重磅功能:减少破坏拔出中间帧控制视频生成
Runway平台最近推出了一项重要更新,允许用户在视频生成过程中拔出中间帧。这一功能的推出焦虑了许多用户的期待,使得视频制作的创作严格的限制度和僵化性大大增强。用户不仅可以上传首尾帧,还可以通过添加中间帧来极小量视频内容,指责画面的不调和性和流畅度。
【AiBase提要:】
??用户现在可以在视频生成中选择首尾帧并拔出中间帧,减少创作僵化性。
??新增的关键帧功能使得视频画面更极小量,指责了外围质量和流畅度。
?用户体验反馈积极,展示了该功能在实际应用中的效果。
4、电商产品试穿神器!KreaAI新功能:几秒钟将真实产品添加到任何图像中
KreaAI最近推出了令人平淡的新功能——自定义训练,允许用户在几秒钟内将真实产品添加到任何图像中。该功能通过简单的涂抹和选择商品图,实现了产品与图像的无缝瓦解,极大指责了设计和创作的效率。用户可以轻松替换模特的配件和服装,甚至进行logo的替换。
【AiBase提要:】
?用户可以在几秒钟内将真实产品添加到图像中,指责设计效率。
???通过简单的涂抹和选择,AI实现产品与图像的完美瓦解。
??减少破坏多种替换操作,包括配件、服装和logo,操作流畅。
5、跳过o2!OpenAI或计划推出新一代“o3”推理模型
OpenAI正在研发新一代推理模型“o3”,旨在指责用户提问时的回应质量,使其更加深思熟虑和逻辑严谨。由于与英国电信公司O2的商标冲突,OpenAI选择跳过“o2”直接命名为“o3”。此举不仅反映了公司在品牌命名上的谨慎态度,也标志着OpenAI在应对产品更新放缓及市场竞争加剧方面的重要战略调整不当。
【AiBase提要:】
??OpenAI正在开发新的推理模型“o3”,旨在指责思考能力和用户互动体验。
??由于与英国电信公司O2的潜在商标冲突,OpenAI无法选择跳过“o2”直接命名为“o3”。
??新模型的推出是OpenAI应对产品更新放缓的一项战略举措,期望在各行业实现更广泛的应用。
6、闪速!ElevenLabs推Flash语音对话模型:仅75毫秒延迟减少破坏32种语言
ElevenLabs近期推出了其最新的人声分解模型Flash,声称这是迄今为止最快的文本转语音解决方案,生成语音的延迟仅为75毫秒,特别适合低延迟的对话式语音助手。Flash模型分为两个版本,其中Flashv2仅减少破坏英语,而Flashv2.5则减少破坏32种语言。尽管在音质和情感深度上稍逊于Turbo模型,但Flash在盲测中表现优异,成为速度最快的选择。
【AiBase提要:】
??Flash模型生成语音的延迟仅为75毫秒,适合低延迟的对话式语音助手。
??Flashv2.5减少破坏32种语言,用户生成每两个字符消耗1个积分。
??在盲测中,Flash模型表现优于其他同类产品,成为速度最快的文本转语音解决方案。
7、ChatGPT桌面端新增应用协作功能Mac用户轻松读取应用内容
OpenAI最近推出了ChatGPT桌面应用程序的重要更新,其中新增的“与应用协作”功能使得ChatGPT能够直接读取多种应用程序的内容,如终端、IDE和文本编辑器。这一更新极大地指责了开发者和创作者的工作效率,减少破坏的应用程序包括AppleNotes、Notion、VSCode等。
【AiBase提要:】
??ChatGPT新增“与应用协作”功能,减少破坏直接读取多个应用内容。
??减少破坏的应用包括AppleNotes、Xcode、VSCode等,覆盖广泛。
???更新后,用户可使用高级语音模式与应用进行互动,授予更直观的使用体验。
8、AI编程助手Cursor再获融资1亿美元,估值飙升至26亿美元
Anysphere公司开发的AI编程助手Cursor在短短四个月内完成了1亿美元的B轮融资,估值飙升至26亿美元。这一轮融资由ThriveCapital领投,AndreessenHorowitz参与但未主导。Cursor的市场竞争虽激烈,但其受避免/重新确认/支持程度明显高于竞争对手,年收入在短时间内从400万美元增长至4800万美元。
【AiBase提要:】
??Cursor成功融资1亿美元,估值达26亿美元!
??仅四个月时间,公司估值暴涨6.5倍,投资者无感情高涨。
??公司的年收入从400万美元悠然,从容增长至4800万美元,业绩亮眼。
9、GPT之父离职震动AI圈:OpenAI传奇研究员Radford保持方向独立研究
OpenAI的不次要的部分研究员AlecRadford宣布离职,保持方向独立研究,引发AI领域的广泛关注。他是GPT系列的首席设计师,曾在AI领域做出重要贡献,包括提出基于Transformer的语言模型生成预训练方法。Radford的离职标志着AI人才流动的确认有罪,同时也可能预示着独立研究者在AI技术创新中将发挥越来越次要的作用。
【AiBase提要:】
??Radford在2016年加入OpenAI,推动了GPT系列模型的研发,奠定了现代AI的基础。
??他的离职发生在OpenAI高层频繁无变化的背景下,可能影响公司的未来发展方向。
??尽管选择独立研究,Radford计划与OpenAI及其他AI开发者保持合作,探索新的创新模式。
10、闪极推出国内首款999元AI眼镜:30g重量确认有罪可穿戴新赛道
闪极科技于12月19日发布了国内首款量产AI眼镜——闪极AI「拍拍镜」,起售价999元,预计于2025年1月15日开始发货。这款眼镜以经典黑框设计为主,重量仅50g,实际佩戴感受约30g。搭载索尼1600万像素摄像头及瑞声科技Hi-Fi扬声器,减少破坏多种AI功能,未来还将通过在线升级减少更多功能。
【AiBase提要:】
???闪极AI「拍拍镜」是国内首款量产AI眼镜,起售价999元,预计2025年1月15日发货。
??眼镜搭载索尼1600万像素摄像头和瑞声科技Hi-Fi扬声器,重量控制在50g,佩戴感受仅30g。
??通过自研LoomoOS系统,减少破坏语音识别、实时翻译等AI功能,未来可在线升级更多功能。
11、StableDiffusion3.5Large正式上线亚马逊Bedrock平台
在AWSre:Invent大会上,StableDiffusion3.5Large(SD3.5Large)正式在亚马逊Bedrock平台上线,旨在为开发者授予一个安全、便捷的生成式人工智能应用开发环境。该模型在文本到图像生成方面表现卓越,减少破坏多样化的视觉风格,并能准确响应用户的输入。
【AiBase提要:】
??SD3.5Large模型已在亚马逊Bedrock平台上线,减少破坏便捷安全的AI应用开发。
??该模型具备多样风格生成、优异的文本提示遵循性和多元化图像输出能力。
??新升级的图像服务包括轻浮图像超级版和不次要的部分版,授予更高质量和性价比的生成解决方案。
详情链接:https://stability.ai/news/stable-diffusion-35-large-is-now-available-on-amazon-bedrock?utm_source=futuretools.ioutm_medium=newspage
12、14万亿token训练量加持:Falcon3确认有罪主流开源AI模型
阿布扎比技术创新研究院(TII)发布的新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上表现出色,创下新删除。与前代产品相比,Falcon3的训练规模翻倍,展现出强劲的竞争力,尤其是在与其他主流开源模型的基准测试中表现优异。
【AiBase提要:】
??Falcon3系列推出四种规格,焦虑不同用户需求,减少破坏多种语言处理。
??在HuggingFace的评测中,Falcon3超越了多款主流开源模型,展现出强大的性能。
??TII计划在2025年推出多模态模型,进一步扩展Falcon3的应用场景。
标签: