找到
918
篇与
互联网
相关的结果
- 第 27 页
-
年会旺季机器人很忙,上海发布首个机器人租赁开放平台,冲刺机器人商用第一城 年关将至,不少公司正准备筹办年会,机器人成了年会上的“座上宾”。最近,国内首个机器人租赁开放平台“擎天租”在上海亮相,通过RaaS(机器人即服务)新模式,带来机器人租赁一体化解决方案。据悉,擎天租平台以上海为起点,预计明年将拓展至200个城市,服务客户将超40万人次。面对100亿元的机器人租赁市场,业内认为上海具备本体智能、商业场景、量产能力等多方优势,有望成为国内“机器人商用第一城”。年内预计突破10亿元“如果公司年会想要租机器人,我建议最好在12月底就下定,不然到了年会旺季早被其他人订完了。”面对记者的询价,上海宝山区一名机器人租赁销售人员推荐尽早预订,公司约有30台机器人和机器狗,在明年1月到春节前这段时间几乎被各大公司的年会订满了。据他介绍,租赁机器人分为基础版和舞蹈版,基础版具备挥手、走路、握手三个基础功能,舞蹈版则在此基础上增加了摇摆、敬礼、飞吻、比心、投篮等十几种动作,以及太极、青海摇、APT(韩式舞蹈)等8种舞蹈模式。“基础版能满足多数场景需求,每天租金3000元,舞蹈版要5000元。”他告诉记者,对于预算有限的客户,四足机器狗性价比更高,除了伸懒腰、拜年、比心、握手等常见动作外,还可完成6种基础舞蹈动作,租金1500元左右。如果连续多日租赁,价格还能再优惠一些。“宇树机器人还是最火的,很多客户点名要‘春晚同款’,自身流量大,价格也相对便宜。” 基础版机器人的日租金约3000元。不过,该销售人员也提醒,一台机器人实际每天工作时长仅2—3小时,且不能长时间连续表演,以免出现故障。动辄上千的租金看似不菲,实则已经大幅降价了。今年年初,一台机器人的日租金最高可达2.5万元,还一度供不应求。今年9月,机器人每日“出场费”已降至1.5万元,如今在电商平台上,机器人的日租金普遍在三五千元。短短一年内,机器人的租金价格普遍打了2—5折。“国内的机器人租赁市场自今年春节后兴起,从最初的自发性兴趣尝试,到年末已形成行业趋势,租机器人用于展示、引流宣传成为越来越多企业和机构的选择。”智元合伙人、高级副总裁姜青松预计,今年机器人租赁市场规模将突破10亿元,随着平台化运营的推进,预计明年可能会达到100亿元。从硬件出租迈向技术服务早在2016年,机器人也曾引发一小波热潮。猴年春晚,与孙楠同台表演《心中的英雄》的小型跳舞机器人阿尔法,因为小巧可爱的外形和舞姿,受到租赁市场的关注。遗憾的是,那时候的机器人只会简单的预设动作,覆盖范围有限,商业价值未能充分显现。直至蛇年春晚宇树扭秧歌,最终让机器人表演成为现象级的新兴市场。“总体来看,机器人租赁市场仍不成熟,市场散点化,缺乏有效协同。”姜青松认为,目前机器人应用多集中在文艺表演领域,运营合作商各自寻找客户、发布宣传视频吸引订单,导致用户找租机器人困难,租赁商也难以提升定价、拓展客户渠道。记者注意到,随着智元机器人等主机厂商的下场,机器人租赁模式正从单纯的“硬件出租”转变为“技术服务”。比如,擎天租平台主打RaaS(Robot as a Service,机器人即服务)新模式,不同于传统机器人买断式销售或是一次性租赁,而是以场景化租赁为核心,用户通过选择企业年会、商场促销、婚礼庆典或校园活动等应用场景,平台提供全套解决方案,包括机器人本体、内容编程、操作人员、物流配送和售后保障。 灵犀X2机器人组队表演。擎天租CEO李一言解释说,用户不再是租一台机器人,而是买一项由机器人提供的服务,就像是“滴滴打车”而不是租车。“过去我们把机器人当作机器,像商品一样购买或租赁,但在具身智能时代,我们应该把机器人当作人,像人一样按需提供服务,基于服务的价值获取回报。”智元机器人董事长邓泰华认为,随着具身智能产业发展,RaaS将成为主流商业模式之一。据介绍,擎天租平台销售网络覆盖全国50个城市,明年将拓展至200个,同时还会吸引超10家机器人本体制造商、200家服务租赁商、3000个内容创造者,预计客户将超过40万人次。目前,海底捞已成为001号客户,明年春节前,租赁机器人将入驻部分门店,陪顾客写福字、表演“科目三”舞蹈等。上海可探索规范行业短板机器人租赁的快速发展,背后是上海不断完善的具身智能产业生态。从机器本体、具身智能、商业场景和量产能力等多重指标来看,上海可冲刺“全国机器人商用第一城”。以本体和模型能力来看,上海形成浦东“模力社区”和徐汇“模速空间”双强的产业格局。仅浦东张江园区,集聚了国地中心、智元机器人、傅利叶智能、开普勒等产业链企业70余家,整机上下游企业50余家,形成完整的产业集群。 机器人在表演“财神到”。在模型创新方面,上海推出了“零代码”的智元灵创机器人内容创作平台,普通用户无需编程基础,只需用手机拍摄一段简单动作视频,平台即可让灵犀机器人1:1复制出用户的动作。智元灵心平台则内置了三四十款风格各异的音色,可赋予机器人温柔陪伴、俏皮互动等多种交互模式,还支持“音色复刻”功能,上传一段录音,即可让机器人拥有相似声音。这些模型能力,都将加速机器人在文娱商演、门店接待等场景的高效落地应用。此外,上海丰富的商业、文娱场景也成为机器人绝佳的“实习基地”。柯进网络科技(上海)有限公司董事长曹亚告诉记者,上海多数商圈和公共服务场所对机器人热情很高,部分中小学还设立机器人科创实验室。“现在看到机器人,大家都见怪不怪了。”曹亚海还表示,上海老龄化程度比较高,机器人在康养市场的潜力很大。12月初,上海发布新版康复辅助器具社区租赁服务目录,目录首次出现智能陪伴型机器,可实现陪伴畅聊、知识查询、载歌载舞、生活服务、紧急呼救等,未来还可通过对接社区第三方服务商,延伸出在线下单陪诊、维修等服务。“现阶段,机器人租赁市场还面临不少行业规范问题,比如机器人操作工程师相关认证的缺失。”姜青松表示,平台正尝试开展机器人操作员培训,并搭建对应的等级晋升机制。此外,机器人租赁、采购环节的相关保险品类仍是市场空白。他认为,以上海的金融优势,可参照车险模式率先试水具身智能相关险种,填补这一空白,推动上海打造机器人商用第一城。原标题:《年会旺季机器人很忙,上海发布首个机器人租赁开放平台,冲刺机器人商用第一城》栏目主编:李晔本文作者:解放日报 查睿 -
监视员工的电脑软件被公开叫卖:微信聊天就像在"裸奔" “如何神不知鬼不觉地对员工电脑屏幕进行监管?其实非常简单,只需要安装这款软件,就可以监管到公司所有电脑,实时查看到员工电脑屏幕。员工从安装开始全程无感知、无弹窗⋯⋯”小红书上,有销售人员发布多个宣传视频,展示安装在员工电脑里的“电子眼”的强大监控功能。《每日经济新闻》记者(以下简称每经记者)发现,一款面向公司用户、单套价格或不足300元的监控软件正在被公开售卖。“可以同步监管到员工微信和QQ”“无感知”“无弹窗”⋯⋯“监控神器”真的能“完美隐身”?每经记者展开深入调查。1“监控神器”被公开售卖销售:员工是察觉不到的“笔记本、台式机都能用⋯⋯可以等员工下班了再安装,安装好之后把安装包删除⋯⋯被监控过程中,员工那边是察觉不到的,咱们有这个优点。”对于这款软件,河北安固云软件有限公司(以下简称安固)的销售人员介绍称。每经记者:受控端可以看到安装文件吗?安固销售:看不到,到时候会隐藏起来。每经记者:杀毒软件查得出来吗?安固销售:我们老板已经和这些厂商协调过,都是兼容的。这不是病毒,所以(杀毒软件)是检测不到的。记者注意到,通过安固公司官网披露的联系电话可直接搜索到该销售人员的微信。每经记者随即以意向客户的身份,从该销售人员处拿到了上述软件的控制端(监控其他电脑的终端)及受控端(被监控的终端)两个安装包进行实际安装测试。受控端安装仅用时23秒,全程没有隐私条款弹窗,也无法选择安装路径。安装完成后,需填写控制端IP,设置受控端所属部门及名称并点击确定,该设备即在控制端上线。 控制端界面显示受控端上线控制端页面顶部显示,软件实际名为“固信安全管控平台”。值得一提的是,当被问及该软件的资质和后续运维情况时,该名安固销售人员称:“这边是个新起的公司,属于分公司,但总公司好像(成立)时间挺长的。”每经记者深入调查发现,安固实为该软件的代理商之一,该软件的源头公司名为“山东固信软件有限公司”(以下简称固信),即上述安固销售人员口中的总公司,天眼查显示,两家公司在股权上并无关联。记者随后以意向客户的身份分别致电固信官网标注的400电话及售前咨询电话。固信售前咨询表示:“经确认,安固是我们代理。”在提供相关信息后,固信的销售人员称可以安排测试,“台式、笔记本都行⋯⋯但我们有一个局域网限制。主控电脑要与被控电脑处在同一个局域网内”。何为局域网限制?据该人员解释,可以简单理解为控制端与受控端连接同一个Wi-Fi。如果笔记本电脑连接员工自己提供的热点,是否就监控不到了?该人员回复称:“是的,但是我们的软件可以限制员工不能连接其他网络。”对于“笔记本存在带离公司的场景”,该人员进一步给出了更加“周全”的监控方案:做一个公网,将软件服务端部署到云服务器上,所有电脑绑定公网IP(网际互连协议),依靠这种方式,即使员工在天涯海角,也能实时监控、管理,但是会增加额外成本。在记者提出远程测试的需求后,该人员称,需要拍摄服务器机器码到公司logo(标识)的全程无剪辑视频,且服务器账号必须是企业认证。而安固在提供远程测试时,记者仅提交了一张营业场所照片。几经沟通后,记者获取了固信销售人员提供的安装包。当在相同设备运行安装软件时,电脑系统提示“已安装,是否覆盖?”更换设备安装后,记者发现,两家公司提供的软件从受控端顶部显示的名称到基本功能设计、页面设计一致。同样一款软件,安装后的监控效果究竟如何?每经记者找了一位从事网络安全10余年的专业技术人员一同测试。2记者亲测:微信聊天实时“直播”从屏幕到硬盘一览无余每经记者首先将从安固获取的控制端及受控端两个安装包分别安装完成,并将受控端设备设置上线。此时,受控端系统托盘处显示,客户端策略生效中。不过,这款软件藏得极深:记者查看任务管理器及应用列表,并未发现该软件的身影。 受控端设备上线后系统显示的信息按照图示点击软件图标打开终端管理助手,记者发现,弹出的页面除了显示设备名及IP地址,并不具备实际管理及操控功能。在控制端设置“隐藏”,十几秒后,受控端系统托盘处的软件图标旋即消失。在此过程中,受控端未收到任何系统提醒,而控制端可以决定是否允许受控端查看自身策略。 控制端“编辑策略”页面,可由此开启不同的“监控”功能此外,记者还通过控制端设置开启了微信、QQ、钉钉、飞书等社交软件的聊天审计功能,能监控浏览网站的数据,还能同步开启屏幕录像。在设置过程中,受控端同样没有收到任何提醒。设置完成后,记者开始与受控端登录的微信聊天。期间,记者通过微信发送的文字、图片、视频、文件等全部聊天记录出现在了控制端的页面上。甚至对于图片、视频、文件的具体内容,控制端也可以通过预览或下载的方式查看,而受控端毫无察觉。点击“实时屏幕”,控制端可以同步观看受控端屏幕操作;点击“本地审计”,则可查看受控端的屏幕录屏,甚至受控端电脑的文件也一览无余。对于杀毒软件的查找情况,每经记者也进行了测试。需要注意的是,安固的销售人员声称其老板跟杀毒软件厂商有过“协商”,安装的软件不会被判定为病毒,对于该说法,记者无法确定真假。但每经记者在受控端被监视的情况下,使用360安全助手、火绒安全软件、腾讯电脑管家、金山毒霸、联想电脑管家对受控端进行了全盘扫描,均未识别出任何风险。 多款主流杀毒软件未识别出风险而上述记者亲测“裸泳式”监控过程涉及的两台电脑,相距近两千公里——控制端电脑位于成都市,受控端电脑位于北京市,两台设备以一台服务器作为公网映射。此外,每经记者还在局域网内同步测试了固信提供的软件,操作过程中,对应的受控端同样全程无感知,杀毒软件也未检出异常。与安固有所不同的是,通过固信提供的软件无法查看受控端微信发送的图片。经此验证,安固销售人员宣称的监控功能确实能实现,并且能做到被监控者在监控中无感知。3已有多家企业购买“监控神器”这样一款能让杀毒软件“失明”的监控软件,究竟有多少公司在使用?在和安固的销售人员沟通过程中,其直接发来了某理工科院校的采购合同扫描件。订购信息显示,该院校采购的软件为“终端安全管理系统”。而为了证明“总公司”的实力,安固的销售人员还发来多份固信的销售合同扫描件,其中一份合同的采购方显示为国内大型知名IT服务商,合同信息显示,该公司采购的软件为“安全管控平台”。每经记者:“终端安全管理系统”和“安全管控平台”是同一款软件吗?安固销售:只是叫法不一样,就像“上网行为管理、数据防泄漏、终端安全”的说法,意思就是可以监控员工上班情况、浏览的什么网站、聊天内容、文件操作、文件管控、实时屏幕、录像等。每经记者:上述两家采购方购买的是否为此前测试的监控员工软件?安固销售:对的。记者还注意到,部分合同的采购方和收货方并非同一家公司。例如,一家位于天津市的小型信息技术公司签订的合同中显示的收货方为大型能源投资公司等多家企业。一家位于武汉市的小型科技公司委托固信将产品送至北京市朝阳区建国门外大街甲6号WWT大厦某层交货,该合同的货物清单明确显示,“提供微信聊天审计、QQ/TIM聊天审计、钉钉聊天、企业微信聊天审计、浏览网站审计、网络搜索审计、电子邮件审计和上传下载审计”的模块购买数量为2300套。安固究竟是一家多大规模的公司?其官网及销售人员出示的宣传材料上显示,安固公司目前已服务数千家行业头部企业,客户涵盖金融、互联网、医疗、制造等多个领域。这些客户均购买了记者测试的这款软件吗?上述收货方为大型能源投资公司等多家企业的合同采购项目为“网络准入产品”,该产品是否包含监控功能?安固的销售人员称,网关属于不同的功能,是可以单独购买的,宣传材料中列示的公司客户并非全部购买了监控功能。每经记者注意到,这款软件的使用成本并不高。固信的销售人员提供的报价为:采购一台,按原价498元/台收费,可终身使用,如果需要后续更新维护,第二年起按合同价款的15%收取维护费;采购数量达到20台到50台有优惠,单价比原价低近200元。调查过程中,每经记者发现,两家公司的合同范本均对采购方的权利义务及安全责任做出规定。 两家公司的合同范本均对采购方的权利义务及安全责任做出规定而在与记者实际沟通的过程中,安固的销售人员未提及在监控之前需告知员工,且称,如果购买数量少,也可以以个人名义购买。固信方面则表示软件针对企业单位内部终端电脑的管理,需要对员工进行告知,不能侵犯员工隐私。但记者实测注意到,监控可做到无提示、无弹窗,被监控对象在无专业技术人员指导的情况下是难以发现的,也无法取证,投诉和维权更无从谈起。所以,普通个人是很难与监控软件抗衡的。4安全专家:软件所用技术与病毒、木马完全相同从技术上看,要做到监控微信等社交软件和前台“无感知”是否有难度?某国内头部杀毒软件安全专家在接受每经记者微信采访时分析称,从技术上看,做到前台“无感知”的难度并不大。通过消息钩子或其他类似的系统接口劫持技术很容易做到对常规监控软件的信息屏蔽,最终达到隐藏自身存在的目的。那么,在被监控的电脑中如何找到该软件?在参与测试的专业技术人员的指导下,每经记者以受控端管理员的身份运行命令行工具,查找受控端电脑的网络连接,通过排查可疑的网络连接情况,根据可疑进程号定位到了该软件的可执行程序文件路径。的确如销售人员所说,该文件夹处于隐藏状态。选择显示隐藏文件夹后,也仅能看到日志,依然无法从中找到运行文件。由于程序正在被运行占用,无法直接删除文件夹和程序文件。使用代码停止进程,计算机蓝屏并自动重启,重启后程序依然运行,控制端仍显示受控端在线。通过Windows系统自带的服务管理禁用该服务开机自启动后,重启程序依然运行。直到通过火绒安全软件禁止程序开机启动并将电脑重启后,控制端才显示受控端下线。不过,由于部分“文件已在Windows资源管理器打开”,依然无法彻底删除文件夹。最终,每经记者多次重启并使用火绒安全软件的文件粉碎功能,才将文件夹彻底删除。从这款软件的运行方式及查找、删除难度上看,其是否与病毒、木马软件具有相同的功能、效果?该软件与病毒、木马软件是否采用了近似的技术?在网络安全领域,一般如何定义这种软件?上述头部杀毒软件的安全专家告诉记者,病毒、木马本身就是软件的一种存在形式,与正常软件的区别只在于使用目的和使用方法。所以,如果这款软件被用来进行恶意的监控或信息窃取,那它就是病毒、木马。其隐藏自身存在和运行的技术与病毒、木马不是“近似”而是完全相同。这类软件一般被认定为远程监控或远程控制类软件,它的存在比较“灰色”。通常来说,如果其开发者有大公司背书且能尽量确保被合法使用,那可以被认定为是带有潜在风险的合法软件。但一旦被滥用或从根本上便“动机不纯”,则会被判定为后门或木马类程序。结合该类文件特性,上述技术人员给出了一份判断电脑是否被监控的“自查指南”。 判断电脑是否被监控的“自查指南”攻略如何停止监控?该技术人员表示,继续输入通过可疑进程号定位该软件可执行程序文件路径的代码,根据输出的文件路径寻找可疑文件夹ipsafe。如果无法找到文件夹,代表文件夹可能被隐藏。此时点击查看,勾选显示隐藏的项目。定位到文件夹后,如显示程序正在运行占用,无法直接删除文件夹。可以通过代码查看父进程,不断重复这一操作,直到父进程变为系统文件service.exe,上一层的p2mon32.exe即为该软件的最外层进程。使用火绒安全软件,从启动项管理中找到该程序,禁止该程序开机启动并重启。最后使用火绒安全软件的文件粉碎功能粉碎文件夹。如显示粉碎失败,可以反复重启粉碎。5律师:监控行为触犯刑法围绕外界关心的监控行为是否合法、员工如何维护权益、软件买卖方应承担何种责任等话题,每经记者咨询了律师、技术人员等专业人士。 律师谈监视员工电脑的行为上述知名律师称,国家法律明确规定了侵犯公民个人信息的法律后果。微信聊天记录等通信内容虽然不能直接等同于公民个人信息,但二者存在交叉。最高人民法院、最高人民检察院《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》(法释〔2017〕10号)明确规定,公民个人信息是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名,身份证件号码,通信通讯联系方式、住址、账号密码、财产状况,行踪轨迹等。微信聊天记录极有可能包含以上内容和信息,监控相关聊天内容的企业可能要承担相应的责任。 监控相关聊天内容的企业可能要承担相应的责任每经记者注意到,《App违法违规收集使用个人信息行为认定方法》对App运营者可被认定为“未公开收集使用规则” “未明示收集使用个人信息的目的、方式和范围”“未经用户同意收集使用个人信息”的行为有清晰界定。 App违法违规收集使用个人信息行为认定方法细节(免责声明:文章内容和数据仅供参考,不构成投资建议。投资者据此操作,风险自担。)策划|蒲付强 李彪记者|张宏 朱恒编辑|何小桃 魏官红 杜恒峰校对|魏文艺|每日经济新闻nbdnews原创文章|未经许可禁止转载、摘编、复制及镜像等使用 -
2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 如何回顾2025年的AI进展?今年王者归来的谷歌,刚刚由Jeff Dean和哈萨比斯牵头,完成了年度总结和趋势展望报告—— 这是AI Agent、推理和科学发现的一年。 报告最后梳理出了八大研究方向,系统性地回答了一个更重要的问题:当大模型进入推理时代,AI 正在变成什么?从Gemini的推理能力、多模态理解,到Agent、机器人、科学研究和物理世界建模,谷歌正在描绘一个可以协作、可以行动、甚至开始参与科学发现的智能系统。 模型的推理、多模态理解、生成能力及效率得到显著提升。 AI已广泛融入谷歌的主要产品中。 2025年创造性AI工具全面提升。 AI在科学和数学领域实现多项成果,尤其是数学和编程竞赛表现优异。 谷歌始终强调安全、责任与合作开放生态。 以下是量子位的原文总结,在不改变原意的基础上,进行了适当修改润色: 谷歌年度回顾全文 回顾2025年,这是研究领域取得非凡进展的一年。在人工智能方面,可以清晰地看到其发展轨迹正从一种工具转变为一种实用手段:从人们使用的东西变成了可以投入工作使用的东西。如果说2024年是为这个时代奠定多模态基础的一年,那么2025年就是人工智能开始真正与人类一同思考、行动和探索世界的一年。在量子计算领域,谷歌也在迈向实际应用方面取得了进展。概括来讲,在各个领域,谷歌都正在助力将研究转化为现实,让功能更强大、更实用的产品和工具对人们的生活产生积极影响。基础模型能力突破首先今年,谷歌在推理、多模态理解、模型效率和生成能力方面均取得了突破性进展,显著提升了模型性能。这一系列进展始于3月份发布的Gemini 2.5,一直到在11月推出了Gemini 3,并于12月推出了Gemini 3 Flash。基于最先进的推理技术,Gemini 3 Pro是谷歌迄今为止最强大的模型,旨在帮助用户将想法变为现实。它在LMArena排行榜上位于榜首,并凭借在人类终极考试以及GPQA Diamond等基准测试中的突破性分数,重新定义了多模态推理。它还为数学领域的前沿模型树立了新标准,在MathArena Apex上创下了23.4%的最新纪录。随后,谷歌推出了Gemini 3 Flash,它融合了Gemini 3的专业级推理能力与Flash级别的延迟、效率和成本优势,使其成为同尺寸下性能最佳的模型。Gemini 3 Flash的质量超越了谷歌之前的Gemini 2.5 Pro规模模型的能力,价格却只有它的一小部分,且延迟显著降低,延续了Gemini时代的趋势——下一代的Flash模型优于上一代的Pro模型。 另外,谷歌今年也致力于通过最先进的开源模型,让实用的AI技术变得更易于获取。谷歌的Gemma系列模型不仅具有轻量级特性,而且开源。在今年,还成功引入了多模态能力,大幅度增加了上下文窗口,拓展了多语言功能,并提升了效率和性能。AI产品的深度集成与创新2025年,谷歌继续推动AI从工具转向实用工具,凭借全新、强大的Agent能力改造现有的产品组合。谷歌重新构想了软件开发,不再局限于辅助编码工具,而是引入能与开发者协作的强大Agent系统,比如Gemini 3高超的编码能力以及Google Antigravity的推出,都标志着AI辅助软件开发迈入了一个新时代。 这一演变同样也在谷歌的核心产品中清晰可见,从Pixel 10上的AI功能、搜索中AI模式的更新,到类似Gemini应用和NotebookLM这类的AI创新产品,而这些产品均增加了深度研究等高级功能。AI赋能创造力2025年也是生成式媒体变革的一年,AI为创意提供了全新且前所未有的能力。用于视频、图像、音频和虚拟世界的生成式媒体模型及工具变得更加高效,应用也更为广泛,其中突破性的Nano Banana和Nano Banana Pro在原生图像生成与编辑方面展现出了前所未有的能力。谷歌还与创意行业人士合作,开发了Flow和Music AI Sandbox等工具,让它们能更好地辅助创意工作流程。同时,谷歌通过谷歌艺术与文化实验室推出全新的AI驱动体验、对Gemini应用中的图像编辑功能进行了重大升级,以及引入Veo 3.1、Imagen 4和Flow等强大的新型生成式媒体模型,为人们拓展了创意可能性。 今年谷歌实验室也进行了一些极具吸引力的实验,包括: Pomelli:AI用于品牌营销内容; Stitch:能在几分钟内将提示词和图像输入转化为复杂用户界面设计和前端代码; Jules:异步编码Agent,可作为开发者的协作伙伴; Google Beam:3D视频通信平台,利用AI拓展了远程在场的可能性。 推动科学与数学发展2025年也是AI科学进步的标志性一年,生命科学、健康、自然科学和数学领域均在AI帮助下取得了诸多进展。这一年里,谷歌在构建AI资源和工具方面取得了进展,这些资源和工具为研究人员赋能,帮助他们在医疗健康领域理解、识别和开发新的治疗手段。在基因组学领域,谷歌已将先进技术应用于研究长达十余年,如今谷歌超越了测序阶段,正在利用AI来解读最复杂的数据。谷歌在今年也纪念了AlphaFold问世的第五周年,这一荣获诺贝尔奖的AI系统解决了困扰学界50年的蛋白质折叠问题。目前它已被190多个国家的300多万名研究人员使用。 而Gemini的高级思考能力,包括Deep Think,也在数学和编程领域取得了历史性进展。Deep Think已经能够理解需要深度抽象推理的问题,并在两项国际竞赛中达到了金牌水平。推进计算和物理世界研究谷歌今年在量子计算、能源和突破性技术等领域也取得了重大发现,并吸引了前所未有的关注。其中量子计算在现实世界应用方面的进展尤为显著,例如Quantum Echoes项目。值得一提的是,谷歌员工Michel Devoret与前谷歌员工John Martinis以及UC伯克利的John Clarke共同获得了2025年诺贝尔物理学奖,以表彰他们在20世纪80年代的基础量子研究。2025年,谷歌继续推进为AI提供动力的核心基础设施,重点关注硬件设计的突破和能源效率的提升,包括推出Ironwood,一款为推理时代打造的新型TPU,它是采用名为AlphaChip的方法设计的,同时谷歌还致力于衡量技术对环境的影响。 谷歌在机器人技术和视觉理解方面的研究,也将AI Agent带入了物理世界和虚拟世界,比如基础性的Gemini Robotics模型、更先进的Gemini Robotics 1.5,以及Genie 3的推出,其中Genie 3成为了通用世界模型的新前沿。 应对全球性挑战与机遇谷歌今年的工作直观展示了AI驱动的科学进步,如何直接应用于解决世界上最关键和普遍存在的挑战。通过利用最先进的基础模型和Agent推理,谷歌极大地加深了对地球及其系统的理解,同时在气候韧性、公共卫生和教育等领域提供了影响力解决方案。例如,谷歌正利用最先进的基础模型和代理推理来帮助加深对地球的理解,涵盖天气预报、城市规划、公共卫生等多个领域。例如,谷歌的洪水预报信息目前已覆盖全球150个国家超20亿人口。而谷歌最先进、最高效的预报模型WeatherNext 2,生成预报的速度能快8倍,且分辨率可达1小时。借助这项技术,谷歌通过实验性的气旋预测,支持气象机构做出有效决策。 谷歌也正在与合作伙伴携手,将AI驱动的科学进展更贴近患者,为疾病管理和疗法研发开辟新途径。此外,AI正被证明是教育领域的一个强大工具,通过LearnLM和Gemini中的引导式学习,它能促成新的理解形式并激发学生更多好奇心。谷歌今年将Gemini最强大的翻译能力引入谷歌翻译,使其能提供更智能、更自然且更准确的翻译,并试点了新的语音互译功能。重视责任与安全谷歌将研究突破与责任和安全相结合。随着模型能力不断增强,谷歌正持续改进和发展旗下的工具、资源及安全框架,以预测并降低风险。Gemini 3就切实展现了这种观念:它是谷歌迄今为止最安全的模型,并且经过了最全面的安全评估。此外,谷歌还在展望更长远的未来,探索通往AGI的负责任之路,将准备工作、主动风险评估以及与更广泛的人工智能社区合作置于优先地位。提供跨界合作与开放生态谷歌认为,要负责任地推进人工智能的前沿领域,需要全社会各方面的协作。2025年,谷歌与顶尖的人工智能实验室合作,成立了Agentic AI基金会,并支持开放标准,以确保Agentic AI拥有一个负责任且具备互操作性的未来。在教育领域,谷歌也与教育机构合作,帮助学生掌握AI技能。并与加州大学伯克利分校、耶鲁大学、芝加哥大学等众多高校研究合作,一起推动前沿研究。此外,谷歌正与多个实验室合作,协同改变科学研究的开展方式。与电影制作人和其他创意开发者合作,为他们提供最优质的AI工具,探索人工智能时代的新的叙事方式。2026年,谷歌希望能够继续安全且负责任地推进前沿技术,为人类谋福祉。参考链接: [1]https://blog.google/technology/ai/2025-research-breakthroughs/ [2]https://x.com/i/trending/2003527758127989012 -
消费新观察 |续费扣款前有无通知?“洪恩识字”APP两种回应存在矛盾 12月21日,津云《消费新观察》栏目报道了消费者投诉购买“洪恩识字”APP会员服务默认自动续费,在不知情的情况下被持续扣款,且扣款前APP无任何提醒的情况。报道刊发后,12月23日,“洪恩识字”APP工作人员向记者做出回应。但针对续费扣款前是否有通知,该工作人员的回复与线上客服的回复相互矛盾。 今年11月,天津市民张先生在查看自己支付宝“花呗”账单时发现,有一笔“洪恩识字”APP的扣款记录,每个月24元,从今年1月份已经扣到了10月份。张先生说,他曾同意自己8岁的孩子开通一个月的会员服务,但并未注意,这项服务是“自动续费”的。 记者调查发现,2021年至今,每年都有用户吐槽开通该APP会员被自动续费,且从来没有收到过任何有关扣款的电话或短信提醒,都是自己发觉后,开始投诉维权。 12月21日,记者联系了“洪恩识字”APP。客服称,“洪恩识字”APP本身没有“连续订阅”和“自动续费”功能,是因为苹果手机用户在支付时使用苹果支付系统导致的,与“洪恩识字”APP无关。记者使用苹果手机尝试开通另外3个主流APP的会员。这3个APP开通会员页面上的选项中,除了有“连续订阅”的选择,也有单月或多月的一次性付费可供用户选择。 为何同样是苹果支付系统,其它APP有不是“连续订阅”“自动续费”的一次性付费选择?“洪恩识字”APP续费扣款前,是否有相关提醒?有用户因自动续费在不知情的情况下扣款,“洪恩识字”都会如何解决?又是否考虑过对自动续费功能进行优化? 针对上述问题,12月23日,“洪恩识字”APP工作人员电话回复了记者。该工作人员称,“洪恩识字”APP也有一次性付费选择,但并不是月卡、季卡和年卡,而是“永久包”。该APP上“识字+子集绘本”月卡会员24元,季卡会员68元,年卡会员198元,而包含同样内容的“永久包”价格则是388元,明显高于月、季、年卡的价格。为何没有给苹果支付系统用户一次性月卡、季卡、年卡的选择,该工作人员表示无权限回答。记者多次询问未来是否会对自动续费进行优化,该工作人员始终没有直接回答。 对于用户不知情的情况下因自动续费被扣款的情况,“洪恩识字”会如何解决?该工作人员称,如果用户对扣款有疑问,他们会有工作人员与客户沟通并了解情况,但具体如何退费、如何解决要视情况而定。 关于“洪恩识字”APP续费扣款前是否有相关提醒,该工作人员称,续费扣款前APP内有弹窗提醒,也有通知提醒,用户需要点击进入后才能查看到。对于为何这么多家长投诉“从未看到过扣款提醒”,工作人员说,因为APP多数时候都是孩子在使用。随后记者登录“洪恩识字”,但除了首页最上方中间有一条不定时出现、点击后无反应、字体偏小的提醒栏外,记者在APP内,并未找到任何提醒消息的列表。 得知续费扣款前APP内有提醒,张先生也打开APP查看,同样没有发现任何提醒列表,随后在询问线上客服时得到的答复是:“苹果会给您的邮箱发送电子收据,邮件中有详细描述”“我们无法每月提醒”。 “我从来没收到过苹果的邮件,线上客服说他们自己根本没提醒。退一步说,即便APP内有提醒,孩子能看懂吗?而且我们不知道自动续费了,后续也不用、不打开APP,怎么去发现续费扣款提醒呢?” 天津律云律师事务所合伙人刘波律师说,商家必须尊重并保障消费者的自主选择权。消费者开通会员时默认自动续费,商家没有取消自动续费选项,涉嫌侵犯了消费者的自主选择权。商家应当在消费者接受服务前和自动展期、自动续费等日期前,以显著方式提请消费者注意。如果商家提醒不够明确和醒目,则算作无效提醒,仍需担责。(津云新闻记者 鲍燕) -
AI竞赛进入“能效“新阶段:前Facebook隐私主管警示千亿美元基建热潮暗藏电网危机 智通财经APP获悉,Facebook前隐私事务主管克里斯・凯利(Chris Kelly)表示,人工智能(AI)行业本轮发展热潮的下一阶段将聚焦于提升技术应用效率。凯利周一表示,当下,全球头部AI企业都在竞相建设支撑AI算力需求的基础设施,AI行业必须优化这类高能耗的基础设施建设模式。他表示:“人类的大脑运转仅需20瓦的能耗,我们推演、思考问题,根本无需千兆瓦级的能源中心来支撑。我认为,如何挖掘效率潜力,将成为头部AI企业的核心探索方向之一。”他补充称,能够在降低数据中心成本方面实现突破的公司,将最终成为AI领域的赢家。据悉,标普全球的统计数据显示,2025年,各大超大规模云计算服务商掀起一轮全球数据中心建设热潮,全年该领域的基础设施相关交易规模已累计超610亿美元。仅OpenAI一家企业,就在未来数年敲定了超1.4万亿美元的AI领域投入计划,其中包括与显卡巨头英伟达(NVDA.US)、基础设施行业龙头甲骨文(ORCL.US)及CoreWeave(CRWV.US)达成的一系列重磅合作。然而,这场如火如荼的数据中心建设潮,也让外界的担忧日益加剧——本就承压的电网系统,该如何为这些算力基建提供充足的电力支撑。英伟达与OpenAI曾在今年9月联合官宣一项合作计划,涉及的算力基建规模至少需要10千兆瓦的供电量,这一耗电量约等于800万户美国家庭的年度总用电量。纽约独立系统运营商的数据显示,这10千兆瓦的用电量,也与纽约市2024年夏季用电高峰期的总需求量基本持平。在DeepSeek于2024年12月推出一款免费、开源的大语言模型之后,AI行业对成本方面的关注和担忧进一步加剧。DeepSeek称,该模型的开发成本不到600万美元,远低于美国竞争对手。凯利表示,他预计将看到“多家中国企业崭露头角”,尤其是在美国总统特朗普近期批准向中国出售英伟达H200芯片之后。凯利补充称,开源模型——尤其是来自中国的开源模型——将为人们提供“基础级别的算力”,以及生成式和代理型(agentic)AI的使用能力。 -
钉钉疯人院,跑出三个爆款 “产品创新,如何做到与上个时代彻底告别?”作者丨林觉民 徐晓飞编辑丨王亚峰 “不是精英改变世界,是脚踏实地的精英才能改变世界。”12月23日上午,AI钉钉1.1发布会正式开始之前,灯光暗下去,无招在开场片结尾,说了这么一句话。他不止是说给观众听的,更是说给自己听的。回归阿里半年,无招调集十亿级资源做钉钉AI改造,决心和魄力可见一斑。他转过身来,开始发布钉钉AI 1.1版本。与四个月前的1.0版本相比,AI钉钉1.1不仅跑出了“DingTalk A1、AI表格、AI听记”三款爆品,还发布了全球首个为AI打造的工作智能操作系统——Agent OS,并对ONE、DingTalkReal、搜问、表格、听记、A1等一系列AI产品进行了又一次“爆改”。通过爆改,钉钉彻底告别上个移动互联网时代,真正步入AI原生时代。以前那个“钉钉疯人院”,又回来了。“钉钉疯人院”是外界对钉钉团队的一种戏称,源于其创始人无招倡导的极致创新和近乎偏执的产品追求精神。这种文化强调“Be Crazy”的态度,即鼓励团队成员以偏执的热情与极致的产品追求投入产品创新。早期的钉钉正是通过这种文化打造了其在企业服务市场的竞争力。在今天AI时代,从无招的回归与前后时隔4个月的两次产品发布会透出的信息看,这种文化似乎再次回来了,并且他们似乎是要干掉过去那个钉钉。钉钉为何彻底推翻过去?三款爆品为什么能跑出来?01 阿里首个卖爆的AI硬件:DingTalk A1 2025年是各类AI硬件大火之年,但这些AI硬件在落地性、实用性上都面临不少问题。对比起来,钉钉录音卡片DingTalk A1反而是那个乍看起来不起眼,但用起来让人直呼惊艳的产品。这款产品发布于8月底,没多久便在抖音、天猫等多个数码榜单上成为销量榜首,把一批新老玩家都甩在了身后,一举成为录音笔品类里的黑马,也成为AI时代阿里最成功的硬件之一。DingTalk A1为何能成为爆品?首先是它的产品定义,它没有盲目创新,而是先精准抓取并解决用户的需求。DingTalk A1 的产品主理人与无招结识于无招创业期间,当时对方就职于国内工业设计 No.1 的洛可可——单看工业设计能力,可以说是国内最顶尖的一档。当时无招用对中国工业供应链和产品创新的洞察打动了他。2025 年 4 月,无招回归钉钉后要做硬件,便召集正在独立创业的他加入。他们从一开始思路就非常清晰,他们的产品定义并不是要做录音笔,而是要用一款已经经过验证的超级AI硬件,深度绑定钉钉,促活钉钉的生态。这样说还是有点虚,我们站在马后炮角度来看一眼,就会比较明确了。钉钉A1发布后,迅速霸榜各平台销售榜首,不少人说它是对海外大火的录音卡片做模仿,这就是典型的外行思维。工业产品的创新,本来就是以微创新驱动为主,想搞颠覆式创新工业产品,这是不符合商业规律的。即便是海外那款录音卡,也不是拍脑袋发明出来的,也还是有原型产品。在硬件创新这件事上,大家的竞争点在于,能不能发挥自己独特的优势,把产品的优势放大,把用户的零碎需求丝滑解决。无招从硬件创新创业的身份,再次转换成服务商,他对痛点的理解力显然加深了。因此,无招4月回到钉钉后,第一件事就是带着团队跑遍全国见客户——在他看来,只有足够了解客户了,才能有精准的用户洞察,才能做出好的产品。他完全是一副重做一款产品的架势。一夜间,钉钉回到了创业状态。DingTalk A1负责人在做产品定义之前,带着团队在网上爬了几万条对录音卡片的评论,筛选和总结了许多痛点。比如,他们发现用户吐槽最多的就是专用接口带来的不便,于是他们改用通用Type-C接口,光这一点就得到了广泛用户好评。再比如,他们发现客户吐槽买了硬件,结果每月只能用200分钟免费转录,钉钉A1便每个月会送给用户1000分钟的免费转录,叠加钉钉自带的每月300分钟免费额度,一共是每月1300分钟的免费转录时长,对绝大多数办公人士来说完全够用。要知道,市面上不少录音卡片是靠采购第三方大模型做转写,在准确率上参差不齐,为了优化用户阅读体感,不少产品会采取这样的策略:优先把文本做通顺好读,反而牺牲了精准度。这显然不能完全满足用户的需求。真正解决用户痛点的产品,不应在各种权衡中顾此失彼,这才是对产品的极致追求,不过这背后需要真金白银的大手笔投入。无招回归不到半年,钉钉就砸了几十亿元的资源来升级语音识别系统,把原来的靠语法规则驱动的语音识别框架,升级为Transformer架构。就连每种方言都单独训练,单项方言的训练成本就高达几千万人民币。为什么敢做这样的几乎是另起炉灶的决策?这要回到无招回归钉钉后的一个理念:用AI逻辑重塑钉钉,做真AI原生的工作方式。钉钉早就算好了这笔账:A1 背靠阿里千问自研大模型,前期研发投入虽高,但随着用户规模扩大、规模效应显现,固定成本会逐步分摊,边际成本将大幅降低。长期来看,不仅投入可控,还能把后续用户订阅费做到远低于行业平均水平。这也是为什么A1的售价、后续会员费以及分钟Token的价格,都远低于市面上其他依赖采购第三方大模型的同类产品。调研、服务、砸钱、决心……一套组合拳下来,A1成了AI时代阿里最成功的硬件之一。02 重做一遍的AI 听记:虽是毫末技艺,却是顶上工夫 无招在演讲中,唯一一次问“怎么没有掌声”是随口说这个产品演示时——蒙牛牧民用语音填表,表单上语音转换准确率100%。无招忍不住,又重新播放了一次PPT,这下全场人都笑着掌声如雷,所有人都反应过来了。的确,语音识别太准确,太丝滑,以至于用户之前到了无感的程度。无招感叹的说了一句,“虽是毫末技艺,却是顶上工夫”。据雷峰网所知,作为 A1 的核心协同工具,AI 听记(原钉钉闪记)在无招回归后也迎来彻底重构,几乎相当于另起炉灶重做了一遍。无招今年4月回来后,发现钉钉闪记和市面上不少传统语音公司一样,靠规则框架识别语音,准确率只有80%多。当时团队曾探讨要不要继续在旧框架的基础上做优化,更节省成本,但无招坚持从头搭建了语音大模型,不仅采购了海量语料,还从集团调用大量服务器,前后花了十几亿。最近钉钉 AI 听记的口碑直线上升,这背后是团队花了半年时间,整合了阿里云和夸克的力量,投入了一亿小时的训练,这半年的训练成本,不算 GPU,仅其他费用就达几十亿。巨大的投入下,钉钉听记现在的准确率能达到97%-98%。AI听记的负责人是十年前钉钉创业时的班底成员,在无招“重做”钉钉的过程中,在他和团队的执行下,钉钉听记不仅在准确率上走在市场前列,而且在和用户共创打磨产品的过程中,还增加了不少“体验亮点”,比如带时间戳的一键摘取功能,让录音整理变得特别方便。这些扎实的性能与实用的细节,让AI 听记一时间吸粉不少。而钉钉庞大的用户规模,又为听记持续带来海量的使用数据与语料,进一步反哺和优化模型,一个不断自我增强的产品闭环正在形成。03 AI表格的后发先至 无招带领的钉钉现在创业感特别强,各线产品负责人都有一种信念感。AI表格,是无招回归后第一个明确投入的产品,这种战略明确也驱动AI表格团队保持着“每天小迭代、3 周一个大迭代”的节奏。从钉钉内部看,大量资源被投入到表格的整体改造和能力增强上,比如数据源接入、自动化平台建设这些基础能力,以及更为重要的AI能力建设与千万行实时计算架构的改造。AI表格为何如此受重视?之前协同办公软件的战场都集中在会议、文档、聊天,今年却扎堆主打表格,这是为何?究其原因在于,文档、聊天,会议等功能都更偏C端,而表格更贴近B端、生产端,可以说表格才是中小企业主决定用不用一款协同软件的关键。一张表格能平替大部分常用SaaS,哪怕其他功能一般,只要表格做得好,企业就愿意用。无招回归前,钉钉的“多维表”只有很少的几个人在负责。他回来后决定改名叫“AI表格”。起初,团队担心用户听不懂,毕竟“多维表”在当时办公行业已经形成了惯常叫法,但无招觉得“钉钉不需要做一个多维表,我需要你们做的是AI时代的Excel,AI时代创造AI应用的基础”。这是在抢占AI时代的用户心智——在AI时代的工作中,表格到底应该起到什么作用?正如发布会上无招所说,统治了数字化时代40年的超级产品其实是Excel,这是一个非常伟大的产品。90%以上的应用都是Excel开发的。但Excel毕竟是起源于1985年的产品,虽然迭代在持续,但问题越来越多。他们希望用AI表格,让全球所有的Excel的应用进入AI时代。这就是AI表格的定位:AI时代的应用搭建平台。而且他还认为,AI表格不仅能对外抓住用户的认知,也能对内激励着团队做真正的AI原生产品。于是,团队集中火力,全力攻坚,同时借力阿里原有的数据库优势,仅用4个多月就把AI表格做了起来。该产品 7 月发布,重新定义了 AI 时代的表格工具,随后快速追平同类产品核心能力,成为在业内首个真实落地单表千万行、首个实现真实可用的表格 AI……基本上是按照三周一个版本的速度和频率在迭代。表格类产品很容易陷入产品做得花哨,但是普通人根本没法上手的自嗨局面,AI表格负责人决心打破隔膜。早期做内部测试时,AI表格团队先找了阿里巴巴园区里的保洁阿姨、保安大叔等中老年人试用,确认他们能无障碍使用后,才推向客户。最终这个功能在制造业、农业生产中被广泛使用,收获了巨大好评。在12月23日的发布会上,钉钉 AI 表格又新增了 “随口说” 语音交互、“万能贴” 数据整理功能,升级仪表盘并推出 “AI 应用” 模式,同时优化底层性能与权限管理……表格作为驱动业务的智能引擎的想象力正在显现。AI时代的应用搭建平台——AI表格的这一定位在AI钉钉1.1发布后,开始被人所理解。04 什么是迈入AI时代的决心? 乔布斯曾言:“创新区分了领导者和追随者。” 产品创新无疑是难的,这种难不仅体现在技术上,还体现在你要比别人看得更远,敢下更大的决心。像钉钉这种曾经定义了云与移动时代的工作方式,有着7亿多用户量级的产品,在进入AI时代后,推翻过去,重启产品创新,其背后的用意远不止产品迭代本身这么简单。一个管中窥豹的小例子是,A1 这款产品背面有两个按键,一个控制录音,另一个是 AI 键。阿里近些年有个战略,靠硬件提升软件的不可替代性,比如支付宝的线下“碰一碰”硬件就是如此,而A1也在发挥着这一作用,通过外接硬件搭配手机使用,撬动用户用钉钉。但其实远不止如此。A1 的核心作用不是录音笔,而是给钉钉在手机上增设的 AI 键,通过它来连接物理世界的声音与信息。据说早在与无招探讨初始概念时,钉钉团队便明确了这枚 AI 键的定位,他们预判未来物理世界会涌现大量 AI 入口,且所有硬件都将配备这类物理语音输入接口,因此早早预留了该接口。目前这枚 AI 键仍处于过渡阶段,仅实现语音备忘基础功能,至于核心 AI 功能的落地,钉钉方面透露,团队这几个月来,正在系统梳理 Agent 相关底层驱动逻辑,待技术落地后,届时按住这枚AI键语音输入,即可在钉钉内直接获取对应结果。这种打通底层,一键调用各个Agent的能力,本质上是Agent OS 逻辑的落地。不难看出,钉钉正在从单品爆款和操作系统两个层面,实现一个AgentOS生态闭环。事实上,在历次时代变革下,真正的产品创新,都不是单点技术的突破,而是系统级、产业级的,甚至是牵一发动全身的生态共振。从单个技术、单品落地,到系统重构,再到产业链升级,这是每个新时代到来后,生产力变革的逻辑链条。这背后有一条被历史反复验证的规律:爆款产品,向来都是产业链变革的“点火器”。上世纪80年代的IBM PC,靠开放架构打开兼容机市场,不仅自己成了行业标杆,还顺带把英特尔、微软这些上下游伙伴推上风口,奠定了个人计算机时代的生产力格局。而2007年iPhone的出现,更是把触摸屏、移动芯片、移动互联网服务这些零散技术捏到一起,重塑了消费电子的供应链逻辑,催生了App生态这个全新产业,彻底改变了人们的工作生活方式。如今,钉钉在 AI 时代的创新布局,正延续着这条产业变革的逻辑。至于它能否成为产业链协同的“枢纽”,将AI技术、硬件制造和办公场景深度绑定,推动全球办公产业的AI变革,尚未有定论,但显然它已然走在了这条路上。05 AI之下,能“自我革命”的产品,才能活下来 不得不说,今天办公的AI革命已经从一个“选择项”变成了一道“必答题”。因为办公工具的每一次迭代从来都不是偶然,而是当生产力发展到临界点,旧工具难以承载新需求时,新革命便会如期而至。从PC时代打破“手工作坊”的Office三件套,到移动互联网时代突破时空壁垒的协同平台,工具形态在变,但核心逻辑始终未改:把人从低效重复的劳动中解放出来。如今,这一使命给到了AI时代的创新者们。但真正的破局,从来不是浮于表层的+AI,而是从底层架构到产品形态的彻底重构。这也正是钉钉们所践行的:重新回归创新,不惜推翻过去,“杀死”自己,也要走向真正的AI原生。而这一切的核心目的早已写在工具进化的基因里:让技术真正服务于人,让每个普通人都能掌控AI时代的生产力,这正是办公产品AI革命的终极答案。 -
美媒炒作:五角大楼和AI巨头的共同软肋,绕不开中国电池 【文/观察者网 柳白】“五角大楼与人工智能(AI)巨头的共同软肋:都极度依赖中国电池”——《纽约时报》12月23日以此为题发文,再炒中美技术竞争话题。 这篇文章渲染说,中国在锂电池领域的绝对主导地位,已对美国人工智能产业和国防安全构成双重挑战。美国自身面临产业补贴不足、环保成本高、技术积累薄弱等障碍,要摆脱对华依赖可能需耗时五年以上,尤其是特朗普政府政策自相矛盾,一方面说要扶持电池产业,另一边却大肆打压电动汽车,而这正是电池最大的需求来源。 “无论技术还是规模,中国遥遥领先” 作者认为,乌克兰战场正在重塑现代战争形态,硅谷则全力竞逐以维持其人工智能领先地位,而中国在电池领域的主导优势引发的“恐慌”,早已超出汽车行业范畴。 在美国弗吉尼亚州北部的“数据中心走廊”,一座座如飞机库般宏伟的无窗建筑,正为美国的人工智能产业提供动力支撑,该产业正陷入与中国的激烈竞争之中。 然而,这些数据中心却越来越依赖美国的地缘政治对手中国提供的关键技术——电池。 这类设施的耗电量堪比一座小型城市,给当地电网带来巨大压力。哪怕是微小的电压波动,都可能引发连锁反应,破坏敏感的人工智能计算机编码。 为应对这一问题,美国科技巨头们计划斥资数十亿美元采购大型锂离子电池。斯坦福大学胡佛研究所的中国科技领域专家王丹(Dan Wang,音译)说:“中国在锂电池几乎所有工业组件领域都处于领先地位,无论是技术层面还是规模层面,他们都遥遥领先。” 这些数据中心不远处便是五角大楼,那里的军方官员也发出了类似的警告,只是原因不同。军事战略家目睹乌克兰战场正在重塑现代战争,称美军将需要数百万块电池为无人机、激光武器及无数未来武器供能。 而这些电池中,许多同样产自中国。 9月28日,湖北宜昌,楚能新能源(宜昌)锂电池产业园工人在生产车间装配储能集装箱。 视觉中国 文章渲染,长期以来,中国在电池领域的主导地位一直被视作汽车制造等行业的“难题”,如今日益被西方视为所谓“国家安全威胁”。据国防分析公司戈维尼的数据,目前美军武器项目中约有6000种独立电池组件依赖中国供应链。 戈维尼首席执行官塔拉・墨菲・多尔蒂在加利福尼亚州最近一次顶尖国防与工业官员会议上表示:“现实极为严峻,我们所有武器系统和军事平台中100%都含有外国部件。” 今年10月,中国对部分最先进锂离子电池技术的出口实施了限制,旨在维护国家安全和履行国际防扩散义务。这些措施主要针对高性能电池、关键材料及制造设备。外界认为,这是为了反击美国贸易霸凌。 特朗普政府正陷入两难境地。 特朗普就任总统后,其政府最初冻结了拜登时期数十亿美元的电池制造联邦补贴,将电池与电动汽车、太阳能电站、风力涡轮机及其他清洁能源技术归为一类,而这些技术正是特朗普一直试图忽略的领域。他对电动汽车嗤之以鼻,称其为一场“骗局”。 但近期,特朗普政府逐渐意识到,电池技术对于其高度关注的人工智能和国防等诸多领域至关重要。 十几位电池行业高管、游说者、军事专家及其他与政府关系密切的人士在接受采访时表示,白宫对培育不依赖中国的本土电池产业的兴趣日益浓厚。 据三位知情人士透露,白宫近几周就电池供应链问题召开了高层会议。特朗普设立的“国家能源主导委员会”负责协调能源政策,该委员会也已与电池企业举行会谈。美国能源部悄悄批准了拜登时期多项针对电池制造商的补贴申请,并于近期宣布为电池材料及回收项目提供高达5亿美元的资金支持。 特朗普政府已开始投资研发电池组件或关键矿产的企业,包括下一代电池企业伊奥斯公司。 作为一项贸易协议的一部分,官员们促使日本承诺向美国电池制造业投资数十亿美元。本月通过的《国防授权法案》规定,五角大楼限制从“受关注外国实体”(主要是中国)采购电池。 美国行业协会“电池技术转型倡导联盟”执行董事兼联合创始人萨姆·吉拉德称:“政府的态度很明确——我们不看好电动汽车,但确实需要电池为无人机、数据中心和人工智能提供动力。他们逐渐认识到,中国对电池供应链的掌控有损美国的国家安全。” 白宫发言人泰勒·罗杰斯表示,特朗普总统正“调动政府各部门密切协作,确保美国在关键矿产和电池生产领域占据全球领先地位。” 摆脱对华依赖,“至少得五年” 不过专家分析指出,打造不依赖中国的电池产业难度极大。中国在磷酸铁锂电池领域占据主导地位,这类电池是电动汽车和储能领域的首选。国际能源署数据显示,2024年中国生产了全球99%的磷酸铁锂电池电芯,以及超过90%的电池核心组件。这种主导地位延伸至锂、石墨等原材料的精炼,以及驱动电池内部电子运动的阴极、阳极等基础组件。 美国虽拥有锂矿资源和电池初创企业,但专家认为需协同努力和政府支持才能与中国企业竞争。关键矿物精炼可能涉及危险工序,美国环保标准可能导致成本远高于中国。 分析师估计,美国制造商至少需五年才能生产足够的磷酸铁锂电池满足国内需求,而建立底层组件供应链则需要更长时间。 美国得克萨斯州电池储能设施 视觉中国 国际能源署署长法提赫·比罗尔将世界对中国的依赖比作欧洲对俄罗斯天然气的依赖。他称,“战略商品或技术依赖单一国家、单一贸易路线始终存在风险”。 文章称,这种困境反映了人工智能竞赛的转向:胜负越来越取决于国家的电力基础设施——即能否可靠输送大量电力给高耗能数据中心,其重要性不亚于计算芯片。 人工智能巨头OpenAI在10月的一封信中曾称:“电力不仅是公用事业,更是战略资产,将确保我们在电力发明以来最具影响力的技术上保持领导地位。” 胡佛研究所专家王丹表示,电池主导地位是中国在发电领域(包括可再生能源)整体领先的重要部分。 尽管人工智能专家认为美国企业在计算能力上仍占优势,但越来越多人担忧中国在能源基础设施方面的优势可能助其超越美国。 美国能源部长克里斯·赖特9月将人工智能比作“曼哈顿计划2.0”,警告若“中国在人工智能领域上大幅领先,那么美国将沦为地球上的次要国家”。 文章提到,数据中心工程师追求“五个九”的可靠性标准,即保证设施99.999%的时间在线。这需要稳定电力。科技巨头争相获取天然气或现有核电站的全天候供电,并押注小型反应堆、先进地热电站等新兴技术。 数据中心工程公司Burns & McDonnell高管贾斯汀·格鲁茨纳坦言:“能拿到什么就用什么。” 这种背景下,电池的重要性日益凸显。 多数数据中心依赖电池备份。断电时电池可即时供电,为天然气或柴油发电机启动争取时间,防止数据丢失。电力研究机构估计,单次人工智能查询耗电量约为传统互联网搜索的10倍,且巨大算力会导致能源需求剧烈波动。 数据中心咨询机构Uptime Institute首席技术官克里斯·布朗指出,电力“每分钟可能剧烈波动多次”。微软研究人员警告,大规模波动可达数十或数百兆瓦,甚至损坏电网基础设施。轻微干扰都可能导致“静默数据损坏”——即AI硬件产生计算错误的新隐患。 相关论文作者杰弗里·J·马透露,在一次实验中,“静默数据损坏错误直接导致模型崩溃”。 眼下,中国主导的锂离子电池应用正愈发广泛。今年2月,谷歌称其数据中心已安装超过1亿个电池电芯,并开始用电池取代柴油发电机。微软表示,计划到2030年让数据中心不再使用柴油作为备用能源,以实现环保目标。 “芯片是大脑,电池是心脏” 另外,从乌克兰的残酷战事中,人们得出一个令人警醒的认识:未来军事力量的核心在于电池。 许多战场无人机依靠锂离子电池供电,而这些电池的材料和技术均来自中国。国防分析师称,中国的出口管制已导致乌克兰部分组件生产放缓,价格飙升至三倍。 专注于军事技术研究的蛇岛研究所国防专家卡塔琳娜·布哈茨基表示:“2022年以来,中国的每一项出口管制措施都直接影响到战场。美国很快也将面临同样的问题,乌克兰难以获取的这类组件,广泛应用于西方各类国防项目之中。” 激光武器、手持电台、夜视仪、卫星和无人机均需先进电池供电。普通士兵执行一次72小时标准巡逻任务,携带的电池重量可达25磅(约11.3公斤)。 特朗普政府第一任期内负责工业政策的国防部副部长助理杰弗里·纳达纳表示,随着武器装备向隐形化、无人化、电子战和小型卫星星座方向发展,电池需求激增。他称,扶持美国电池产业的重要性,堪比“阿波罗登月计划”。 五角大楼正对此高度关注。2025年《国防授权法案》要求制定新的电池战略,美国国防后勤局在今年发布的一份白皮书中称,应将电池技术视为关键任务保障技术。 民主国防基金会地缘政治风险与供应链安全专家伊莱恩·K·德曾斯基表示:“若论未来制造业与国防安全,芯片是大脑,电池则是心脏。” 2024年,初创企业Group14获得拜登政府2亿美元补贴,用于在华盛顿州摩西湖建造工厂,生产石墨替代品,石墨是电池的关键材料。但特朗普上任后,该企业的补贴因政府冻结清洁能源资金而被搁置。 Group14首席执行官里克·卢贝称,经过全面评估,能源部批准了多项电池补贴申请,“因为政府意识到,这无关左翼与右翼的分歧,也与环保与否无关。” 不过他也指出,集团建造的工厂仅能替代一小部分中国材料。要与中国竞争,美国政府还需加大投入。“我看到政府对电池项目的接受度有所提高,但并未看到实质性的投资。” 其他电池企业也注意到政府态度的转变。获联邦支持开发亚利桑那州锰矿(关键电池材料)的South32公司对外事务负责人朱迪·布朗说:“拜登政府青睐我们的可持续性叙事,特朗普政府则看重国家安全故事。” 专家提出一个关键问题:即便电动汽车销量因特朗普政策而下滑,美国能否维持本土电池产业的发展?专家指出,核心问题在于:如果特朗普政策导致电动汽车销量放缓,美国还能否维持本土电池产业? 卡内基国际和平基金会可持续发展与地缘政治专家诺亚·戈登直言,特朗普官员“对电池的态度已软化,但由于对电动车的敌意,政策仍缺乏连贯性”。 “他们试图推动电池制造,同时却在破坏最大的需求来源——电动汽车”。他说。 本文系观察者网独家稿件,未经授权,不得转载。 -
这一次,快手变“快播”了 昨晚,快手直播“爆”了。不是爆单,是爆出了满屏的“黄色”。大量的快手直播间,直接上演了不该播的“黄色内容”。有些女主播直接露出了隐私部位,在那儿搔首弄姿,直播观看人数蹭蹭上涨。快手反应很快,立马甩锅:这是黑灰产恶意攻击。但有意思的是,相信的人并不多。事件一出,资本市场反应很快:今天快手股价一度大跌近6%,市值蒸发164亿港元。但魔幻的是,今天快手App冲上了苹果商店免费榜第二。疑似某应用市场,一夜间多了400多万的“回归用户”。 网友都乐了:这波操作,是不是年底业绩没完成,自己导演的“黑红”流量闹剧?但说实话,在我看来,快手这回最惨的根本不是“涉黄”。而是当它“黄”了的时候,大家居然都觉得:哦,这很“快手”。这才是快手最大的悲哀。 快手变“快播”,深夜里的“黄色狂欢”昨晚的快手直播间,直接换了“频道”。某些直播间,标题含蓄,内容狂野。女主播们不再满足于“老铁666”,而是玩起了“尺度无上限”—隐私部位要么若隐若现,要么直接暴露,观看人数却火箭般飙升,轻松突破十万大关。评论区成了垃圾场,污言秽语刷屏,但就是没人离场。大家都在等,等下一个更刺激的画面。更“聪明”的主播,则玩起了教科书式的流量欺诈。她们穿着清凉,对着镜头喊:“礼物刷到XXX,我就脱!”火箭、跑车刷起来,屏幕被礼物特效淹没。这是赤裸裸的挑逗:用承诺换礼物,用动作换停留,用擦边换流量。几十万观众被吊得心急火燎,数据却好看到让算法都脸红。这哪里是直播?分明是一场精心设计的、心照不宣的“黄色狂欢”。猎物是观众的猎奇心与欲望,而猎人,就是那些深谙平台流量规则的主播。这些主播疯了吗?图什么?就图流量这剂互联网春药。在算法世界里,数据是唯一的硬通货。停留时长、互动率、礼物价值……这些冰冷数字,直接决定你的直播间能获得多少推荐。 于是,底线成了可以随意践踏的红线。道德和节操,在真金白银的礼物和肉眼可见的粉丝增长面前,被赤裸裸地丢掉。他们可能算了一笔肮脏却现实的账:正常直播,累死累活一天,可能不如这“黄金一小时”。打软色情的擦边球有风险,但直接“涉黄”,流量来得更快、更猛、更直接。这是一场高风险高回报的赌博。赌的是平台审核的反应速度,赌的是自己能在被封禁前捞够本。至于法律?至于社会影响?对不起,在流量的迷魂汤里,他们选择性地失明了。这场闹剧里,你真以为有完全的无辜者吗?主播在搏出位,用低劣方式吸引眼球;观众在找刺激,在匿名的庇护下释放着暗处的欲望;而快手平台(哪怕事后声称是被攻击),至少在那一刻,收获了恐怖的活跃数据、用户停留和互动热度。三方在这个灰色的欲望地带,达成了一次短暂的“共赢”——主播赚了礼物和关注,观众满足了窥私欲,平台拿到了热度。看,多么完美的闭环。但这个“赢”,是建立在流沙之上的幻象。它透支的是平台的公信力,腐蚀的是社区的内容生态,挑战的是法律和公序良俗的底线。当一座大厦的地基开始被蝼蚁蛀空,表面的繁华,还能支撑多久? “顶风作案”的快手?这事最讽刺的一点在于,快手精准地撞在了枪口上。这几天,全网都在热议新修订的《治安管理处罚法》中细化的第八十条。简单说就是,2026年1月1日起,利用网络传播淫秽信息,不管你是公开群还是私聊,证据确凿就面临10到15天拘留,外加罚款。普法文章铺天盖地,苦口婆心地告诫大家:微信私发小视频都可能踩雷,务必洁身自好。结果,法律的余音还在绕梁,快手就用一场几十万人围观的公开“顶风作案”,上演了一出魔幻现实主义大戏。 这不是疏忽,这是系统性失灵。几万、几十万人的直播间,成了法外之地,审核机制仿佛集体离线,这简直就是漠视刚树立的法律权威。有人可能会洗:这是偶然事件,是黑产太狡猾。但快手“顶风作案”不是一天两天了。就在三个月前,国家刚刚敲打过快手。今年9月,国家网信办约谈快手,通报批评的原话是:“在热搜榜单主榜扎堆呈现炒作明星个人动态和琐事类词条,存在泛娱乐化倾向。”这是非常严肃的官方预警,一记对准内容生态核心的警钟。有网友就吐槽,自己本来是快手的忠实用户,但近些年平台内容越来越low了,热搜榜像个八卦小报,全是明星绯闻和鸡毛蒜皮,已经卸载了。快手当年靠什么起家?“记录真实生活”。最早那批“老铁”为什么爱用快手?因为能看到天南地北普通人真实的烟火气,那种粗糙而蓬勃的生命力。可现在快手的推荐和热搜是什么画风?“XX明星疑似恋情曝光”“XX网红离婚内幕”“XX剧集穿帮镜头”……活脱脱一个数字时代的地摊文学合集。从“记录真实”滑向“娱乐至死”,无非是流量思维在作祟——什么内容门槛低、易冲突、能挑起情绪、吸引眼球,就拼命推什么。网信办那记响亮的耳光,显然没打醒装睡的人。内容治理的松懈,价值观的跑偏,为这次的“涉黄狂欢”埋下了伏笔。泛娱乐化是毒,色情低俗是剧毒,两者一脉相承,都是流量鸦片。这次事件,也彻底扒下了快手审核机制的底裤。不外乎两种可能:要么,技术层面存在巨大漏洞。所谓的AI识别、关键词过滤、图像监测,在黑灰产面前不堪一击,让人家如入无人之境。如果真是这样,那快手的技术能力和安全投入,得打上一个大大的问号。要么,是策略层面的“选择性失明”,这更可怕。在深夜流量低谷时段,为了维持平台活跃数据,审核标准被有意无意地放松了。对于某些能带来巨大流量的“灰色内容”,采取了“睁一只眼闭一只眼”的暧昧态度。无论是哪种,结论都一样:快手的内部风控体系,在关键时刻掉了链子。一个连最基本的内容安全和法律红线都无法筑牢的平台,就像一艘到处漏水的船。你可以用流量数据把船身装饰得金碧辉煌,但当浪头打来,沉没只在顷刻之间。 快手最大的悲哀:“黄”得毫不意外快手这次真正的、伤及骨髓的危机,不是一次内容违规事件,而是品牌形象被打回原形。当“快手涉黄”的新闻爆出,很多人的第一反应是什么?是震惊吗?是难以置信吗?并不是。是“啊?快手不一直这样吗?” 是“果然,快手还是那个快手。” 甚至伴随着一种“我早就知道”的调侃和戏谑。经过多年的市场洗礼,在很多用户的认知里,“低俗”“混乱”“草莽”“为了流量不择手段”这些标签,已经焊死在了快手的品牌形象上。这就像一个人,平时邋里邋遢、言行粗鄙,突然有一天被人指责不讲卫生。他会委屈,但周围所有人都会觉得:这难道不是你的日常吗? 快手的悲哀就在于此。它曾经引以为傲的“草根”气息,在一次次对低质内容的妥协和流量追逐中,异化成了“低质”的代名词。用户认知的沉没成本太高了,高到一次危机公关,根本无法扭转。“老铁文化”曾是快手最坚固的护城河,是那种“双击666”背后朴素的情感连接。但如今,在部分直播间和内容生态里,“老铁”这个词变质了。它成了主播索要礼物的口头禅(“老铁们刷个火箭”),成了低俗内容生产者与消费者之间的灰色默契(“都是老铁,懂的都懂”),甚至成了平台在面对低质内容争议时,一块欲盖弥彰的遮羞布(“这是我们老铁社区的特色”)。早期的老铁文化,内核是“看见与被看见”的真实与平等。现在的某些“老铁”文化,内核是“放纵与迎合”的流量与欲望。当一种文化最核心的凝聚力开始腐烂,它所构筑的社区大厦离崩塌也就不远了。用户因为“真实”而来,却最终因“低俗”而留(或走),这是对一个内容平台最大的讽刺。快手成于流量,也正在被流量反噬。流量这剂药,短期内能让平台的肌肉膨胀,数据狂飙,但副作用是摧毁健康的肌体,结果就是:引来了蝗虫般的黑灰产,它们嗅觉敏锐,专钻平台漏洞;赶走了注重内容质量和长期价值的创作者,良币被劣币驱逐;陷入了“越Low越有流量,越有流量越要推Low”的恶性死亡螺旋。快手的这次“涉黄”事件在警示所有人:当一个平台将流量作为最高乃至唯一的信仰时,它就离背叛用户、触犯法律、最终被反噬不远了。 结语所以,别再轻描淡写地把快手这事定性为“黑产攻击”或“偶然事故”。这是一次积弊已久的总爆发。是平台价值观长期摇摆、审核机制长期失效、品牌形象长期受损的结果。快手要解决的,远不止一次舆情危机。它需要一场真正的、痛彻骨髓的“刮骨疗毒”,并且必须回答那个最根本的问题:你到底要成为一个记录时代真实的平台,还是一个在流量泥潭里打滚的狂欢之地?这个答案,决定了它的生死。否则,下次再“黄”,可能就真的“黄”了。 -
李彦宏急了,百度大变天 广告下滑、季度亏损,李彦宏亲自操刀,重整百度。 文|《中国企业家》记者 赵东山见习记者孙欣编辑|何伊凡见习编辑|李原头图摄影|邓攀在发布差强人意的三季度财报后,百度创始人李彦宏着急了,开始密集在AI上落子。12⽉初,媒体曝出:百度旗下AI芯片“昆仑芯”计划最早于2026年一季度,向港交所递交上市申请。昆仑芯最新一轮融资后,估值约210亿元(约30亿美元)。该消息刺激百度港股当日股价上涨3.45%。更早时间,百度更已重新调整AI团队的组织框架。11月25日,百度在负责文心大模型研发的技术中台部门(TPG)中,新设立了两个模型研发部:基础模型研发部由集团副总裁吴甜负责;应用模型研发部由贾磊负责,两个部门均直接向李彦宏汇报。此前,百度的大模型研发总负责人为CTO王海峰。此次王海峰虽然职务不变,但汇报层级的调整,意味着李彦宏已将更朝向应用落地、商业化的干将推上前线。同时,百度C端应用“文心”App也悄然换帅,原负责人薛苏转岗。根据Aicpb.com数据,2025年9月,百度“文心”App月活用户为1077万,远低于字节跳动豆包的1.5亿,也不及DeepSeek的7340万。12月22日,百度移动生态事业群组(MEG)开启了新一轮组织架构调整。将所有PC端与移动端的搜索业务集中调度,围绕“搜推大融合”整合资源,百度APP总经理李小婉负责用户侧产运,百度副总裁、搜索平台负责人赵世奇主导技术研发。 来源:中企图库 另据《中国企业家》了解,百度在11月下旬,进行了一轮近年来最大规模的人员优化,并给予了被优化员工“N+3.5”的补偿。数名员工对《中国企业家》表示:所有部门都不同程度受到波及,减员比例从5%~30%不等,优化依据与部门盈利水平直接相关,游戏、直播等非核心业务线还会更高。其中整体调整幅度最大的,正是MEG,用户增长、安全平台等业务部门均被波及。而AI与云计算相关的业务部门,则影响较小。这一系列密集变动背后,是百度核心广告业务下滑、AI新业务增长不足的严酷现实。2025年第三季度,百度总收入312亿元,同比下降7%,季度净亏损112.3亿元,去年同期为盈利76亿元。相比于阿里、字节等对手已经在用“饱和式投入”的决心下注AI,李彦宏正在亲自操刀,重整百度的AI业务架构与研发体系,背水一战。核心广告业务失速百度2025年第三季度财报呈现出明显的分野:一边是百度的“现金牛”传统广告业务持续下滑,另一边是AI业务高速增长,但仍需高额投入。曾经支撑百度半壁江山的在线营销收入在本季度降至153亿元,同比下滑18%。作为对比,QuestMobile数据显示:2025年第三季度,中国互联网广告市场规模同比增长6.4%。同一时期,腾讯、B站、快手的在线营销服务收入分别增长了21%、23%和14%。这背后反映出一个不争现实:广告主们正在向电商、短视频等离交易更近、转化链路更短的平台迁移。最新一季财报会上,腾讯管理层表示:2025年第三季度广告收入的核心增长动力,正是AI驱动下带来的效能提升。 摄影:邓攀 相比之下,百度广告持续下滑背后,其搜索模式已经遇到了结构性挑战。小红书、抖音、微信纷纷在搜索上发力,不断侵蚀着百度的市场份额。AI App直接给出精准答案,减少用户点击行为的交互模式,也在瓦解百度“付费排名”的护城河。极光数据和QuestMobile数据显示,今年一季度,抖音日均搜索量达53亿次,占移动搜索份额七成,微信日均搜索量超10亿次,小红书6亿次/年,增速超100%;而百度App日均搜索量已降至3亿次,总体市场份额在30%左右。这已是百度在线营销收入连续第六个季度下滑。据“光子星球”报道,在李彦宏2025年年初的OKR中,第一个关键目标就提到,“基石业务搜索、Feed、百度App用户数据全面回正。”百度必须重新探索AI搜索下的新商业模式。2024年10月,原百度CFO罗戎被轮岗调整到MEG担任负责人。他在财报电话会上透露,百度目前正在开展多项测试:第一,百度在AI搜索中测试电商组件;第二,百度面向广告主的智能体日均营收超2500万元,未来将有更多智能体接入文心助手;第三,百度已启动具备实时交互功能的数字人直播测试,探索更具吸引力的商业互动模式。将资源向AI业务倾斜一直以来,百度在AI端的布局起步并不慢,技术积淀更被称为“黄埔军校”,却屡屡被质疑“起大早、赶晚集”。2023年,百度率先在国内推出文心大模型,并推出类ChatGPT式的AI服务。2025年11月,百度已将全模态的基础大模型升级到ERNIE 5.0。但对手纷纷后来居上,让百度的先发优势不断受到冲击。今年10月以来,阿里巴巴在AI to B和AI to C两大方向齐头并进,双端发力。其C端代表性产品千问App,上线一周下载量就突破千万。同时,“模型即产品”也成为业界共识——千问App正是基于阿里的开源模型Qwen3开发。在2025年第三季度财报电话会上,虽然李彦宏反复强调百度的AI战略:“在文心大模型的迭代过程中,百度始终坚持以应用为驱动的发展理念。”但他也承认,文心大模型在应用场景中仍有很大的优化空间。 来源:受访者 近日,李彦宏更在接受《时代》周刊专访时提及:“AI应用层将是百度机会最多的地方。”“百度并不缺少AI的技术理论成果,但需要把它们更有效地转化为落地应用场景。”搜索行业人士对《中国企业家》说。过去几年,担任百度大模型技术带头人的是CTO王海峰,他作为“学院派”代表,曾一手搭建了百度的“飞桨”平台和知识图谱。但当下,百度需要更多能“听得见炮火”的干将。11月围绕文心大模型的架构调整,也表明了百度要从基础模型更快地转向应用模型落地的决心。此次百度新设的基础模型研发部,由百度集团副总裁吴甜负责。吴甜2006年浙江大学毕业后,便以校招生身份加入百度,长期负责百度人工智能技术平台与生态。新设的应用模型研发部由贾磊领导,他于2011年加入百度。在2023年,曾在语音大模型上做出过突破性成果,也更擅长将技术转化为落地场景。在to C端,负责百度文库与网盘的王颖,以及主导推出电商新品牌“百度优选”、数字人直播平台“慧播星”的平晓黎也获得了晋升。此前,王颖领导的百度文库,曾多次被李彦宏评价为是百度生态中,完成AI化改造最成功、最彻底的产品。截至目前,百度文库的AI月活超过9700万,百度网盘的AI月活用户超8000万。作为在百度任职18年的“老将”,平晓黎曾先后主导百度网盟、移动生态等核心业务,并带领百度APP日活跃用户(DAU)突破2亿。百度还有几张牌从自上而下的组织调整,到前端业务重心的变化,百度看起来在AI层面拿出了进击之势。从财务角度看,百度也在痛下决心,力图一次性将“利空出尽”。关于此次112亿元的净亏损,百度表示:主要是一次性的长期资产减值162亿元所致,这是为了淘汰无法满足当前AI计算效率要求的旧有设施。“目前各大公司都还有服务于移动互联网时代的旧服务器。与其让它们慢慢折旧,百度选择将其一次性计提,也可以视为‘断腕’决心。”前述搜索行业人士说。同时,百度也在通过人员优化,试图快速“减重”。一位被优化员工对《中国企业家》透露,过程中领导和HR跟她计算了部门的经营情况,资源、服务器、人力成本,明确表示目标是盈利回正。“大家都说,这一波是强财务驱动。”百度手中也还有不少张牌可以打。截至2025年9月30日,百度依然有高达2964亿元的现金流,其AI业务也表现出了许多增长亮点。在2025年第三季度财报中,百度智能云收入42亿元,同比增长33%,且按月付费人工智能加速计算基础设施业务的营收同比增幅高达128%;AI原生营销服务收入28亿元,同比暴增262%,并已占百度核心在线营销收入的18%。 来源:视觉中国 百度自动驾驶业务也可圈可点。截至2025年11月,百度阿波罗自动驾驶出租车业务已进入全球22座城市,累计服务订单量超1700万单,这一成绩在全球范围内,几乎与谷歌旗下的Waymo比肩。更重要的是,12月以来国产AI芯⽚公司进入上市窗⼝期,百度“昆仑芯”也被市场高度关注。从2011年开始,百度便组建了昆仑芯⾃研团队。2021年8⽉,昆仑芯实现7纳⽶制程的⼆代芯⽚量产;此后更量产三代芯片,并基于此推出了P800板卡。2025年2⽉,百度智能云成功点亮昆仑芯三代P800万卡集群。在客户⽅⾯,百度称昆仑芯的算⼒解决⽅案已经服务了互联⽹、运营商、⾦融、交通、能源电⼒、智能驾驶及国家算⼒枢纽等⾏业的百余家客户。11⽉13⽇,百度在“世界⼤会”上发布了未来5年的芯⽚路线图,其中M100、M300两款AI芯⽚将分别于2026年和2027年上市,而M系列正是基于国产供应链打造。百度CFO何海建表示,随着AI业务规模扩大,百度有望发挥规模效应。“具体将通过三方面实现:一是减值后资产结构更精简高效;二是理性投资,提升资本使用效率;三是通过在内部产品间动态分配算力等方式,提高人工智能基础设施利用率。”他表示,虽然2025年第三季度是利润率的阶段性低点,明年随着上述措施逐步落地,非公认会计准则下的营业利润和利润率有望得到改善。 -
快手现大量色情违规内容 安全专家分析 快手平台遭到黑灰产攻击12月22日晚,快手平台多个直播间出现色情、暴力等违规内容,快手一度关停直播。对此,快手方面回应称,22日22时左右,平台遭到黑灰产攻击,目前已紧急处理修复中,平台坚决抵制违规内容,相应情况已上报给相关部门,并向公安机关报警。南都N视频记者留意到,目前,快手直播功能已经恢复正常。值得一提的是,有网友提到,昨晚出现的违规直播中还隐藏着病毒链接。奇安信安全专家汪列军表示,此次攻击之所以能造成大规模破坏,核心原因在于黑灰产已全面迈入 “自动化攻击” 时代,而平台仍依赖传统人工防御模式。黑客借助自动化工具批量注册、操控僵尸号,实现违规内容的秒级发布与扩散,这种规模化攻击完全超出人工审核的应对极限。传统人工审核存在天然滞后性,面对每秒数十条的违规内容洪流,往往陷入“封禁不及新增”的被动局面,即便增派人手也难以填补攻防效率差。针对此次事件暴露的行业痛点,汪列军认为:“当前网络安全已进入不对称战争时代,高级威胁的隐蔽性与攻击的自动化特征,让传统人工防御难以为继,必须用AI赋能实现安全防护自动化,以对抗攻击自动化。”尤其是在黑灰产手段持续升级的背景下,企业亟需构建超越人类分析极限的AI “大脑”,通过智能感知、自动研判、极速响应的全流程自动化体系,破解攻防失衡的困局。采写:南都N视频记者 汪陈晨 -
宁夏银川:511名科创少年角逐无人机赛场 来源:中国新闻网 12月20日,2025世界机器人大赛FTF(青少年无人机)赛项银川市选拔赛在当地举办,吸引511名青少年选手参与。本次赛事由中国电子学会主办,设置极速任务赛、球形无人机对抗赛、编程物流搬运赛、编程城市灭火赛四大赛项。图为小选手参与球形无人机对抗赛。中新社记者 杨迪 摄 12月20日,2025世界机器人大赛FTF(青少年无人机)赛项银川市选拔赛在当地举办,吸引511名青少年选手参与。本次赛事由中国电子学会主办,设置极速任务赛、球形无人机对抗赛、编程物流搬运赛、编程城市灭火赛四大赛项。图为小选手参与极速任务赛。中新社记者 杨迪 摄 12月20日,2025世界机器人大赛FTF(青少年无人机)赛项银川市选拔赛在当地举办,吸引511名青少年选手参与。本次赛事由中国电子学会主办,设置极速任务赛、球形无人机对抗赛、编程物流搬运赛、编程城市灭火赛四大赛项。图为选手参与编程城市灭火赛。中新社记者 杨迪 摄 12月20日,2025世界机器人大赛FTF(青少年无人机)赛项银川市选拔赛在当地举办,吸引511名青少年选手参与。本次赛事由中国电子学会主办,设置极速任务赛、球形无人机对抗赛、编程物流搬运赛、编程城市灭火赛四大赛项。图为小选手参与极速任务赛。中新社记者 杨迪 摄 12月20日,2025世界机器人大赛FTF(青少年无人机)赛项银川市选拔赛在当地举办,吸引511名青少年选手参与。本次赛事由中国电子学会主办,设置极速任务赛、球形无人机对抗赛、编程物流搬运赛、编程城市灭火赛四大赛项。图为小选手参与球形无人机对抗赛。中新社记者 杨迪 摄 12月20日,2025世界机器人大赛FTF(青少年无人机)赛项银川市选拔赛在当地举办,吸引511名青少年选手参与。本次赛事由中国电子学会主办,设置极速任务赛、球形无人机对抗赛、编程物流搬运赛、编程城市灭火赛四大赛项。图为小选手参与球形无人机对抗赛。中新社记者 杨迪 摄 12月20日,2025世界机器人大赛FTF(青少年无人机)赛项银川市选拔赛在当地举办,吸引511名青少年选手参与。本次赛事由中国电子学会主办,设置极速任务赛、球形无人机对抗赛、编程物流搬运赛、编程城市灭火赛四大赛项。图为选手参与编程城市灭火赛。中新社记者 杨迪 摄 -
在“量”的基座上筑起“质”的高峰(坚持“两创”·关注新时代文艺) 聂辰席 在微短剧发展的关键时期,我们既要拥抱人工智能技术带来的效率革命,更要坚守以人民为中心的创作导向;既要激发“无视频不网络”的创新活力,更要追求“于细微处见真章”的价值深度 近日,两则消息引发人们关注。一则是,中国自研的可灵Turbo2.5视频生成模型,在一份全球文生视频、图生视频双赛道评测中位列榜首。另外一则,国内首部付费AI短剧《兴安岭诡事》上线不到21小时播放量即破千万。这两则新闻显示出,人工智能正以前所未有的速度、深度介入内容创作领域,人工智能生成内容(AIGC)技术迎来规模化应用的临界点。 在这场技术变革中,微短剧作为最活跃、最接地气的应用场景,率先感受到澎湃力量。很多人相信,“一人拍一部短剧”甚至“一键生成一部剧”即将实现,微短剧的生产潜能将被前所未有地释放出来,AI微短剧内容将大量充盈网络空间。由此,我们迫切需要思考:微短剧将如何平衡“量”的积累与“质”的飞跃,从而更好肩负起新时代新的文化使命。 AIGC技术正以超乎想象的效率解放微短剧的生产力。特别是新一代模型,进一步提升了视频生成的可控性、稳定性、一致性,能够精确生成叙事连贯、情节丰富的动态影像,更加细腻地呈现人物的表情,让表演更具张力,使其更广泛地应用于影视、短剧、游戏、动画等创意创作的专业场景。剧本创作、分镜生成、场景渲染、视频合成——这些传统影视工业中复杂的环节被极致压缩。这场“效率革命”最直接的成果,便是作品数量的井喷式增长。 应当认识到,这种“量”的爆发,本身具有重大且积极的意义。首先,量是基础。海量创作是市场活力最直观的体现,它为观众提供了空前丰富的选择,也为文化市场的繁荣提供了基本盘。没有相当的数量规模,就谈不上类型的多元、市场的成熟和产业的壮大。其次,有“量”才能促进“质”。如同大浪淘沙,只有作品基数足够庞大,才可能持续孕育精品;只有在充分的竞争与不断的试错中,创新的方向和路径才能被逐渐摸索清晰。从建设文化强国的高度看,“量”是文化繁荣的标志之一。一个百花齐放、百舸争流的创作生态,本身就是社会主义文化繁荣发展的生动景象。因此,AIGC技术释放微短剧的巨量产能,这第一步走得扎实且必要。 更深层次看,AIGC驱动的“量”变,本质是创作权利的极大实现。微短剧本就因投资低、周期短而具有大众化基因,AIGC的加持使其门槛降至历史新低。影视创作不再是“大制作、大导演、名演员”的专利。只需几个关键词,便能生成数十个剧本框架;上传几张场景图,即可输出氛围感十足的剧情片段。这种技术赋能使得“一人团队”制作高质量微短剧成为可能,彻底打通了大众特别是Z世代参与创作的通道。随着AIGC技术的普及,未来用户“一键”就能从“刷剧人”转变为“产剧人”,实现从消费到创作的跨越,这不仅是一场技术革命,更是文艺创作大众普及的深刻体现。 当菜市场摊主、外卖骑手、退休教师都能借助AI创作工具,将自己的生活故事便捷地转化为微短剧时,万千普通人的奋斗历程、生命体验构成了作品“量”的源泉,也赋予其“质”的底色。微短剧只有向下扎根越深,向上生长的枝叶才会越繁茂。这种由AIGC赋能、全民参与的“量”的积累,正是在践行以人民为中心的创作理念,不断激发大众的创新创造活力,构建一个共创、共享、共鸣的健康生态。 重视“量”的基础性作用,绝不意味着可以安于“量”的现状。值得注意的是,随着AIGC技术在内容生成中的广泛应用,作品海量涌现的同时,也因模型的路径依赖产生了题材跟风、情节同质化的弊端。相似的海报、雷同的片名、似曾相识的剧情,“霸道总裁”“重生复仇”“穿越逆袭”“虐恋甜宠”“奇观玄幻”等有限套路被无限复制。此类“模板叙事”更易于被系统化复现与推广,进而可能引发一种值得警惕的传播循环:算法识别热门模板—AIGC辅助批量生成—内容生态趋向同质—算法进一步强化该类内容曝光。这一闭环虽在短期内提升了内容产出效率,却也会对微短剧创作的多样性与创新性构成挑战,长此以往,不仅消耗用户的新鲜感,也可能因脱离生活、脱离人民而内容苍白、创新乏力。 面对机遇与挑战,我们需要从多个维度破局,引导微短剧行业实现从“量产”到“质变”的跨越。 坚守人民立场,深耕现实土壤。要始终坚持以人民为中心的创作理念,鼓励创作者深入生活、扎根人民,展示一个真实、立体、全面的中国。当技术能够帮助我们更好地开掘和展现真实的生活、美好的情感、时代的气象时,微短剧才能有源源不断的生命力。 驾驭技术工具,强化人机协同。要让AIGC成为创作者的“超级助理”而非“替代者”。聪明的团队会采用“人类创意导航,AIGC高效执行”的模式——由人类创作者把握作品灵魂和价值导向,AI负责提升执行效率。同时,建立“数据护城河”,用地域文化、非遗传承等特色数据训练出具有个性的AI工具。 完善算法机制,激励优质创新。平台方应优化算法推荐,将“创新指数”“艺术价值”“文化内涵”纳入评价体系,对题材新颖、制作精良的作品给予流量倾斜。同时,建立AIGC内容溯源机制,对有害、不良、侵权内容进行识别限制。 深化科艺融合,拓展产业蓝图。文化和科技融合,既催生了新的文化业态、延伸了文化产业链,又集聚了大量创新人才,我们要积极推进AI技术在微短剧创作、审核、传播等全过程、全环节的创新应用,打造新场景、新模式、新业态。 习近平总书记在主持中共中央政治局第二十三次集体学习时指出:“大力弘扬社会主义核心价值观,推出更多有内涵、有温度、有影响的网络作品”。“十五五”规划建议提出:“繁荣互联网条件下新大众文艺”。当AI辅助创作成为行业标配,创新创造力与人文关怀才是最终的竞争力,技术终要服务于内容。在微短剧发展的关键时期,我们既要拥抱人工智能技术带来的效率革命,更要坚守以人民为中心的创作导向;既要激发“无视频不网络”的创新活力,更要追求“于细微处见真章”的价值深度。让我们以技术和文化的双轮驱动,在“量”的基座上筑起“质”的高峰,推动微短剧涌现更多记录时代、讴歌人民、滋养心灵的新大众文艺精品。 (作者为全国政协常委、文化文史和学习委员会副主任,中国网络视听节目服务协会会长) -
上海AI Lab王靖博:人形机器人,从「盲动」走向「感知驱动」丨GAIR 2025 “更优雅的感知,更长程的控制。”作者丨梁丙鉴编辑丨马晓宁 编者按:12月12日,第八届 GAIR 全球人工智能与机器人大会于深圳正式拉开帷幕。本次大会为期两天,由GAIR研究院与雷峰网联合主办,高文院士任指导委员会主席,杨强院士与朱晓蕊教授任大会主席。大会共开设三个主题论坛,聚焦大模型、具身智能、算力变革、强化学习与世界模型等多个议题,描绘AI最前沿的探索群像,折射学界与产业界共建的智能未来。作为 AI 产学研投界标杆盛会,GAIR自2016年创办以来,始终坚守 “传承+创新” 内核,是 AI 学界思想接力的阵地、技术交流的平台,更是中国 AI 四十年发展的精神家园。过去四年大模型驱动 AI 产业加速变革,岁末年初 GAIR 如约而至,以高质量观点碰撞,为行业与大众呈现AI时代的前沿洞见。在12月13日的“数据&一脑多形”专场,上海人工智能实验室青年科学家王靖博进行了以《从虚拟走向现实,构建通用人形机器人控制与交互策略》为主题的演讲。长期以来,人形机器人的研究是否必要一直存在着争议。演讲伊始,王靖博博士就对此做出了回应。他指出,由人类搭建的真实生活环境,也面向人类的各种需求,这决定了人形必然是一种相对通用的方案。在数据维度,互联网上有大量来源于人类日常生活的第一人称及第三人称数据,其中包含的运动逻辑和操作逻辑,对于模型训练来说都是可用资源。在应用层,人形机器人的交互逻辑、安全性等研究,最终也会回馈到人自身。而人形机器人现阶段研究的核心问题之一,就是如何在仿真中训练机器人,并使其在真实世界中实现稳定、可泛化的运动与控制。由于仿真环境与真实物理世界之间存在的差异,人形机器人的技能训练与部署长期面临着Sim2Real的鸿沟。对此,王靖博博士介绍了其团队的最新成果,通过对日常生活环境的集成性构造,以及创新的感知和表示方案,显著提升了复杂地形下运动策略的迁移成功率。其核心在于用体素化的点云表示压缩环境信息,并在仿真中引入机器人本体的激光雷达自扫描,以更好地对齐仿真与真实的传感器数据分布,从而使机器人能提前感知地形变化,如台阶、吊顶,并预先规划动作,而非依赖碰撞后的力反馈。此外,王靖博博士在演讲中提到了构建统一的动作技能表征,作为基础的人形机器人运动控制模型,可以进一步拓展在有效的可迁移的人形机器人感知方案下的动作与技能选择,使得人形机器人可以在基础的运动之外完成和场景的交互已经多种球类运动。在演讲中,王靖博博士进一步指出,人形机器人的控制策略正从“盲走盲动”转向“感知驱动”,融合视觉、激光雷达等环境感知,以实现机器人在复杂、非结构化环境中的自主导航与交互是必然趋势。关于人形机器人的未来,王靖博博士认为,当前的模型参数量和学习方式限制了技能容量和更多元控制形式的探索。长远来看,构建容量更大,更高效利用数据的方案,例如离线的监督学习,是提升机器人技能通用性和长程控制能力的可行路径。 现场演讲完整视频,详见链接:https://youtu.be/mpTuN_sfc44?si=-V2XnjIOWSJIt_1X以下为王靖博的现场演讲内容,雷峰网进行了不改变原意的编辑整理:大家好,我是王靖博,来自上海人工智能实验室具身智能中心。我们主要研究方向是人形机器人的技能学习以及Sim2Real相关课题。我今天的报告是想分享最近人形机器人全身控制方面的进展,正好今天也站在2025年的年底,对明年我觉得比较重要的问题做一些展望。首先很多人会对人形机器人或者人形角色有这样的疑问,就是我们为什么会去研究这样一个课题。在真实世界中做机器人,为什么一定要做成这么一个人形的形态?在虚拟世界里建模的时候,为什么也特别关心人类这样一种特定的对象? 选择人形角色作为研究对象,主要基于以下三方面原因。首先,现实物理世界的生活场景大多围绕人类需求搭建,因此针对人形角色开展的研究方案具备天然的通用性。其次,从数据维度分析,除自然风光与动物相关数据外,互联网中蕴藏着海量源于人类日常生活的数据集,无论是第一人称还是第三人称视角,均包含丰富的人类运动与操作逻辑,可为研究提供充足的数据支撑。最后,人形角色研究具备显著的应用价值,以自动驾驶领域为例,其核心目标之一便是保障人机交互过程中的安全性,避免车辆对行人造成伤害。综上,从研究对象的适配性、数据资源的丰富度到应用场景的实用性来看,人形角色都是理想的研究载体。本研究的核心主题聚焦于人形角色中央控制系统的构建方法。研究中,所有人形角色的训练均在仿真环境中完成,最终目标是实现模型从仿真到真实物理世界的迁移,达成人形角色的自主化运行。具体而言,研究重点关注以下两个关键问题:其一,技能的真实世界落地及仿真到现实迁移(Sim2Real)的核心要点,包括行走、奔跑、跳跃、下蹲等基础技能的习得方式,以及如何在不同人形硬件平台、高噪声环境下完成稳定部署,确保机器人可靠执行各类技能;其二,技能的精准调用与灵活组合策略,例如上楼梯动作需实现双腿交替抬升的协同控制,侧踢动作则要求单腿支撑身体平衡的同时完成另一腿的精准抬起。此外,系统还需具备语言指令的精准理解与执行能力,能够在真实非结构化地形中实现无碰撞运动,确保人形角色在复杂场景下的稳定运行。关于具体的控制方案怎么做,今天我就不展开细讲了。我想和大家重点探讨的,是另一个核心话题——就是如何把高频感知,也就是perception,和控制策略(control policy)深度结合起来。大家可以先想一想:我们为什么必须要做感知与控制的融合?首先,对于人形机器人来说,我们肯定不希望它只能在平地上活动吧?那最基础的一点,它就必须具备理解环境几何结构的能力。其次,如果我们想让它从A点走到B点,再完成拿取物品的任务,它就必须精准掌握自己的位置,以及目标物体的位置。第三点也很关键,机器人所处的环境里不只有它自己——实际应用中,我们往往需要它和其他角色产生交互,所以这种互动能力(interaction)对它来说至关重要。基于这几点,我们可以把问题简化一下。我们先从最基础的问题入手,就是人形角色的局部运动(local motion)。我们绝不希望人形机器人只能局限在平地上活动,就像大家在机器人马拉松这类视频里看到的那样,在平坦地面上,靠人操控摇杆才能移动。给大家举个具体的场景:假设我有一台人形机器人,让它从这个门进来,要在一间结构非常复杂的屋子里活动——这里到处都是障碍物,还有楼梯、吊顶之类的遮挡物,最终目标是让它顺利从门口走到二楼的门口。在这个任务场景下,机器人的感知需求就会收敛成几个核心研究方向:比如脚下的地形是什么形态、周围的物体是什么、头顶上方的环境又是什么样。我们希望能打造这样一套控制策略,能够使得这个人形机器人在拟人运动的同时,把这些所有障碍都避开。 那为了实现这样一件事,第一个比较基础的思路,是用RGB相机。但用RGB相机做Sim2Real(仿真到现实迁移),会面临不少问题。如果大家用过Isaac Lab这类仿真器就知道,仿真环境里的光照、纹理和真实世界差距很大,渲染出来的图像和真实场景完全不同。要是基于这种仿真图像去做Sim2Real迁移,你会发现训练出的策略根本无法理解真实世界——在这种情况下,模型完全没法适配真实环境的样子。第二个问题是RGB相机缺乏几何信息。我们做最基础的局部运动(local motion),核心是要理解地形,但RGB图像没法直接呈现任何几何信息,这也是个很棘手的问题。第二种方案是深度相机,这也是很多人在研究的方向。早年有些工作,确实有用深度相机做环境重建或者避障的尝试。但我想做的,是一套不需要预建地图的控制策略。而且我们大概率需要让这个感知方案和最基础的强化学习(RL)策略一起训练,所以深度相机同样会存在Sim2Real的鸿沟。在仿真环境里,深度数据都是非常干净、边缘锐利的几何形态,但在真实世界中,用深度相机采集到的数据完全不是这样。另外,深度相机的感受野也比较小,覆盖范围有限。第三种方案是用激光雷达这类传感器。雷达确实有优势,它获取的几何信息相对准确,探测范围也足够大。但这类几何传感器依然存在问题,比如一些异常点(outlayer)很难在仿真中模拟;而且从实际应用角度来说,雷达扫描会有100到200毫秒的延迟,不像RGB相机或深度相机那样能达到很高的感知频率。 其实总结一下,我们想做一个优秀的、带感知的局部运动(local motion)系统,核心要解决这几个问题:首先得明确面对的是何种环境,其次要确定采用什么样的感知方案,第三是明确对环境的表征形式,最后还要解决如何与局部运动策略进行联合训练(joint training)的问题。把这几点综合起来,就是我们最近开展的一项核心工作。首先来看环境构建的问题。我们整合了日常生活中可能遇到的多种环境类型,做了一个集成化的环境构建。比如包含走台阶、高台,旁边有小柜子需要绕行、有门需要避让的常规场景;也涵盖了梅花桩这种更极端的地形,还有头顶存在不同形式吊顶的场景——这种情况下,就需要机器人识别出头顶的障碍物,然后自主采取下蹲姿势通过。我们做这样的环境集成,核心目标就是让机器人能习得一套“多场景通用”的控制策略,适配不同环境的需求。第二个重点工作,是我们在感知方案和环境表征上做了创新。我们没有选择深度相机或点云这种常规形式,主要有两个原因:一方面,就像刚才提到的,直接用深度相机的话,很难模拟真实世界中的噪声,Sim2Real过程中的噪声问题没法妥善解决;另一方面,如果直接用点云,不仅存在大量异常点(outlayer)噪声,还包含很多冗余信息,需要对每个点逐一进行表征,效率很低。但实际上,我们的核心需求只是知道“附近有没有障碍物”,只需要一种非常紧凑(compact)的表征形式就足够了。所以最终,我们选择把点云转化为体素(voxel)形式来做环境表征。 第三件事,这是从实际应用(in practice)的角度出发的。我们用Isaac Lab做仿真的时候,发现它本身并不支持对机器人本体的雷达扫描。所以我们额外做了工作,把机器人本体的扫描功能加上来,目的就是进一步缩小Sim2Real的鸿沟。另外,有了这样的环境表征后,我们还需要让它能在算力非常有限的平台上实时运行。这里我们也做了优化,没有选择大家常用的3D CNN,而是对不同高度的体素做了切片处理,这样就能快速完成对地形的表征。我们也把我们的方法和很多现有方法做了对比。其实,局部透视运动(perspective local motion)是一个非常经典的问题,之前很多研究是用深度相机、点云来做的。相比于这些方法,我们的优势主要有两点:第一,我们对机器人做了改装,它的视场角(FOV)足够大,能全面感知周围环境,所以实现全向运动完全没问题;第二,我们支持多种地形的训练,再加上刚才说的本体扫描改装方案,让机器人能实现全地形运动。关于刚才提到的本体扫描问题,我们也专门做了对比实验——就是看“是否加入本体扫描”,对仿真中输入信息的影响。结果发现,这也是一个很关键的Sim2Real鸿沟:除了之前说的传感器本身的噪声问题,加不加本体自扫描,会让系统性能产生非常大的差异。我们的实验证明,加上本体自扫描后,仿真中传感器的表现能和真实世界更好地对齐,系统性能也会显著提升。这是我们论文里的一些测试演示视频(demo),大家可以看到,机器人能稳定通过很多复杂场景,比如上高台。可能有朋友会说,之前也看过一些机器人盲走的演示,觉得上高台、走台阶不算特别新奇的事。但大家可以注意一个细节:之前很多盲走方案,机器人必须等脚碰到台阶,获得了力反馈之后,才知道前方有障碍,进而抬起脚步。而且,抬起多高的高度,其实它是没法提前知晓的。 之前那种靠力反馈触发动作的方式,其实是一种非常不安全的形式。而我们的方案加入了合理的感知模块,就能解决这个问题。比如demo里左上角上高台的场景,机器人在还没碰到高台的时候,就提前做好了抬脚动作的规划——它能感知到前方环境的变化,进而主动调整自身行为。包括应对吊顶的场景也是一样:我们的机器人不会等到碰到吊顶才反应,而是提前感知到头顶的障碍物,就主动做出规避动作。甚至面对连续的吊顶区域,在没有空隙的地方能自主下蹲通过。这其实就是带感知的局部运动(perception local motion)一个非常核心的优势——预判性,也是它区别于传统盲走方案的关键性质。最后还有一点感悟想和大家分享。现在行业里大家一直在讨论Sim2Real的鸿沟问题,我们做完这项工作后,也有了一些自己的见解。其实很多方案在仿真环境里表现得非常好,比如做带感知的局部运动时,在仿真中给一个非常干净的热力图(heatmap),或者其他类型的3D观测数据,仿真中的成功率能做到很高,甚至接近100%。但大家如果实际去做部署就会发现,这些方案在真实世界中的表现往往非常不稳定,和仿真结果的差距很大。 我们认为这并不是一个很好的Sim2Real的解决方案,我们也测了一下自己的策略,发现我们这个方案的Sim2Real表现是非常一致的。其实我觉得这是一份非常好的性质,就是你可以在simulation里很好地研究你的策略,让Sim和Real的表现尽可能一致,所以你也就可以得到一个很可信的to Real的控制策略。讲完感知,这里我想延伸一下:我们肯定不希望机器人只懂运动这一件事。大家今年也看到了很多机器人翻跟头的演示,各种各样的控制策略层出不穷。但我们最终的目标是,让机器人拥有一个相对通用的行为基础模型控制策略——它不仅能走路、翻跟头,还能完成各类交互任务,并且把我们刚才说的感知能力融合进去。要实现这个目标,有个核心问题需要解决:当我们想建模这类通用行为时,机器人会掌握很多技能,还要面对复杂环境,这就需要我们建模一个“行为隐变量”(behavior latent)。如果没有这个隐变量,相当于机器人只有一个状态(state),由状态直接决定动作,环境因素无法影响它的行为选择。这样的机器人就像个提线木偶,只能完成单一、程序化的执行过程,根本谈不上通用性。但如果有了这个行为隐变量,情况就不一样了:机器人可以根据环境选择不同的隐变量,也可以根据任务选择不同的隐变量,从而完成各种各样的任务。包括我们刚才说的感知信息输入、交互信息输入,这些都能通过隐变量实现技能的灵活组合。可能有朋友会问,这和Sim2Real有什么关系?其实这是图形学领域长期关注的经典问题——如何构建高质量的行为隐变量,而它恰恰是解决Sim2Real通用性问题的关键之一。我们把建模这种运动隐变量(motion latent)的任务,分成了两类形式:第一类是任务无关的:我不关心机器人要执行什么具体任务,只关注当前状态到未来状态变化的隐变量。比如它向左走、向右走都可以,核心是捕捉运动本身的规律,和具体任务脱钩。第二类是任务相关的:这种隐变量会直接参与任务决策。比如机器人处于站立状态时,输入不同的运动形式或控制模式,就能在这个状态下匹配到不同的任务相关隐变量。这样一来,面对不同任务时,我们可以直接实现隐变量的快速迁移(shot transfer),不用再额外训练一个高层控制器(high-level Controller)去寻找合适的隐变量。所以我们团队选择了第二条路——打造一个“任务感知型”(task-aware)机器人。为了实现这个目标,我们分了四个步骤推进:第一步是数据重构(retargeting)。因为我们的模型需要基于人类数据学习,所以先做了一轮数据重构工作,把人类的运动数据适配到机器人模型上。第二步是训练代理智能体(proxy agent)。我们在仿真环境中,利用所有可获取的特权变量(privileged variables)训练了一个模型。简单说,就是在理想环境下,先让模型学习到基于重构数据的最优行为表现,打下基础。第三步是设计控制模式与掩码(mask)。既然是任务感知型,就需要明确常用的控制模式。我们设计了一些基础控制模式,并通过掩码的形式实现控制模式的选择,让机器人能精准匹配对应任务的行为需求。第四步是师生学习(teacher-student)。因为最终要落地到真实世界,我们通过师生学习框架,把教师模型(理想环境下的proxy agent)和学生模型(适配真实环境的模型)的隐变量分布尽可能对齐,从而实现Sim2Real的迁移。这里补充一句,我们这个工作做得比较早,大概今年7月份就完成了。虽然今年大家已经看到很多类似的演示,但在当时,这算是一个比较通用的控制策略,还是有一定前瞻性的。除了基础的运动跟踪(motion tracking),这个模型还有不少实用能力。比如输入“下蹲”的姿态指令,模型会生成对应的参考姿态并执行;输入向前、向后、向左、向右的运动指令,模型能在隐变量空间中找到不同隐变量的线性组合,精准控制机器人完成相应运动。我们还做了一些趣味测试,比如模仿人形机器人运动会上“忍者式跑步”的动作。测试发现,这个模型支持全身遥操作(whole-body teleoperation),不管是原地行走,还是一些复杂的全身运动,都能很好地完成。基于这个策略,机器人还能实现原地起立这类幅度较大的动作。另外,我们也对隐变量做了深入分析:既然是隐变量模型,它的隐变量是否具备结构化特征?我们在仿真到仿真(Sim2Sim)的场景下做了测试,通过T-SNE可视化发现,向前、向后、向左、向右这些运动对应的隐变量特征分得非常开,而且能清晰看到不同运动状态之间的过渡可能性,这说明我们的隐变量确实捕捉到了运动的结构化信息。我们还做了一个很有意思的实验:以回旋踢动作为例,我们发现如果只给机器人根部运动模式(root mode)的隐变量,它只会转圈,不会踢腿;如果只给关键点(key point)相关的隐变量,因为没有转圈的运动基础,也无法完成踢腿动作。但把这两个隐变量做线性组合后,机器人就能顺利完成一整套完整的回旋踢动作。更重要的是,当某个动作表现不好时,我们可以用真实标签(GT)的隐变量去引导模型,帮助它找到合理的隐变量来完成动作。同时我们发现,当部分策略效果不佳时,通过在线再训练(online retraining),能快速搜索到更优的隐变量,而且我们的方法收敛效率很高。在对比实验中,我们把这个模型和“万能模型”(one-for-all model)、“任务专用模型”(task specialist)做了比较。结果显示,我们的方法比任务专用模型在训练集上的表现更好,能有效对抗过拟合;同时,比不带隐变量的方法拥有更高的跟踪精度。刚才讲的都是无交互的任务,接下来我们思考:带交互的动作,能不能用这套任务感知型行为基础模型(task-aware BSM)来完成?我们做了一些尝试,发现交互类任务的数据有两个明显特点:一是建模精度要求高,比如数据采集时动捕设备精度不够,就容易出现穿模问题;二是数据稀缺,市面上缺乏足够多的交互类数据,很难构建通用的跟踪器。尤其是想让交互场景多样化,难度就更大了。针对这个问题,我们借鉴了“对抗性运动先验”(adversarial motion prior)的思路,采用生成式模仿学习(generative imitation learning)的框架。核心思路是:不做强制的运动跟踪,而是用运动先验来约束机器人的运动合理性,同时把任务奖励(task reward)融入训练中。因为我们要做的是基础模型,肯定不希望它只会做训练过的技能,更希望它像真正的基础模型一样,能零样本(zero-shot)或少样本(few-shot)地组合已有技能、适配新场景,不用从头学习,或者能高效掌握新技能。为了实现这个目标,我们做了三个针对性设计:第一,因为是多任务控制器,我们希望本体状态编码器能接触到各类任务,所以采用了分离式设计,让不同任务的任务头相互独立、互不干扰;第二,构建了大规模多样化仿真环境,设计了大量不同类型的交互任务——比如对同一类物体,设计了搬运、乘坐、跟随等多种交互形式,还对物体做了大量数据增强;第三,为不同任务设计了专属掩码。对比实验显示,这种通用的感知编码器比非通用的编码器效果更好,且性能方差更低。 有了刚才这些基础技能之后,接下来要解决的核心问题就是技能组合——我们也针对性地提出了一套相对高效的方法论。大家可以想一个典型场景:比如有搬箱子的任务,同时又需要在复杂地形上完成,最终目标是让机器人在复杂地形里搬着箱子上楼梯、下楼梯,再把箱子放到指定位置。这其实是人形机器人应用中很常见的复合任务,也是我们要解决的核心问题。基于我们的方法,具体怎么实现呢?分四步走:第一步,直接复用已有技能的表征——我们已经有“搬箱子”对应的任务表征(token),可以直接拿来用;第二步,引入地形专用的表征器(tokenizer)——因为任务要在复杂地形上完成,需要精准的地形感知,所以专门加一个负责地形感知的表征器;第三步,调用通用本体感知器——我们的本体感知器已经训练过大量任务场景,见过各种自身状态的可能性,能很好地适配复合任务的本体状态需求;第四步,动作适配加速收敛——为了让复合任务的训练更快收敛,我们会在动作层面做一些适配,过程中冻结各模块之间的关联参数,只开放少量与任务相关的参数进行再训练(retraining)。从实验结果来看,我们方法的成功率曲线(黄色曲线)表现最优,远超当时其他三种主流的最先进(state-of-the-art)方法。我们的方法还具备很强的迁移适配能力(shift adaptation),不管是更复杂的地形,还是超长程的任务,都能稳定应对。当然,我们最终的目标是实现这套方法的端到端Sim2Real迁移,具体要分三步推进:第一步,数据重构与对齐。和之前的工作一样,先做人类运动数据的重构(retargeting);在此基础上,还要把重构后的数据与行为对应的物体(object)、物体间的位置关系做精准对齐,同时标注出机器人与物体的交互状态。第二步,技能学习。沿用我们刚才提到的任务感知型模型框架,完成复合技能的学习。第三步,感知模块适配。这一步需要解决机器人与物体的相对感知问题,比如精准判断机器人与物体的距离、获取交互对象的位姿。我们在这个工作里初期用了比较简单的方案——直接贴AprilTag来做位姿定位;不过后续发现,现在有很多优秀的6D位姿估计模型,比如FoundationPose,完全可以实现更精准的位姿处理,后续可以整合进去。这里有个关键注意点:在做这类交互性策略的Sim2Real迁移时,我们的域随机化(domain randomization)做得更全面。大家之前做基础的 Whole-Body Control(WBC)或移动(locomotion)任务时,可能只对机器人本体做域随机化;而我们除了本体,还对物体及物体位置的观测做了域随机化——比如物体的质量、摩擦系数,都做了随机化处理。另外,真实世界中对物体的观测必然存在误差,所以我们在训练时,还会对输入策略的物体观测数据加入扰动,让模型提前适应真实环境的不完美性。第二个关键设计是深度相机的感知优化,让它能覆盖更大的前方视野,确保复杂地形和交互物体都能被精准感知。我们还发现,通过人为定义简单的交互逻辑(比如“走到物体旁→搬起物体→完成任务”),就能引导机器人完成与环境中不同物体的交互。大家现在看到的,就是我们在仿真环境中跑出来的结果——本体状态数据、环境感知数据等多维度数据协同工作,支撑整个交互任务的完成。我们也把我们的方法和两种主流方法做了对比:一种是基于跟踪的方法(tracking-based),另一种是不引入任何人类运动先验的方法。对比结果很明确:首先在成功率上,因为交互类数据本身比较稀缺,基于跟踪的方法靠硬约束去拟合,成功率很低,尤其是在多样化(diverse)环境下;其次,人类运动先验能显著提升任务表现——比如双臂协同向下夹取物体,这种符合人类运动逻辑的先验,能大幅加速模型收敛,同时提高任务成功率。我们还测试了方法的多样化适配能力,在仿真环境中表现很理想。大家可以看到,红色曲线是参考运动(reference motion),我们的方法在只给少量参考运动的情况下,就能实现更丰富多样的交互行为,相关演示(demo)也能证明这一点。而且我们的测试不局限于搬运任务,还包括坐下(sit down)、躺下(lying)、物体转运(把物体从一个位置放到另一个位置)等多种交互任务。我们可以通过人工选定任务目标,让机器人精准执行。至少在控制策略层面,我们已经成功把仿真环境中解决复杂交互任务的能力,迁移到了真实世界中,解决了之前Sim2Real迁移在交互任务上的核心痛点。 与此同时我们还做了更多尝试,比如在快速运动的物体下,比如说足球。我们改进了它的感知模式,比如可以用动捕,或者用一个更快速的感知方式,使得它直接用形态学处理去处理高速运动的物体,然后让它完成比如连续扑救,或者把任务设成躲球,做连续躲避。最后,我想和大家分享一些关于未来的思考。其实今天我想强调的是,从整个人形机器人运动控制领域来看,今年我个人感觉是一个关键的时间节点——我们正从“盲走盲跳”,比如机器人跳舞这类纯运动演示,走向“感知驱动”(perceptive)的新阶段。这个趋势不只是我们团队观察到,今年年底英伟达等企业也做了相关探索,他们的方案可能更激进一些。比如我们团队的方案还用到了激光雷达(LiDAR),没有采用RGB相机的形式;但今年能看到,有些公司选择用RGB相机,通过光照和材质的合成、对齐,尽可能让仿真和真实世界中传感器的感知一致。第一步,数据重构与对齐。和之前的工作一样,先做人类运动数据的重构(retargeting);在此基础上,还要把重构后的数据与行为对应的物体(object)、物体间的位置关系做精准对齐,同时标注出机器人与物体的交互状态。具体来说,他们会优化相机畸变(distortion)、相机视角(camera view)的对齐,然后在仿真环境中做尽可能多的域随机化(randomization),让训练出的策略在真实世界中具备基础的导航和控制能力。比如VIRAL团队实现了大概50多次的连续抓取,能在两张桌子之间完成任务;还有DoorGym的工作,实现了纯Sim2Real的开门任务。第二步,技能学习。沿用我们刚才提到的任务感知型模型框架,完成复合技能的学习。所以我个人认为,未来一些偏离线(offline)的方法可能会成为突破口:当我们收集到足够多的数据后,通过离线方法结合监督学习(supervised learning)的形式,有可能把模型参数量做大,至少达到2019、2020年BERT的参数量级别,甚至向GPT的参数量级别靠拢。而更大的模型,或许能赋予机器人更长程的控制能力。另一个未来的重要方向是“规模化扩展”(scaling up)。从整个控制领域的发展来看,我们肯定希望控制器能掌握越来越多的技能。但从实际实践经验来看,无论是板载算力的限制,还是在线强化学习(online RL)的训练方式,目前都不太支持用超大模型来实现——模型参数量的限制,直接制约了技能容量和更多控制形式的探索。以上就是我的分享,谢谢大家。 -
智元机器人,核心数据曝光! 【导读】智元机器人核心数据曝光,董事长预计2025年销售额超10亿元中国基金报记者 邱德坤“智元机器人2025年出货量有望超5000台,销售收入超10亿元。”12月22日,智元机器人董事长兼CEO邓泰华在全国机器人租赁生态峰会暨擎天租平台发布会上表示。智元机器人是国内头部具身智能企业之一,估值已达独角兽企业级别。12月8日,智元机器人第5000台通用具身机器人量产下线,初步具备了产业化能力。邓泰华表示,预测整个具身智能行业会快速发展。2026年,智元机器人的出货量和销售收入将保持数倍的增长,进入更快的商业化发展阶段。 具身智能市场空间有望超过手机“布局具身智能,就是在布局未来。”邓泰华表示,具身智能的市场空间有望超过手机,未来可能成为工业领域最大的单品。2025年是国内具身智能产业快速发展的元年,智元机器人、宇树科技、云深处科技等头部具身智能企业均快速发展。12月9日,云深处科技宣布完成超5亿元C轮融资。云深处科技创始人兼CEO朱秋国表示:“2025年是云深处科技快速发展的一年,业绩实现快速增长。”邓泰华回顾智元机器人的发展历程,销售收入从2023年成立当年的仅几十万元,到2024年的数千万元,再到2025年有望超10亿元。“整个技术发展太快。没有想到发展这么快。”智元机器人合伙人、擎天租董事长姜青松在接受中国基金报等媒体采访时表示。具身智能行业快速发展已是业内共识。邓泰华表示,到2026年年底,可能会发现企业在2026年年初取得的技术优势已经落后了。姜青松预计,未来5年左右,机器人会达到一个较高的高度,可以期待普通人家里配置一台机器人从事简单工作。预计2025年国内机器人租赁市场规模超10亿元邓泰华表示,对于一个新产业而言,技术创新的快速迭代,往往伴随着商业模式创新。因为通过商业模式创新,可以更好地把新技术推向用户和各个场景。在姜青松看来,商业化租赁是机器人产业快速发展的关键路径之一。 2025年,机器人租赁市场开始兴起并成为趋势。据擎天租平台不完全统计,国内机器人租赁的市场规模在2025年将超10亿元,预计2026年不低于100亿元。擎天租CEO李一言表示,2025年,国内大部分机器人厂商还未量产,预计2026年国内实现量产的机器人厂商会逐步增多,形成一定程度的市场规模。在市场需求方面,当前国内很多人使用机器人以尝鲜、猎奇为主。李一言认为,随着擎天租等平台的深入发展,机器人会逐步成为日常化、规模化的产品。目前,机器人租赁市场还存在多项痛点,包括运营成本高、合作链路复杂、内容同质化严重等。姜青松在发布会上公布“擎天租1234战略计划”,即2026年实现引入超10家本体厂家、超200家金牌服务租赁商、超3000名内容创作者、超40万名租赁客户。擎天租平台是将高门槛的机器人使用场景,转化为类似共享充电宝的便捷租赁模式,推动具身智能行业向生态化、服务化的租赁模式演进。目前,擎天租建立了触达全国50座核心城市的租赁节点,拥有超600家服务商、超1000台设备完善产品矩阵。姜青松预计,2026年内,擎天租平台将渗透超200座城市。编辑:格林校对:纪元制作:小茉审核:陈思扬 注:本文封面图由AI生成版权声明《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。授权转载合作联系人:于先生(电话:0755-82468670) -
Mac四集群开启RDMA后推理DeepSeek V3.1 AI模型速度提高122.6% IT之家 12 月 23 日消息,科技博主 Jeff Geerling 于 12 月 18 日发布评测视频,利用苹果提供的四台 Mac Studio(搭载 M3 Ultra 芯片)搭建计算集群,实测了 macOS Tahoe 26.2 中 Thunderbolt 5 与 RDMA 技术对 AI 性能的提升。这套“豪华”集群由四台搭载 M3 Ultra 芯片的 Mac Studio 组成(两台配备 512GB 内存,两台配备 256GB 内存),通过 Thunderbolt 5 连接,构建了总容量达 1.5TB 的统一内存池,硬件总价值近 4 万美元(现汇率约合 28.2 万元人民币)。 在多机集群中,节点间的通信速度往往决定了整体性能。传统的以太网连接通常受限于 10Gb/s 的带宽,而此次测试启用的 Thunderbolt 5 支持将带宽上限提升至 80Gb/s。 更为关键的是,苹果在新系统中引入了 RDMA 技术。该技术无需经过对方 CPU 的繁琐处理,允许集群中的某个 CPU 节点直接读取其他节点的内存数据。这意味着四台 Mac 的内存资源被整合成一个巨大的共享池,极大地降低了延迟,为运行单个设备无法承载的超大语言模型(LLM)提供了硬件基础。Geerling 使用支持 RDMA 的开源工具 Exo 与不支持该技术的 Llama.cpp,对比测试大模型推理速度。在运行 Qwen3 235B 模型时,单节点下 Llama.cpp 略占优势;但扩展至四节点后,Llama.cpp 性能跌至 15.2 tokens/s,而开启 RDMA 的 Exo 则升至 31.9 tokens/s,性能实现翻倍。在测试 DeepSeek V3.1(671B 参数)时,Exo 的推理速度从单节点的 21.1 tokens/s 稳步提升至四节点的 32.5 tokens/s,增幅 54.03%。在相同四节点情况下,Llama.cpp 的推理速度为 14.6 tokens/s,开启 RDMA 后提升 122.6%。 测试还成功运行了万亿参数级别的 Kimi K2 Thinking 模型,四节点速度达到 28.3 tokens/s,验证了该方案在处理超大规模模型时的可用性。尽管测试结果令人振奋,但该方案仍存在一定门槛。首先是约 4 万美元的高昂成本,虽相比企业级 H100 集群具有价格优势,但对个人用户依然遥不可及。其次是 Thunderbolt 5 目前仅支持菊花链连接,缺乏专用交换机,限制了集群的无限扩展;此外,测试过程中也出现了基准测试报错等软件稳定性问题。不过,随着未来 M5 Ultra 芯片及 GPU 神经加速器的引入,结合 SMB Direct 等潜在功能的开放,Mac 集群有望成为 AI 研究机构和高带宽需求团队的高效解决方案。IT之家注:RDMA 全称为 Remote Direct Memory Access,直译为远程直接内存访问,是一种允许一台计算机直接读取或写入另一台计算机内存的技术。就像你不用打电话让同事发文件,而是直接把手伸进他的抽屉拿文件一样,过程中不需要对方的大脑(CPU)参与,因此速度极快、延迟极低,常用于高性能计算集群。Thunderbolt 5(雷雳 5)是英特尔发布的新一代连接标准,传输速度翻倍达到了 80Gb/s(特定模式下可达 120Gb/s),能像高速公路一样快速传输海量数据。雷雳 5 集群是指 macOS 现已支持多台电脑通过雷雳 5 端口互联,可将参数庞大的 AI 大语言模型分布运行在多台电脑上,不仅能够分担运算负载,还能够共享内存等硬件资源,同时系统还提升了 AI 运算的整体性能。 -
快手遭黑灰产攻击 直播间现大量色情内容 2025年12月22日晚22时左右,快手平台遭遇大规模网络攻击,大量直播间短时间内集中出现涉黄内容,引发用户集中举报和舆论哗然。 据用户反映,当晚快手多个直播间出现播放淫秽影片、主播裸露低俗表演等违规内容,部分直播间单场观看人数甚至逼近10万人。有网友称"举报都没用"、"辣眼睛",平台审核机制一度失效。 对22晚平台异常情况,快手回应称,当晚(12月22日)22时左右,平台遭到黑灰产攻击,目前已紧急处理修复中,平台坚决抵制违规内容,相应情况已上报给相关部门,并向公安机关报警。 北京公安局海淀分局接线工作人员表示,目前已接到多个群众报案,正在了解相关情况。截至12月23日凌晨,快手已封禁大量涉事账号,直播功能逐步恢复正常。(汉雨棣) -
快手回应大量色情内容刷屏;比亚迪回应技术研发人员涨薪丨邦早报 【快手回应大量色情内容刷屏:遭到灰黑产攻击,已报警】12月22日晚快手突发严重网络安全事件。大量露骨色情内容短时间内侵入多个直播间,引发用户恐慌与舆论哗然。大量用户反馈12月22日晚间出现涉黄内容泛滥、低俗擦边直播等问题,部分直播间观看量超10万,平台审核机制疑似失效。快手官方于23日凌晨回应称,当晚22时左右,平台遭到黑灰产攻击,目前已紧急处理修复中,平台坚决抵制违规内容,相应情况已上报给相关部门,并向公安机关报警。(新浪科技)【字节大模型关键人物被曝加入腾讯】前字节Seed大模型视觉基础研究团队负责人冯佳时已经加盟腾讯,担任腾讯AGI研究中心多模态团队负责人。据公开信息,冯佳时2007年本科毕业于中国科学技术大学,硕士毕业于中国科学院自动化研究所,博士毕业于新加坡国立大学。曾任新加坡国立大学电子与计算机工程系助理教授,机器学习与视觉实验室负责人。 冯佳时于2019年加入字节跳动,与项亮、王明轩、陈卓、严林等人一同被部分媒体誉为「2024年字节大模型关键8人」。在去年字节跳动的Top Seed人才计划宣传中,冯佳时也位列字节大模型关键8人之中,并担任资深导师一职。坊间还有八卦称,自2023年起,冯佳时经常为张一鸣提供一对一的AI相关辅导。今年8月25日,冯佳时被曝不再担任字节Seed大模型视觉基础研究团队负责人。(鞭牛士)【亚免税销售额连续3日破亿元】1.18亿元、1.05亿元、1.08亿元。12月21日,记者从三亚市商务局获悉,海南自贸港全岛封关运作启动以来,三亚免税消费市场持续火爆,连续三日单日销售额均突破亿元大关。三亚市商务局数据显示,12月18日封关首日,三亚全市免税销售额达1.18亿元;12月19日,三亚全市免税店单日销售额达1.05亿元,同比增长45.8%;12月20日,三亚全市免税店单日销售额达1.08亿元,同比增长47%。今年以来,三亚免税销售额累计已突破200亿元。(北青网) 【中国内地新增70位亿万富豪,98%中国亿万富豪都是白手起家】日前,瑞银发布了第11份《亿万富豪报告》,透视拥有超过10亿美元资产的人士的财富版图。数据显示,2025年,亿万富豪的人数增至2919人,总财富达到创纪录的15.8万亿美元,增幅为13%。其中,亚太区亿万富豪人数从981人增至1036人,增幅居全球之首。中国内地2025年新增70位亿万富豪,目前共有470人,仅次于美国。值得注意的是,2025年,全球196位白手兴家的亿万富豪财富新增了3865亿美元,仅次于2021年的360位。他们来自营销软件、基础设施、餐饮业、遗传学、液化天然气等多元领域,代表人物包括Colossal Biosciences创始人Ben Lamm,基础设施投资公司Stonepeak Partners联合创始人Michael Dorrell,中国蜜雪冰城的张氏兄弟等。事实上,白手兴家型亿万富豪数量持续上升的趋势已持续多年。从增长数据来看,大中华区是全球亿万富豪人群的最大增长引擎——中国内地亿万富豪财富总额达到1.8万亿美元,同比增长22.2%。更特别的是,上述人士中98%是白手兴家的创业企业家,与大部分中国创一代的特点一致。(红星新闻)【卢伟冰确认小米17 Ultra将涨价,称定价压力非常大】小米集团总裁卢伟冰在近日举办的一场直播互动活动中明确表态,新一代旗舰机型小米17 Ultra将迎来价格上调。谈及内存价格疯涨对小米17 Ultra带来的影响,卢伟冰称,“这是我最近很头疼的一个问题。”他提到,过去的三年,AI是爆发式的增长,造成很多产能要去做HPC(高性能计算)。以前手机是整个内存里最主要的一个需求方,但现在高性能的算力需求已经超过手机。“这几年其实是没有新增的产能,到2027年底可能才有产出。”(杭州日报)【俞敏洪再谈董宇辉离职:仍喊他“孩子”,对目前结果感到满意】12月21日,俞敏洪在北京的一次讲话中再次谈到董宇辉离职事件。俞敏洪称,对目前结果感到满意,分开是共同发展,不是你死我活。值得注意的是,俞敏洪在讲话中仍然称呼董宇辉为“孩子”。(鲁中晨报)【罗永浩年度科技大会千元票秒光】12月22日,@罗永浩的十字路口 “2025年度科技创新分享大会”门票正式在开售,其中最高档位1000元门票瞬间售罄,其余300元至800元不等的五档门票也迅速告急。(新浪财经) 【传百度启动新一轮MEG调整,技术研发由赵世奇负责】据报道,百度MEG12月22日在内部启动新一轮调整,用户侧产运由李小婉负责,技术研发由赵世奇负责;风控、效能及数据相关由王岳统筹。据悉,业务调整后,百度所有与搜索相关的业务,包括PC端与移动端,均已合并统一管理,搜索侧全合在了一起。对于上述调整,截至发稿百度方面未回应媒体问询。(新浪科技)【传陈震小红书账号解封?小红书辟谣:陈震账号始终处于禁言状态】12月22日,小红书发布《关于账号“陈震同学”违规情况的处置声明》。说明提到,近期,税务部门公布“网络车评人陈震偷税”案件调查处理结果。平台依据相关法律法规及平台规则,第一时间对涉案主体开设的“陈震同学”等账号采取禁言处置措施。自案件调查结果公布至今,上述账号始终处于禁言状态,相关功能限制严格遵照法律法规及平台规则执行。(大象新闻) 【MiniMax稀宇科技副总裁薛子钊:全球仅四家公司在三模态均达到领先水平】MiniMax稀宇科技副总裁薛子钊表示,目前全球仅四家公司在语言、视觉、声音三个模态均有全球领先模型,分别是OpenAI、谷歌、MiniMax和字节跳动。公司相信国内大模型公司被严重低估,未来将提供更高性价比的智能服务。(新浪科技)【比亚迪回应“技术研发人员涨薪”:情况属实】针对“比亚迪技术研发人员涨薪”传闻,比亚迪方面12月22日回应称,“情况属实”。但对于消息中“大部分涨薪500-1000元、少部分涨薪2000-3000元”等内容,比亚迪未作出表态。据了解,2024年比亚迪曾发布通知,依据员工的工作业绩和工作表现,进行加薪、晋级和奖金分配。公司设立了每年两次的薪资调整机会与一次晋升机会,确保员工的付出能够得到及时、公正的回报。(财联社)【京东官方辟谣:谨防假冒礼品卡诈骗】12月22日,京东官方发言人发布微博称,近期有不法分子冒充京东,邮寄低价值商品并夹带假“提货卡”“红包卡”等,诱导用户扫码添加虚假客服实施诈骗。京东强调从未开展此类活动,请用户切勿轻信,谨防受骗。(北晚在线)【智元机器人邓泰华:今年销售收入有望超10亿元】12月22日,在全国机器人租赁生态峰会暨擎天租平台发布会上,智元机器人创始人、董事长、CEO邓泰华透露,公司今年有望实现5000台机器人的出货,销售收入有望超过10亿元。明年起,机器人出货量与销售收入每年还有望保持数倍增长。在他看来,具身智能市场空间有望超过手机数量,再乘以单车的价格,未来将成为工业品领域最大的单品。(界面新闻)【网易《蛋仔派对》小米渠道版手游将于明年2月停运】12月22日,网易手游《蛋仔派对》官方宣布,由于与小米渠道合作运营策略的调整,《蛋仔派对》小米渠道版本手机游戏将于2026年2月23日15时在小米平台终止运营,角色资产找回服务已同步开启。(IT之家) 【机构:TikTok重返巴西应用下载榜首】12月22日,据AppMagic的数据统计,TikTok在2025年11月以460万次的安装量重返巴西应用下载榜首。这是自今年1月以来,该应用首次重回榜首。据介绍,在竞争激烈的应用市场中,游戏Block Blast!表现突出,排名上升21位至第三名;Shein则从第16位跃升至第8位;AI搜索应用Seekee也成功从第17位进入前十。(新浪财经)【苹果12月22日正式关闭iOS 18系统】12月22日,近日,苹果正式停止为iPhone 11及更新机型提供iOS 18.7.3安全更新。此前用户可通过注册Beta版获取,但此路径现已被关闭。这意味着仍停留在iOS 18的新机型用户,若想升级系统,唯一选择是直接更新至最新的iOS 26。需要注意的是,苹果已关闭系统降级通道,一旦升级至iOS 26将无法再退回iOS 18。(IT之家)【报道称OpenAI今年付费产品的计算利润率提高】据报道,OpenAI努力保持其在人工智能领域领先地位的同时,今年付费产品利润率有所提高。据报道,OpenAI提高了其“计算利润率”,这一内部指标为扣除为企业和消费者产品付费用户运行模型的成本后收入所占比例。报道援引一位知情人士称,截至10月OpenAI的计算利润率达到70%,高于2024年底的52%,是2024年1月的两倍。OpenAI的发言人表示,公司没有公布这些数据,并拒绝进一步置评。(科创板日报)【FF:旗下FX Super One预量产车在加州汉福德工厂下线】12月22日,Faraday Future(纳斯达克代码:FFAI,简称FF)官微宣布,FX Super One预量产车已在加州汉福德工厂下线。(新浪财经)【保时捷将关停所有自建充电站,总计约200家】12月22日,保时捷中国确认:该公司自建充电网络将于2026年3月1日起逐步停止运营,总计约200家充电站。记者获悉的一份《停止保时捷尊享充电的用户通知》显示,保时捷尊享充电服务(含所有保时捷自建高功率直流充电站)将停止提供,并逐步从保时捷App及保时捷微信小程序的充电地图中移除。保时捷中国对记者称,从2026年3月1号开始,保时捷将对尊享充电服务设施进行有序地裁撤。此后,保时捷将转向与行业头部充电运营商进行深度合作。(第一财经)【意大利监管机构对苹果罚款上亿美元】12月22日,意大利反垄断监管机构表示,已对苹果公司及其两家子公司处以9860万欧元(约合1.1553亿美元)的罚款,原因是它们涉嫌滥用市场支配地位,在iOS移动应用分发领域占据主导地位。(第一财经)【日本拟5年投1万亿日元助力研发本土AI】据一位知情人士周日透露,日本政府计划在五年内提供约1万亿日元(约合63.4亿美元)的资金支持,助力一家筹备中的新公司研发本土人工智能技术。该知情人士表示,这家新公司将由软银集团等约10家企业联合组建,旨在通过官民合作模式,打造日本国内规模最大的基础人工智能大模型。据其介绍,这项为期五年的扶持计划将于2026财年(明年4月启动)正式实施。(新浪财经) 【飒智智能完成数亿元A++和A+++轮融资】近日,上海飒智智能科技有限公司宣布连续完成A++、A+++两轮融资,累计金额达数亿元,由海通开元、国元股权联合投资。(睿兽分析戳此处查看更多)【千诀科技完成近亿元Pre-A++轮融资】12月22日,北京千诀科技有限公司宣布完成近亿元Pre-A++轮融资。本轮融资由六家知名投资机构及老股东共同参与。(睿兽分析戳此处查看更多)【易择智擎完成数千万元种子轮融资】近日,专注于新一代具身智能(Embodied AI)服务机器人研发的初创公司——易择智擎宣布完成种子轮融资,由光点资本、梅花创投、清石资管共同投资。(睿兽分析戳此处查看更多)【诺亦腾机器人完成Pre-A+轮融资,启明创投领投】诺亦腾机器人(Noitom Robotics)近日宣布完成Pre-A+轮融资。本轮融资由启明创投领投,五源资本、君联资本等机构参与投资,经纬创投、英诺天使基金追加投资,并实现超额认购。完成由阿尔法公社领投的Pre-A轮以及本轮融资后,诺亦腾机器人(Noitom Robotics)累计募集资金已达数亿元人民币。(睿兽分析戳此处查看更多)【上海蓝图航空完成5亿元融资】近日,上海蓝图航空对外宣布正式完成5亿元人民币A轮融资,此轮投资由玖树创投领投。公开资料显示,上海蓝图航空科技有限公司成立于2025年初,致力于纯电动飞行汽车的自主研发、飞行培训与低空出行服务运营。(睿兽分析戳此处查看更多)【知原药业完成近3亿元Pre-IPO轮融资】近日,知原药业宣布完成近3亿元Pre-IPO轮融资。本轮融资由创新工场领投,凯辉基金等机构跟投。(睿兽分析戳此处查看更多) 【全国首个开放式机器人租赁平台“擎天租”在上海发布】12月22日,全国首个开放式机器人租赁平台“擎天租”在上海发布。据了解,平台目前已覆盖全国50个核心城市、超600家服务商,提供多个品牌、多种型号的机器人租赁服务,租金价格从200元到超万元不等。预计2026年,平台租赁服务将覆盖全国超200个城市,用户可通过小程序、商城等渠道直接下单。全国首个开放式机器人租赁平台标志着机器人租赁服务从零散化走向生态化,将高门槛的机器人使用场景转化为类似共享充电宝的便捷租赁模式。(央视财经)【卢伟冰首秀小米17 Ultra真机:小米史上最薄的Ultra,四款配色公开】小米17 Ultra手机将于12月25日发布,小米集团合伙人、总裁,手机部总裁,小米品牌总经理卢伟冰12月22日首次晒出小米17 Ultra真机。卢伟冰透露,小米17 Ultra是小米史上最薄的Ultra机型,厚度8.29mm,相比前代减薄了11.3%。(IT之家) 【阿里旗下夸克AI眼镜再推两款新品】在阿里千问C端事业群成立后,夸克AI眼镜12月22日正式开启两款新品预售,其中G1风尚眉框款最低到手价1999元。同时,旗舰款S1系列也推出全新圆框玳瑁配色。核心硬件配置上,G1与旗舰S1系列保持一致,配备双旗舰芯片双系统、五个麦克风阵列加骨传导、大振膜高性能喇叭声学硬件等。(科创板日报) 【华为nova 15系列搭载前后双红枫镜头】12月22日下午,华为nova 15系列发布,该机首次前后置均搭载红枫原色镜头,前置搭载5000万人像大底主摄,后置升级为5000万全RYYB红枫影像系统。(第一财经) 【波士顿动力公司将在CES上首次亮相新款Atlas人形机器人】现代汽车集团(Hyundai Motor Group)周一表示,将在即将举行的消费电子展(Consumer Electronics Show)上概述加速人工智能机器人商业化的战略,该集团旗下的波士顿动力公司(Boston Dynamics)将在消费电子展上首次展示下一代仿人机器人Atlas。(IT之家) 【千问App发布2025十大AI提示词,股票位列榜首】12月22日,千问App发布“2025十大AI提示词”榜单,揭示了2025年人们使用AI的十大高频场景,其中问得最多的三类问题为股票、八字和情感咨询。本次入选的十大高频提示词分别为:股票、八字、情感咨询、朋友圈文案、景点推荐、双色球号码、失眠、解答这道题、离婚财产分割、人生的意义。作为人机交互的桥梁,提示词(prompt)不仅是用户对AI的指令,更是社会心理的晴雨表。这份榜单显示,用户对AI的角色认知正从单一工具向多元伙伴演变。(新京报)【纯电大三排SUV 11月销量创历史新高】中汽协、乘联会零售量最新数据显示,2025年11月纯电大三排SUV销量46209台,插混销量40845台,增程销量29902台,燃油销量22398台。纯电大三排SUV销量环比上升16%,创历史新高。继9月首次超过增程、燃油、插混后,纯电大三排销量已连续三个月排名所有动力形式榜首。11月纯电大三排SUV销量在蔚来新ES8、乐道L90、特斯拉Model Y L等车型推动下,较其他动力形式的销量领先优势持续拉大。增程销量则持续遇冷,连续五个月同比下滑。(财经网)【游戏产业多项数据创历史新高】12月19日,2025中国游戏产业年会在上海召开。此次大会上发布的《2025年中国游戏产业报告》显示,中国游戏产业实现稳步增长,核心数据均创历史新高。2025年,国内游戏市场实际销售收入预计达3507.89亿元,同比增长7.68%;用户规模增至6.83亿,同比增长1.35%。(每日经济新闻)