找到
907
篇与
互联网
相关的结果
- 第 16 页
-
45亿互联网"红包大战"!AI巨头撒钱推应用抢市场 马年春节临近,互联网“红包大战”已硝烟四起,但今年的主角换成了AI应用。巨头们狂砸45亿,千问、元宝、文心、豆包正面交锋,这几天你薅到羊毛了吗?腾讯率先打响第一枪,官宣旗下元宝App将发放10亿元现金红包,可直接微信提现。百度文心随后抛出5亿元红包福利,将红包玩法与自家AI深度绑定。阿里则选择让千问以30亿元“请客计划”免单请全国人民吃喝。字节跳动旗下火山引擎,则早已锁定央视春晚的合作。榜单厮杀更直观,元宝开启活动后14小时登顶苹果免费榜,千问上线即反超,竞争白热化。但是战役打得激烈,战场却仍是熟悉的配方,AI大战最终还是落到“点奶茶” 上:爆单、临时闭店、等不到的外卖,以及奶茶店里堆成山的小票订单,复刻着当年外卖大战的热闹。巨头们不惜重金,想给用户上一节免费AI“教育课”,赌的是谁能最早将AI从聊天框和生成图片中解放出来,让它真正渗透进购物、社交、娱乐等日常生活的毛细血管。比如想在千问免单喝奶茶,需要先绑定淘宝、开通定位,想在AI应用里串起阿里生态链的企图心,也是摆在了明面上。用户图薅羊毛的快乐,但心态也最为“清醒”:如果只是靠福利吸引流量,却在AI核心体验上偷工减料,比如对话答非所问、功能华而不实、解决不了实际问题,不仅留不住用户,反而透支行业口碑。真正的赛场在红包褪去之后,谁的AI能真正解决问题、用着顺手,谁才能真正抓住用户。而这场烧钱游戏里,商业营销到底是科技创新的助推器,还是只顾流量的腐蚀剂?编辑: 陈佳雯责编: 傅群 -
当AI技术涌入短剧漫剧创作 会给数字文创产业带去哪些变化? 活动现场封面新闻记者 李雨心 实习生 王怡彤当AI技术逐步打破内容创作的专业壁垒,会给数字文创产业带来什么样的变化?也许,如今层出不穷的AI短剧、AI漫剧、AI歌曲等作品,正传递出AI在剧本创作、数字人驱动、动态漫生成、音乐作曲等领域所带来的技术变革。2月7日,“第七届IGS·全球数字文创生态大会”在成都举行。据介绍,大会作为“中国(成都)国际数字娱乐博览会”2026年度系列活动的首站,聚焦AI技术如何赋能数字内容生产、新消费场景搭建与产业生态进化等前沿议题,汇聚行业智慧,共探成都数字文创产业发展新路径。从“AI赋能,生态共融——科技驱动下的数字文创产业新纪元”,到“从流量到留存,情感链接下的新消费场景”,现场围绕这两大话题,相关行业代表登台,分享了自身所在的企业如何通过AI工具,实现内容创意的快速验证与高效量产,以应对市场对海量、优质内容的迫切需求。其中,新飞翔集团董事长刘鹏飞表示,将在2026年重点推出“OPS系统、非遗大模型、AI漫剧创作助手”三大AI工具集群。 活动现场“AI的发展对于动画领域的影响是非常大的。”现场,星阅辰石董事长王磊谈道,他们也在自己的产品中作出尝试。“比如,从去年开始,在正片片尾免费附赠一段AI漫剧,来不断试探市场反应与提高自己的制作水平。”同时,遥望科技产品副总裁周建华表示,AI能够在正式的工作中解放时间、提高效率。“我们团队内部鼓励所有员工学习运用,在未来我们需要一直探索AI时代,实现AI自由。”在游戏领域,AI又会带来怎样的冲击?来自成都的龙渊网络联合创始人李龙飞透露,玩法正在驱动游戏行业进步,在传统的游戏工业化流程之外,企业计划开展“一人一游戏”的探索。“AI对游戏生产方面,我们内部在探索一个人完成游戏制作。此外,我们也在探索真正的AI时代游戏。”值得一提的是,大会作为“中国IGS数博会”全年活动的序幕,拉开了年度全国巡展的篇章。据现场透露,IGS将于5月在海南举办“IGS×CCK海南国际数字娱乐博览会”,10月在成都举办“第七届IGS·中国(成都)国际数字娱乐博览会”。图据主办方 -
早报|千问免单活动突破1000万单/Google确认AirDrop互传将支持更多机型/快手回应被罚1.1亿元 千问「30 亿免单」引发爆单与卡顿,多地奶茶门店暂停接单小米 YU7 GT 完成申报:千匹马力、全黑化设计曝英伟达今年不会推出游戏显卡新品,优先保障 AI 芯片供应快手回应因低俗内容被罚 1.191 亿元:将全面整改库克罕见详谈继任规划:领导层交接「自然且必要」Google 确认 AirDrop 互传将扩展至更多 Android 机型曝影石手持云台相机上半年发布:双摄加持,正面硬刚大疆 Pocket亚马逊今年将斥资 2000 亿美元投入 AI 基建「美国高考」SAT 今年实施最严禁令:智能眼镜全面禁止入场丰田宣布换帅:财务主管近健太将接任 CEOReddit CEO:在 AI 时代保持「人类性」是平台核心竞争力马斯克:未来 30 个月,AI 最经济的部署地点将是太空55.98 万元,理想首款「具身智能」旗舰 SUV L9 Livis 发布曝 iPhone 18 Pro Max 电池容量突破「5 字头」滴滴发布 2026 春运预测:春运打车将迎四次高峰预制菜国标征求意见发布:禁止使用防腐剂,标签需更透明2026 春节期间部分快递停运周末也值得一看的新闻 千问「30 亿免单」引发爆单与卡顿,多地奶茶门店暂停接单 昨天,千问官方发表微博微博称,「30 亿免单」活动上线 9 小时订单量已突破 1000 万单。据悉,该活动于昨天早间正式开启,千问 App 推出 25 元无门槛免单卡,用户可通过更新 App、邀请新用户等方式最多获得 21 张免单卡。由于活动覆盖点奶茶、外卖、年货等场景,短时间内吸引大量用户参与。 高流量直接导致服务端压力骤增。部分用户反馈千问 App 出现卡顿、无法正常下单或支付,活动页面提示「活动太火爆,请稍后再试」。千问随后回应称正在紧急加资源保障顺畅。配送端同样受到冲击。《都市现场》消息显示,江西南昌多名骑手表示当天单量激增,「根本忙不过来」;不少消费者反映订单长时间无人接单,甚至出现预计配送时间超过 1 小时的情况。部分奶茶门店因爆单在外卖平台显示「本店已休息」,实测广州部分奶茶店也临时停止了淘宝闪购店铺的营业。 得益于活动的火爆,千问 App 昨天登上 App Store 免费 App 榜首,超越元宝和豆包。尽管出现卡顿与爆单,活动仍在持续推进。千问表示免单卡可使用至 2 月 23 日,提醒用户「分散下单」。活动的第二波将于 2 月 13 日开启,用户可领取现金红包,最高 2888 元。小米 YU7 GT 完成申报:千匹马力、全黑化设计 昨天,工信部第 404 批《道路机动车辆生产企业及产品公告》中,出现了小米 YU7 GT 的身影。申报信息显示,YU7 GT 车身尺寸为长 5015 mm、宽 2007 mm、高 1597 mm,轴距 3000 mm,相比现售 YU7 在长度与宽度上略有增加,高度略低,整体姿态更低趴,强化了运动属性。整车采用全车身黑化设计,这是普通版 YU7 未提供的配色,黑色或将成为 GT 版本的专属或首发方案。车身多处加入红色「GT」标识,并提供碳纤维外后视镜、后扰流板、鸭尾式尾翼等空气动力学套件选装。动力系统方面,YU7 GT 搭载由小米汽车与汇川科技联合开发的双电机系统,前轴为与 SU7 Ultra 同款的 288 kW 电机,后轴为峰值功率 450 kW 的单 V8s 电机,综合输出约 1004 马力,最高时速可达 300 km/h。轮胎规格升级为前 265/40 R21、后 295/35 R21,以匹配其高性能定位。多方信息显示,该车已在纽博格林北环进行高强度测试,预计将配备主动液压悬架系统,可在赛道模式下降低车身高度,并支持动力分配调节,目标直指量产 SUV 圈速纪录。市场定位方面,YU7 GT 将对标特斯拉 Model Y 高性能版及保时捷 Cayenne Turbo GT,预计售价区间在 40 万至 50 万元之间。小米汽车自去年 4 月首款车型交付以来累计交付量已突破 50 万辆,并在去年第三季度实现盈利。今年雷军曾表示,小米汽车 2026 年交付目标将提升至 55 万辆。YU7 GT 的推出将进一步强化小米在高性能电动车领域的产品矩阵与品牌形象。 相关阅读:小米 YU7 GT 来了!千匹马力 + 纽北调校,售价预计 40 万元曝英伟达今年不会推出游戏显卡新品,优先保障 AI 芯片供应 据《The Information》报道,英伟达今年将不会推出面向玩家的新款游戏显卡,原因是全球存储芯片短缺持续加剧,而公司正优先保障其 AI 芯片业务的供应需求。若消息属实,这将是英伟达 30 年来首次在全年内没有发布新一代游戏 GPU。报道指出,受 AI 服务器需求激增影响,存储芯片供应紧张,价格不断上涨。英伟达已削减现有 GeForce RTX 50 系列 GPU 的产量,零售端价格在过去一年已明显上升。英伟达发言人表示「GeForce RTX GPU 的需求强劲,存储供应受限」,并称公司正与供应商合作以最大化可用产能。英伟达原计划今年推出基于 RTX 50 系列的增量更新版本,代号「Kicker」,设计工作已完成,但公司在去年 12 月决定推迟发布,未给出新的时间表。此举也将顺延下一代 RTX 60 系列的量产节奏,该系列基于 Rubin 架构,原定于 2027 年底进入量产阶段。报道提到,尽管游戏 GPU 业务仍保持良好表现,但其在英伟达整体营收中的占比已大幅下降。今年前九个月,游戏业务收入占比约为 8%,而在 2022 年同期,这一比例为 35%。相比之下,AI 芯片业务的利润率更高,成为公司优先保障的方向。AMD 方面暂无可直接对标英伟达高端产品的新品计划,其策略仍聚焦于中端价位段的性价比产品,使英伟达在高端市场的竞争压力相对有限。快手回应因低俗内容被罚 1.191 亿元:将全面整改 据网信北京发布的消息,昨天,快手因平台出现大量色情低俗内容,被北京市互联网信息办公室依法处罚。北京市互联网信息办公室依据《中华人民共和国网络安全法》《中华人民共和国行政处罚法》等法律法规,对快手作出警告并处以 1.191 亿元人民币罚款,同时责令其限期改正、依法依约处置账号,并从严处理相关责任人。监管部门指出,快手未履行网络安全保护义务,未及时处置系统漏洞等安全风险,对用户发布的违法信息未采取立即停止传输、消除等措施,情节严重、影响恶劣。监管部门表示,将持续加大网络执法力度,督促平台严格落实主体责任,保障网络安全与用户合法权益。在处罚公布后,快手发布致歉声明,向公众表达歉意,并强调将进行全面整改。库克罕见详谈继任规划:领导层交接「自然且必要」 据彭博社报道,苹果 CEO Tim Cook 在昨天的全员大会上,将「继任规划」作为核心议题之一,并罕见以高度坦诚的方式回应外界对其退休时间表的持续关注。库克在会上表示,他「花很多时间思考 5 年后、10 年后、甚至 15 年后谁会坐在这个房间里」,并称自己对继任问题「近乎痴迷」。他强调,领导层交接是企业治理的自然过程,近期多位高管退休「并非意外」,而是苹果长期规划的一部分。现任硬件工程高级副总裁约翰·特努斯(John Ternus)已成为最被看好的下一任 CEO 人选。他目前负责所有硬件工程工作,并在今年 1 月被曝已成为苹果内部所有设计工作的「执行赞助人」,进一步强化其在公司内部的战略地位。在谈及继任时,库克并未透露自己的具体退休时间,但其多次强调「年龄带来的自然变化」与「提前规划的重要性」,被外界视为对未来几年可能发生的领导层更迭的前瞻性暗示。与此同时,苹果即将在今年 4 月迎来创立 50 周年。库克在多场内部会议中都显得格外感性,称自己「最近格外反思苹果的过去与未来」,并承诺届时会有纪念活动。Google 确认 AirDrop 互传将扩展至更多 Android 机型 据《Android Authority》报道,Google 已确认,此前仅限 Pixel 10 系列使用的「Quick Share 与 AirDrop 互通」功能,将在今年进一步扩展至更多 Android 设备。Google Android 平台工程副总裁 Eric Kay 表示,团队已投入大量资源确保 Quick Share 能与 iPhone、iPad 与 MacBook 的 AirDrop 协议稳定互通,并已在 Pixel 10 上完成验证。Kay 强调,今年将与更多合作伙伴推动该功能覆盖更广泛的 Android 设备,并透露「很快会有令人兴奋的公告」。报道指出,Google 之所以能在不依赖 Pixel 系统组件的情况下扩展互通范围,是因为 Google 已将 Quick Share Extension 从系统级 stub 升级为可独立更新的 Play 商店 Apk,使 AirDrop 互通成为 Android 生态层级的能力,而非 Pixel 专属功能。目前已确认的互通能力包括: Android 可直接发现附近的 iPhone、iPad、Mac,并进行全分辨率照片与大型文件传输; 传输采用蓝牙与 Wi‑Fi Direct 的点对点直连,不经云端,提高隐私与速度; 支持双向传输,iPhone 也能通过 AirDrop 将文件回传至支持的 Android 设备。 Google 也透露,双方合作正延伸至更多跨平台体验,包括更完整的资料迁移工具、更稳定的 RCS 跨平台消息体验,以及针对未知追踪器的跨系统警示机制。这与去年 Google 与苹果共同宣布的跨平台数据迁移合作方向一致。不过,目前互通仍有部分限制,例如 iPhone 端需手动将 AirDrop 设为「所有人(10 分钟)」,Android 才能搜索到苹果设备;此外,首批扩展机型预计包含三星旗舰与搭载最新高通骁龙处理器的机型。曝影石手持云台相机上半年发布:双摄加持,正面硬刚大疆 Pocket 爱范儿获悉,影石(Insta360)的手持云台相机将于今年上半年正式发布,并打破传统单调配色,提供多个颜色版本。综合目前流出的谍照与专利信息,这款新品或将采用模块化设计,允许用户将镜头与屏幕部分进行拆分,以适应更多样的拍摄视角和拓展玩法。在影像规格上,新机有望搭载「广角 + 长焦」的双摄像头组合,若传闻属实,这意味着行业将迎来首款具备长焦光学变焦功能的手持云台相机。此前,外媒曾曝光一张疑似双摄云台相机的测试照片,外界一度猜测其为大疆的 Pocket 4,但影石创始人刘靖康随后在社交媒体回应称「有没有可能不是大疆的」,侧面证实了自家新品的存在。 相关阅读:vivo、影石围猎大疆,Pocket 还能独占多久?亚马逊今年将斥资 2000 亿美元投入 AI 基建 据《The Information》和 CNBC 报道,昨天,亚马逊公布今年资本支出将大幅提升至 2000 亿美元,主要投向人工智能基础设施、芯片、自研数据中心以及卫星互联网项目 Leo。受消息影响,亚马逊股价在盘后交易中一度下跌超过 7%,市场对其激进投入节奏表现出明显担忧。去年,亚马逊资本支出为 1318 亿美元,今年的预算不仅远高于去年,也超过 Google 母公司 Alphabet 今年预计的 1750 亿至 1850 亿美元区间。Meta 此前也表示,其 2026 年资本支出可能接近翻倍至 1150 亿至 1350 亿美元,显示大型科技公司在 AI 基础设施上的竞争仍在加速。亚马逊 CEO Andy Jassy 在财报电话会上强调,他对这笔巨额投入的长期回报「有信心」,并表示这并非「某种堂吉诃德式的营收冲动」。他指出,亚马逊正面临「非常高的」AI 计算需求,必须持续扩建数据中心、网络设备与芯片能力,以满足客户在生成式 AI 和企业级 AI 应用上的增长。AWS 在去年第四季度实现 356 亿美元营收,同比增长 24%,增速较上一季度的 20% 明显提升,也是自 2022 年以来最快的季度增长。Jassy 表示,如果 AWS 拥有更多算力产能,其增长本可以更快。AWS 在 2025 年新增近 4 吉瓦计算能力,并预计将在 2027 年底前将这一数字翻倍。在电话会上,分析师多次追问亚马逊何时能看到投资回报。Jassy 回应称,AI 市场正呈现「杠铃结构」:一端是 AI 实验室,另一端是将 AI 用作生产力工具的企业,中间则是正在构建 AI 应用的企业群体,而「中间部分很可能成为最大、最具韧性的市场」。尽管市场短期反应谨慎,但亚马逊认为其在云计算与 AI 基础设施上的持续扩张,将为未来数年的增长奠定基础。「美国高考」SAT 今年实施最严禁令:智能眼镜全面禁止入场 据 Android Authority 报道,美国大学理事会(The College Board)近日更新 SAT 考试规则,将在今年的考试中实施迄今最严格的设备禁令,智能眼镜被全面列入违禁清单,无论是否具备处方功能都不例外。Android Authority 指出,随着高分辨率微型屏幕与波导光学技术的发展,现代智能眼镜的隐蔽性大幅提升,佩戴者可在不被监考察觉的情况下查看信息,这成为考试监管的主要隐患。College Board 表示,智能眼镜的潜在作弊风险已不可忽视,因此将其与智能手机、智能手表、耳机等设备一并禁止带入考场。新规执行标准极为严格: 若考生佩戴的眼镜具备智能功能,即便用于视力矫正,也必须在入场前更换为普通光学镜框; 监考人员不会接受「承诺关机」等理由; 无法现场更换眼镜的考生将被取消当日考试资格,只能改期重考。 随着智能穿戴设备能力不断增强,考试机构正加速更新监管措施,以应对技术带来的作弊方式演变。College Board 此前已禁止智能手机、智能手表、健身手环等设备,本次禁令进一步收紧了可携带物品范围。丰田宣布换帅:财务主管近健太将接任 CEO 据路透社报道,丰田汽车宣布将进行高层调整:执掌公司三年的现任 CEO 佐藤恒治将卸任,由现任首席财务官近健太自今年 4 月 1 日起接任 CEO。佐藤恒治将转任副董事长兼首席产业官。此次调整与丰田近期因拟收购子公司丰田工业而承受的外部压力同步发生。该收购案被部分少数股东批评定价偏低、透明度不足,市场此前并未预期丰田会在此时更换管理层。丰田在公布第三财季业绩时同步发布这一决定,并将全年利润预期上调近 12%,主要受益于日元走弱及持续的成本控制。丰田表示,未来近健太将负责公司内部经营管理,佐藤恒治则将聚焦更宏观的产业层面。公司称,此举旨在应对汽车产业正在经历的深度变革,加快内部决策节奏。麦格理出行研究主管詹姆斯 · 洪(James Hong)指出,丰田内部正出现明显的权力结构变化。他表示,长期以来产品始终是丰田的核心,但未来围绕非汽车业务的决策比重将显著提升。洪认为,近健太被视为丰田工业收购案的关键推动者,其在财务事务上的经验明显强于来自产品开发体系的佐藤恒治。佐藤恒治于 2023 年 4 月接任 CEO,当时丰田因纯电车型推进缓慢而备受质疑。但丰田坚持混动技术的路线随后被证明判断准确,并支撑公司连续多年创下销量新高,去年继续保持全球销量最高的汽车制造商地位。在其任期内,丰田股价累计上涨 111%,表现明显跑赢同期日经指数。丰田预计,截至明年 3 月的财年营业利润将达到 3.8 万亿日元,较此前预期增长 11.8%。Reddit CEO:在 AI 时代保持「人类性」是平台核心竞争力 据《商业内幕》报道,Reddit CEO Steve Huffman 在今年的第四季度财报电话会上表示,Reddit 的核心竞争力仍然来自「真实的人类对话」,而非被生成式内容淹没的互联网。他强调,在由不透明算法与生成式内容主导的网络环境中,Reddit 的定位是「让人类与人类交流的平台」。Huffman 指出,Reddit 正在投入资源提升平台的真实性建设。第四财季,平台已上线 verified profiles(已验证用户与品牌),并计划进一步推出「机器人验证」(bot verification)与 AI 内容标注体系。他表示,AI 内容不必被全面禁止,但必须明确标注来源,以确保用户能判断信息的可信度。自 2023 年以来,Reddit 已在搜索摘要、内容翻译、推荐系统与广告投放等场景中使用 AI 技术。Huffman 强调,这些工具的目标是提升用户体验,而非让平台被「AI slop」充斥。财务表现方面,Reddit 本季度营收同比增长 70%,达到 7.26 亿美元;净利润同比增长 255%,达到 2.52 亿美元,均超出市场预期。财报发布后,Reddit 股价在盘后上涨 5%,但今年以来仍累计下跌 34%,反映软件板块整体承压。马斯克:未来 30 个月,AI 最经济的部署地点将是太空 据 TechCrunch 报道,近日,伊隆 · 马斯克在 Patrick Collison 的播客《Cheeky Pint》中表示,轨道数据中心的核心优势在于能源成本:同样的太阳能板在太空可获得约五倍发电量,因此「在太空扩容比在地面更容易」。不过,嘉宾 Dwarkesh Patel 指出,数据中心成本远不止能源,且轨道环境下 GPU 维护难度更高,这些问题马斯克并未给出完整回应。SpaceX 上周向美国联邦通信委员会(FCC)提交了百万颗卫星的数据中心网络计划,外界原以为是玩笑,但随着本周 SpaceX 与 xAI 的正式合并,以及 FCC 已受理申请并开启意见征集流程,这一设想正被快速推向现实。FCC 主席 Brendan Carr 甚至主动在 X 上分享相关文件,显示监管层面至少不会成为短期阻力。尽管存在逻辑缺口,马斯克依旧给出了明确时间表。他称 2028 年将成为轨道数据中心的拐点年份。 在未来 36 个月、可能更接近 30 个月,把 AI 放在太空将成为最具经济吸引力的选择。他甚至预测,五年后每年在太空部署的 AI 计算量将超过地球历史累计总和。从产业背景看,全球数据中心容量预计在 2030 年达到约 200 GW,对应近万亿美元的基础设施投入。马斯克的论述无疑为 SpaceX-xAI 即将到来的 IPO 提供了宏大叙事,也为 SpaceX 的发射业务创造了新的需求来源。55.98 万元,理想首款「具身智能」旗舰 SUV L9 Livis 发布 昨天,理想汽车正式发布全新一代 L9 Livis 版本,售价 55.98 万元。官方将其定义为行业首款「具身智能」旗舰 SUV,试图通过自研芯片、大模型与硬件本体的深度融合,构建下一代智能汽车的技术壁垒。 搭载自研「马赫 100」芯片:搭载两颗全自研车规级 5 纳米芯片,总算力达 2560 TOPS; 全球首发集成线控转向、后轮转向及全电控机械制动(EMB)的底盘系统; 搭载 800V 全主动悬架,在 60 万元以内价位首次配备该系统,单轮举升力超过 10000 牛; 取消传统防倾杆,通过四轮独立控制实现「反物理」的车身姿态; 外观延续「Future Icon」理念,取消原有的「海豚鼻」设计,采用俯冲式车头配合 22 英寸 285 宽胎。 理想汽车 CEO 李想表示,未来 3 到 5 年中高端汽车的竞争本质上是具身智能的竞争。理想汽车的长期愿景是将汽车形态演进为机器人,从简单的交通工具转变为能够识别、理解并主动服务用户的智能体。根据规划,理想汽车已构建了包含 Infra(算力数据)、基座模型(大脑)、软件本体(手脚)和硬件本体(身体)在内的完整 AI 技术栈。此外,理想汽车透露其 VLA 司机大模型已于去年 8 月随理想 i8 量产上车,而星环 OS 也计划在今年 3 月开源。李想强调,具备 L4 级自动驾驶能力的汽车将成为家庭生活中最重要的「硅基人」,不仅能完成接送任务,还能处理充电、洗车等生活琐事。曝 iPhone 18 Pro Max 电池容量突破「5 字头」 据博主「数码闲聊站」爆料,iPhone 18 Pro Max 在电池规格上出现明显升级,eSIM 与非 eSIM 版本均突破「5 字头」,并配合全新的 A20 系列芯片与 C2 基带,续航表现有望出现显著提升。该博主透露,苹果正计划让 iPhone 18 Pro Max 的机身变得更厚、更重,以容纳更大的电池。供应链信息显示,非 eSIM 版本的电池容量将超过 5000mAh,比去年 iPhone 17 Pro Max 的 4823mAh 增加约 3.67%;eSIM 版本则提升至 5100–5200mAh 区间,相比去年 5088mAh 增幅最高达 2.20%。wccftech 指出,尽管容量提升幅度不算大,但苹果今年将首次在 iPhone 18 系列中采用基于台积电 2nm N2 工艺打造的 A20 与 A20 Pro 芯片,并搭载能效更高的 C2 5G 基带。更先进的制程与架构优化,叠加苹果在系统层面的能耗调校,意味着实际续航可能远超数字本身。报道还提到,苹果预计在未来的折叠屏产品 iPhone Fold 上使用 5500mAh 电池,为目前已知的苹果最大电池容量。滴滴发布 2026 春运预测:春运打车将迎四次高峰 昨天,滴滴出行发布 2026 年春运预测,显示今年春运期间全国网约车需求将持续攀升,返乡、探亲、旅游与返工叠加,将在 40 天周期内形成四次明显高峰: 春节前后异地打车需求预计较春运前上涨 45%,春运以来已较平日上涨 23%; 四次高峰分别出现在 2 月 13 日(腊月廿六)、2 月 22 日(正月初六)、2 月 24 日(正月初八)与元宵节前后的 3 月 3 日至 4 日(正月十五、十六); 机场、火车站等大型交通枢纽的打车需求预计上涨 40%;美容美发、购物商超场景需求预计上涨 67% 与 49%; 前往旅游景点、滑雪场、大型商圈的需求增幅预计分别达到 75%、60% 与 38%; 一线城市春节前打车需求预计同比上涨 21%;三线及以下城市高峰周期更长,春节前高峰或持续至 2 月 15 日(腊月廿八),春节后高峰将从 2 月 23 日(正月初七)延续至 3 月 5 日(正月十七); 滴滴在全国 165 个城市、313 座机场与火车站升级上车点指引,并在百余座枢纽投放引导员; 春运期间将发放 11 亿元司机补贴,并上线免佣卡、完单奖等激励措施以提升运力; 滴滴充电预测全国充电需求同比去年增长超六成,北京、上海、成都等城市增幅超过 80%;加油需求预计较平日上涨超 10%。 滴滴表示,已启动春运专项保障,将继续在重点城市配合主管部门提升运力调度,确保用户在春运期间的出行体验。预制菜国标征求意见发布:禁止使用防腐剂,标签需更透明 据央视新闻报道,国家层面对预制菜的首个强制性国家标准已进入公开征求意见阶段,重点围绕食品安全、营养健康、标签标识及包装要求等方面提出更严格规范。标准明确,预制菜生产不得使用腐败变质原料,农药残留、兽药残留、污染物及真菌毒素等指标需符合相应限量要求,并需做到原料来源可追溯。生产环节需重点防控交叉污染风险,同时强化温度控制与卫生管理。在营养方面,标准提出预制菜应避免过度烹饪,并在加工过程中控制烹调油、食盐、食糖的添加量,落实「减油、减盐、减糖」要求;同时强调保鲜与风味保持,以提升口感与质地的复原度。标签标识是此次标准的重点之一。标准要求企业需清晰标注原料或成分的投料量或在成品中的含量,使消费者能够「一目了然」了解产品真实情况;并需标注食用方式: 预加工已熟制产品需标示「需加热或复热后食用」; 预加工未熟制及未完全熟制产品需标示「需熟制后食用」。 标准还明确预制菜不得使用防腐剂,并要求尽可能减少食品添加剂的使用。添加剂的使用不得掩盖食品腐败变质或质量缺陷,不得以掺杂、掺假、伪造为目的,需确保工艺必要性。在包装方面,标准要求包材需适配加热与食用方式,带包装加热或熟制的产品,其内包装材料需具备耐热性,不得受热后粘连、变色或变形,同时鼓励使用绿色环保新型材料。2026 春节期间部分快递停运 据央视网报道,国家邮政局印发《2026 年春运期间寄递服务保障工作方案》,强调要统筹满足人民群众寄递需求和保障快递员合法权益,扎实做好 2026 年春运期间寄递服务保障工作。《工作方案》中指出,把春运寄递分成「节前年货高峰—假期业务量下降—节后快速恢复」三段,并要求快递企业提前公示服务时间与服务地域、保障春节假期基本寄递服务;邮政普遍服务持续提供。按照快递企业的公告,部分快递公司提出了「不打烊」的公告,但时效和费用会发生改变。 顺丰:公告明确春节假期(2 月 16 日 - 2 月 23 日)寄递服务加收「资源调节费」;节前(1 月 19 日 - 2 月 15 日)对部分发运 20 kg(含)以上产品收取 0.1 - 1.5 元 / kg 资源调节费; 京东物流: 1 月 19 日 - 2 月 23 日 对特快重货在原价基础上加收 0.1 - 1.2 元 / kg 高峰期资源调节费;其仓网「全天候运转、承诺必达」;对部分合作月结的客户,将按照相应的合作产品,分别在不同时间周期加收不同标准的资源调节费,具体详情可咨询销售经理或见商家工作台站内公告; 德邦:2026 年 1 月 19 日 - 2 月 14 日期间,将对部分客户、部分产品加收 0.2-0.5 元/kg;2026 年 2 月 15 日 - 2 月 23 日期间,将对部分客户、部分产品加收资源调节费。针对长期深度合作的客户,将按照双方合作产品,分别加收不同标准的资源调节费; 韵达快运:2 月 12 日 - 2 月 23 日 放假,2 月 24 日复工; 百世快运:2 月 11 日 - 2 月 23 日 放假,2 月 24 日恢复运营; 中通快运:2 月 13 日 - 2 月 23 日 放假调休,2 月 24 日起恢复。 壹米滴答:全网网点最晚接件时间为 2 月 10 日(腊月二十三)、车辆最晚运营时间为 2 月 9 日(腊月二十二),2 月 25 日(正月初九)恢复正常运营。 顺心快运:公司将于 2 月 12 日(腊月二十五)至 2 月 23 日(正月初七)网点暂停揽收及提派件,2 月 24 日(正月初八)恢复正常交接件。 据南方网报道,「通达系」普遍 2 月 10 日(腊月二十三)开始减量揽收或停收,2 月 22 日(正月初六)才基本复工。记者咨询加盟制快递部分企业总部人员,对方均表示,春节假期将保障客户的快递收发需求,具体服务时间和时效请联系寄件网点查询。喜茶广州沙面 DP 店开业,推腐竹豆浆限定饮品 昨天,喜茶 DP 计划(HEYTEA DAY DREAMER PROJECT)系列新作「广州沙面 DP 店」正式开业。该店选址于广州重要文物地标——沙面建筑群中的渣打银行旧址,是喜茶继 2025 年成都春熙路店「叠院春熙」回归后的最新 DP 计划落地。在空间设计上,新店以「饮茶先啦」为主题,尝试用现代设计语言诠释广府饮茶文化,客座区设计则以竹塌为原型,融合茶席、茶摊、茶箱等场所元素,意在打造「无事闲坐,饮茶听风」的休闲氛围。此外,店内设有闻香区域,陈列绿妍、鸭喜香乌龙及英德红茶等经典茶样。伴随新店开业,喜茶推出了 3 款广州沙面 DP 店限定产品,包括汲取广式糖水灵感的「老广鲜腐竹豆浆」,该产品以豆浆融合源牧 3.8 牛乳,加入每日现焖鲜腐竹、莲子和薏仁;以及两款冰淇淋新品:「老广鲜腐竹豆浆冰淇淋」和选用广东英德红茶搭配咸酪风味的「咸酪英红冰淇淋」。DP 计划最早诞生于 2017 年。去年,喜茶已完成超过 130 家门店的空间焕新,并在北京、上海、广州等 30 多个城市开出新店,试图通过差异化的门店设计提升品牌辨识度与线下体验。智元公布《机器人奇妙夜》节目单 昨天,智元 AGIBOT 正式公布了全球首个大型机器人晚会《机器人奇妙夜》(AGIBOT NIGHT 2026)的完整节目单。据悉,本次晚会由智元旗下明星机器人「远征 A2」担纲主理人,并特邀知名演员黄晓明、稚晖君、U 航等嘉宾助阵。节目单共包含 12 个精彩节目,涵盖舞蹈、竞技、时装秀、魔术、武术等多元形式: 开心麻花团队将与多台机器人同台飙戏,带来小品「替身约会」,演绎「钢铁直机」的反差追爱故事; 黄晓明将参与「超级变变变!」环节,与机器人共同完成魔术首秀; 在音乐表演方面,绝美出道的仿生机器人「精灵·璇」将与 U 航合唱原创情歌「未定义的关系」,诠释跨次元情感。 此外,晚会还将呈现由「会飞的机器人」领衔的开场舞「舞力全开」、展示机器人格斗的「技能争霸赛」、以及汇聚知名潮流 IP 的「机器人时装秀」。四足机器人将在「萌宠机甲派对秀」中化身熊猫与小马,与人类同台共舞。晚会尾声通过「咱们工人有力量」和「骏启新程」两个节目,以艺术化形式展示机器人在智能制造领域的应用价值。智元表示,举办该晚会旨在打破公众对机器人「冰冷工具」的刻板印象,全方位展示其在运动、交互及作业智能方面的能力。《爱乐之城》十周年重映定档 2 月 14 日情人节 《爱乐之城》将在 2 月 14 日情人节迎来十周年重映。今年的特别放映以「十年光影 爱意如初」为主题,在全国多座城市的中影国际影城同步开启,为观众打造沉浸式的纪念体验。影片于十年前上映,以洛杉矶星光为背景,通过音乐与镜头语言讲述塞巴斯汀与米娅的追梦爱情故事。HBO 宣布打造《博德之门》真人剧集,故事紧接《博德之门 3》 据博主「守望好莱坞」消息,热门奇幻游戏《博德之门》将被改编为真人剧集。该剧由 HBO 打造,克雷格 · 麦辛担任编剧、运作人及执行制作人,他曾参与《切尔诺贝利》《最后生还者》等作品。麦辛表示,剧集将采用原创故事线,但重要灵感来源于近年大热的游戏《博德之门 3》,剧情时间点紧接游戏结局展开,强调「游戏结束,本剧开始」。剧中将出现《博德之门 3》中的既有角色,包括「英雄、反派以及字面意义上的魔鬼」,同时也会加入新人角色,其中包含一位「新人主角」。麦辛透露,团队正与《博德之门 3》的部分配音演员接洽,探索让他们参与剧集的可能性。剧集还将在威世智授权下,保留并利用与《龙与地下城》系列的诸多共通元素。他提到自己在《博德之门 3》中的游戏时间接近 1000 小时,并且热爱《龙与地下城》,过去 15 年几乎每周都会游玩。✨ 是周末啊! One Fun Thing|Windows Phone「诈尸」?诺基亚 N8 被社区复活 据 Android Authority 报道,社区开发者近日推出名为「Reborn」的自定义 ROM,让 2010 年发布的 Nokia N8「复活」,重新具备可用性。这款基于 Nokia Belle 的固件针对性能、系统功能和现代网络兼容性进行了全面更新,使这款曾以 12MP Carl Zeiss 镜头和氙气闪光灯著称的设备再次具备日常使用能力。报道指出,Reborn ROM 解决了原生 Symbian 系统的核心问题,包括系统卡顿、应用链接失效以及过时的安全证书。开发者为固件加入了可正常使用的应用商店,并更新了 HTTPS 证书,使设备能够访问现代网页。同时,ROM 移除了 Symbian 时代严格的签名限制,用户可直接安装应用,无需再经历繁琐的签名流程。视频演示显示,刷入新固件后的 N8 在界面流畅度和相机功能上均表现稳定,硬件潜力得以重新发挥。不过,报道也提醒用户,刷机过程可能受到 Windows 10 驱动与旧版 Nokia 工具冲突的影响,部分案例甚至会触发 BSOD,需要具备一定的恢复能力。此外,N8 的硬件老化问题依旧存在,如摄像头损坏、SIM 卡针弯曲等,但其结构坚固、螺丝标准化、部分组件可替换,使维修仍具可行性。周末看什么|《极限审判》 《极限审判》由提莫 · 贝克曼贝托夫执导,故事聚焦近未来司法体系全面引入 AI 法官「Maddox」后的首宗高关注度案件。影片采用「桌面电影」与多源监控视角的混合叙事结构,剧情主线围绕洛杉矶警探克里斯 · 雷文展开:他在妻子死亡后被系统判定「98% 有罪」,随即被推上由 AI 全权裁决的「Mercy 法庭」。根据系统规则,被告需在 90 分钟内将有罪概率压低至 92% 以下,否则立即执行死刑。雷文在倒计时压力下依赖 AI「天眼」系统调取海量数据,试图在算法不断自我强化的闭环中寻找破局点;随着调查推进,嫌疑链条不断扩张,系统却持续将证据收束回指向他本人,形成技术与人性之间的结构性冲突。评分方面,豆瓣显示影片获得 7.5 分,约 4.6 万人评价,整体口碑处于动作与科幻类型片的中上区间。买书不读指南|《火灾天气》 《火灾天气》由加拿大作家约翰 · 瓦利恩特撰写,聚焦 2016 年吞噬麦克默里堡的超大规模野火事件。这场灾难在短短一个下午迫使近 9 万人撤离,城市与基础设施在极端火势下迅速崩解,成为现代城市与气候系统失衡的典型案例。该书以电影化叙事重建火焰蔓延的全过程,将火描绘为一种具有行动力的自然力量,并将其置于全球变暖、化石能源依赖与城市扩张的结构性背景中加以分析。作品并非单纯的灾难记录,而是将消防员、居民的亲历,与北方森林生态、石油工业史、气候科学发展并置展开,呈现现代生活在极端天气面前的脆弱性。瓦利恩特试图回答一个贯穿全书的核心问题:当城市不断向森林边缘推进、能源系统持续制造高温与干旱,人类是否仍能自认为是火的主人。《火灾天气》入围 2024 年普利策奖非虚构类决选,获得 2023 年贝利 · 吉福德奖,并被《纽约时报》《时代周刊》《卫报》等媒体列为年度最佳非虚构作品之一。游戏推荐|《UNBEATABLE》 《UNBEATABLE》由 D-CELL GAMES 开发,定位为一款节奏冒险作品,玩家在音乐被视为非法的世界中,以主角「节拍」的视角展开逃亡与反抗旅程,整体流程约 6–8 小时,另包含可无限游玩的街机模式。在多个平台上线后,以其鲜明的朋克摇滚视觉风格和节奏玩法迅速获得关注,但围绕其叙事结构与玩法取舍的讨论同样激烈。剧情主线围绕「音乐禁令」展开,玩家在城市中穿梭,与乐队成员互动,并在关键节点进入节奏战斗。官方强调其「两键式」节奏系统与日式动画风格叙事,并提供大量原创曲目与可解锁内容。媒体评分方面,《UNBEATABLE》PC 版在 Metacritic 获得 76/100,OpenCritic 推荐率为 68%。IGN 则给出 6/10 的「还行」(Okay)评价,指出游戏在视觉表现与音乐风格上亮点明显,但叙事节奏混乱、场景衔接突兀、支线小游戏与主玩法脱节,导致整体体验呈现「身份认同危机」。IGN 认为街机模式更能体现节奏游戏核心,而故事模式在大量对话、重复场景与不连贯的推进中削弱了节奏玩法的存在感。 -
我国科研机构主导的大模型成果首次登上Nature 【文/观察者网专栏作者 心智观察所】 几天前,《Nature》杂志刊发了一篇来自中国的人工智能研究论文。这在顶级学术期刊上并非新鲜事,但这篇论文的分量却非同寻常:它来自北京智源人工智能研究院,核心成果是一个名为“Emu3”的多模态大模型,而它试图回答的问题,是整个AI领域过去五年来悬而未决的核心命题——我们能否用一种统一的方式,让机器同时学会看、听、说、写,乃至行动? 这个问题听起来简单,但它的复杂程度足以让全球顶尖的AI实验室争论不休。 OpenAI用Sora惊艳世界,靠的是扩散模型;Google的Gemini整合多模态,用的是复杂的编码器拼接;Meta的Chameleon尝试统一,却始终难以在性能上与专用模型抗衡。而智源的答案,是一个看起来朴素得近乎偏执的选择:只用“下一词预测”。 这个选择的意义,可能需要一些背景知识才能理解。 论文前言 一场关于“语言”的豪赌 如果你问一位2020年的AI研究者,未来的多模态智能会是什么样子,他大概率会给出这样的预测:图像生成归图像生成,文字理解归文字理解,视频处理归视频处理,然后我们用某种“胶水”把它们粘在一起。这不是懒惰,而是当时的技术现实——不同模态的数据特性差异太大,专精往往意味着高效。 事实上,这条路线在过去几年里取得了巨大成功。Stable Diffusion让普通人也能生成惊艳的图像,GPT-4让对话AI变得无所不能,而各种视觉-语言模型则在问答、识别、描述等任务上不断刷新纪录。但问题也随之而来:这些模型就像一个技艺精湛但只会单项运动的运动员,让它们协同工作,需要复杂的工程架构、精细的模态对齐,以及大量的人工干预。 更关键的是,这种“专科化”的发展路径隐含着一个令人不安的假设:也许机器智能天生就是碎片化的,我们永远需要为每一种能力单独训练一个模型。 Emu3挑战的,正是这个假设。 智源团队的核心洞见是:如果我们把图像、视频、文字都转换成同一种“语言”——离散的符号序列——那么让模型学习“预测下一个符号”这一个任务,是否就足以涵盖所有多模态能力(如下图)? 这个想法并非没有先例。早在2020年,GPT-3就已经证明,仅仅通过预测下一个词,语言模型可以涌现出惊人的推理、翻译、编程能力。但将这一范式扩展到图像和视频,面临着截然不同的挑战:一张512×512的图像,如果用简单的方式转换成符号,可能需要几十万个token,这对于Transformer架构来说是灾难性的计算负担;更重要的是,图像的空间结构、视频的时间连续性,与文字的线性叙事有着本质区别,简单的“下一词预测”真的能捕捉这些复杂的关系吗? 智源的答案是肯定的,而Emu3就是他们的证明。 一个分词器的艺术 要理解Emu3的技术突破,首先要理解它的“视觉分词器”(Vision Tokenizer)。这个听起来不起眼的组件,实际上是整个系统的基石。 想象一下,你需要用电报向一个从未见过图片的人描述一幅画。你不可能传输原始的像素值——那太冗长了;你也不能只说“一幅风景画”——那太模糊了。你需要的是一种既紧凑又富有表现力的编码方式,能够在有限的符号中保留足够的视觉信息。 Emu3的视觉分词器做的正是这件事。它能够将一张512×512的图像压缩成仅仅4096个离散符号,压缩比达到64:1;对于视频,它在时间维度上进一步压缩4倍,使得一段4帧的视频片段也只需要4096个符号表示。这些符号来自一个包含32768个“词汇”的码本——你可以把它想象成一本视觉词典,每个“词”代表一种特定的视觉模式。 更精妙的是,这个分词器是为视频原生设计的。传统的图像分词器处理视频时,只能逐帧编码,完全忽略帧与帧之间的时间关联;而Emu3的分词器通过三维卷积核,能够同时捕捉空间和时间维度的信息。在实验中,这种设计用四分之一的符号数量,就达到了与逐帧处理相当的重建质量——这不仅意味着更高的效率,更意味着模型能够真正“理解”视频的动态本质,而非仅仅处理一堆静态图片。 有了这个分词器,图像和视频就变成了与文字一样的符号序列。接下来的事情,就是让一个Transformer学会预测这些序列中的“下一个符号”。 当简单遇上规模 Emu3的模型架构,用一句话就能概括:它就是一个标准的大语言模型,只不过词汇表里多了32768个视觉符号。 这种极简主义设计在AI研究界是罕见的。主流的多模态模型——无论是LLaVA、BLIP-2还是Flamingo——都采用“编码器+语言模型”的复合架构,即先用一个专门的视觉编码器(通常是CLIP)把图像转换成特征向量,再用适配器将这些特征“注入”语言模型。这种设计的好处是可以复用已有的预训练组件,但代价是系统复杂度的急剧上升,以及模态之间潜在的隔阂——视觉编码器和语言模型毕竟是独立训练的,它们对世界的理解未必一致。 Emu3选择了一条更激进的路:不用任何预训练的视觉编码器,不用任何复杂的模态融合机制,只用一个从零开始训练的decoder-only Transformer。所有的多模态知识,都是在统一的下一词预测任务中从数据里学来的。 这种“大道至简”的设计哲学,在实践中转化为了惊人的实验结果。 在图像生成任务上,Emu3在人类偏好评估中得分70.0,超越了Stable Diffusion XL(66.9)这个扩散模型的标杆;在视觉语言理解的12个基准测试上,它的平均分达到62.1,与采用复杂编码器架构的LLaVA-1.6(61.8)持平;在视频生成的VBench评估中,它取得了81.0分,超过了专门的视频扩散模型Open-Sora-1.2(79.8)。 这些数字的意义在于:一个仅仅用“预测下一个符号”训练的模型,在生成和理解两个看似矛盾的方向上,同时达到了专用模型的水平。这在此前被认为是不可能的——毕竟,扩散模型和自回归模型的数学基础完全不同,擅长理解的架构通常不擅长生成,反之亦然。Emu3的成功,相当于一个运动员同时在短跑和马拉松比赛中夺冠,打破的不仅是记录,更是人们对专业化边界的认知。 规模定律的启示 如果说单点性能的突破还可以归因于工程技巧或数据质量,那么Emu3论文中最具科学价值的发现,则来自于它对规模定律Scaling Laws的系统研究。 规模定律是现代AI研究的圣杯之一。它描述的是模型性能与模型规模、数据规模之间的数学关系——如果我们知道这个关系,就能预测一个更大模型的表现,而不需要真的训练它。这对于动辄消耗数百万美元计算资源的大模型研发来说,具有极其重要的实用价值。 此前的规模定律研究主要集中在纯语言模型上。Emu3的贡献在于,它证明了多模态学习同样遵循可预测的规模定律,而且——这是关键——不同模态共享同一套数据扩展指数。 具体而言,无论是文字到图像、图像到文字,还是文字到视频,当训练数据量翻倍时,模型的验证损失都以0.55的指数下降。这意味着多模态能力的提升不是各自为政的,而是遵循统一的数学规律。基于较小模型的实验数据,研究团队准确预测了70亿参数模型的性能,拟合优度超过0.99,误差不到3%。 这个发现的意义远超学术范畴。它暗示着,未来的多模态智能可能不需要为每种能力单独设计训练策略——只要把不同模态的数据混合在一起,用统一的目标训练,规模扩大后能力就会自然涌现。这极大地简化了研发路径,降低了技术门槛,也让通用人工智能AGI的愿景变得更加可信。 论文的另一个亮点,是Emu3在机器人操控任务上的出色表现。 在CALVIN基准测试——一个评估机器人执行长序列任务能力的标准测试——中,Emu3在“连续完成五个任务”的指标上达到了87%的成功率。这意味着机器人在接受语言指令后,能够依次完成一系列复杂操作,如“拿起桌上的杯子”、“打开抽屉”、“把杯子放进去”等,每一步都需要视觉感知、语言理解和动作规划的紧密配合。 这个结果揭示了Emu3框架的深层潜力:它不仅仅是一个内容生成工具,更可能是通往具身智能的一条捷径。传统的机器人学习需要专门设计感知模块、决策模块和控制模块,然后艰难地将它们整合在一起;而Emu3的思路是,把视觉观察、语言指令和机械臂动作都转换成符号序列,让模型在统一的框架下学习它们之间的关联。 论文中展示了一个令人印象深刻的例子:给定一段烹饪视频的前两秒,Emu3可以预测接下来两秒会发生什么——锅中的食材如何翻炒(如下图),厨师的手会移向哪里,蒸汽会如何升腾。这种“世界模型”的能力,被认为是通向更高级AI的关键:一个真正理解物理世界的模型,应该能够预测行动的后果,而非仅仅记忆静态的图像-文字关联。 与海外同行的比较 在全球AI研究的版图上,Emu3处于什么位置? 最直接的比较对象是Meta的Chameleon。这是另一个尝试统一多模态学习的模型,同样采用了token化和自回归预测的范式。但Chameleon在发布时面临着一个尴尬的处境:虽然架构统一,但性能与专用模型存在明显差距,尤其在图像生成质量上。Emu3的突破在于,它证明了这个差距可以被弥合——关键在于视觉分词器的质量和训练策略的优化。 与OpenAI的路线相比,差异则更加根本。OpenAI的Sora代表了扩散模型在视频生成上的巅峰,它的视觉质量和时间一致性令人叹为观止。但扩散模型有一个内在限制:它本质上是一个生成器,而非理解器。要让Sora“理解”视频内容并回答问题,需要额外嫁接一个视觉语言模型——这又回到了模态割裂的老路。Emu3的自回归范式则天然统一了生成与理解:生成是预测视觉符号,理解是预测文字符号,它们在同一个模型里用同一种方式完成。 Google的Gemini采用了一种更折中的策略:它确实整合了多种模态,但内部架构仍然依赖预训练的视觉编码器和复杂的模态融合机制。这种设计的好处是可以快速利用已有的技术积累,但代价是系统的复杂性和潜在的模态偏见。Emu3的从零训练策略虽然计算成本更高,但带来的是更纯粹的多模态表征——所有模态的知识都是在同一个优化目标下共同习得的。 从开放性的角度看,Emu3的优势更为明显。论文作者承诺开源关键技术和模型,包括视觉分词器、训练代码和预训练权重。这与OpenAI对Sora和GPT-4的封闭策略形成鲜明对比。对于中国乃至全球的AI研究社区来说,这意味着一条新的技术路线变得可以复现、可以改进、可以建立在上面。 商业化的想象空间 技术突破最终需要转化为社会价值,而Emu3的架构特性为商业化提供了独特的可能性。 首先是部署效率。Emu3的核心是一个标准的Transformer,这意味着它可以直接复用大语言模型已经非常成熟的推理基础设施——包括vLLM的动态批处理、PagedAttention的内存优化、各种量化和剪枝技术。论文提到,研究团队基于FlagScale开发了支持无分类器引导的推理后端,在保持生成质量的同时实现了低延迟和高吞吐。这为大规模服务奠定了基础。 其次是应用的统一性。传统的多模态服务需要为不同的能力部署不同的模型——一个处理图像生成,一个处理视觉问答,一个处理视频理解——这带来了显著的运维复杂度和资源浪费。Emu3的单一模型架构意味着一套部署可以支撑多种能力,大大降低了服务的边际成本。 更具想象力的是交互形态的变革。当一个模型同时具备生成和理解能力,而且可以处理图像、视频、文字的任意组合时,传统的“输入-输出”界限就变得模糊了。一个用户可以上传一段产品演示视频,要求模型生成配套的图文说明书;可以描述一个场景,让模型生成视频并实时回答关于视频内容的问题;甚至可以让模型“想象”一个物理过程的结果,比如“如果我把这杯水倒在键盘上会发生什么”。这些交互在此前需要复杂的多模型协作,现在可能在单一模型内流畅完成。 在特定垂直领域,Emu3的潜力同样值得关注。教育场景中,一个能够生成演示图像、解释概念、回答问题的统一助手,比分离的工具组合更加自然;电商场景中,从产品图片的生成、变体的创建、到用户问询的回答,可以在同一个模型中完成;医疗影像分析中,统一的多模态理解可能帮助医生更高效地处理报告和图像。 当然,从实验室原型到商业产品还有很长的路要走。论文也坦诚地讨论了现有的局限:推理速度仍有提升空间,视觉分词器在压缩率和保真度之间存在权衡,长视频的处理能力有待增强。但这些是工程优化的问题,而非范式上的死胡同。 一个范式的开端 回到本文开头的问题:Emu3的真正意义是什么? 从技术角度看,它证明了“下一词预测”作为多模态学习统一范式的可行性。这不是一个增量式的改进,而是对主流技术路线的根本性挑战。如果Emu3的结果可以被进一步扩展——更大的模型、更多的数据、更长的上下文——那么AI领域可能正站在一次范式转移的门槛上。 从产业角度看,它为中国AI研究树立了一个新的标杆。在大模型竞争中,中国团队往往被认为是快速跟进者而非规则制定者。Emu3登上Nature,不仅是学术声誉的认可,更重要的是它提出了一条不同于OpenAI、Google、Meta的技术路线,并且用实验证明了这条路线是可行的。这种原创性的贡献,是建立长期技术影响力的基础。 从更宏观的视角看,Emu3的成功暗示着一种可能的未来:也许智能的本质就是预测。预测下一个词,预测下一帧画面,预测下一个动作——当这些预测任务被统一到同一个框架中,涌现出的可能不仅仅是更强的模型,而是对“理解”和“创造”本身的新诠释。 论文的结尾写道:“统一的下一符号建模为世界模型提供了一条有希望的道路,这种模型整合了感知、语言和行动。”这不仅是一个技术愿景,也是一种哲学立场:智能也许不需要被分解成相互独立的模块,它可以是连续的、统一的、自然生长的。 当然,一篇论文不能回答所有问题。Emu3的上下文窗口还不够长,处理小时级视频仍是挑战;它的推理能力与专用语言模型相比仍有差距;它对真实物理世界的”理解”究竟有多深,还需要更严格的测试。但它已经迈出了关键的一步:证明了一条更简洁、更统一的道路是存在的。 在AI发展史上,最重要的突破往往不是做出更复杂的系统,而是找到更简单的原则。从反向传播到注意力机制,从强化学习到扩散模型,每一次飞跃都源于对复杂性的简化。Emu3的贡献,也许正是把多模态智能的复杂性,简化成了一个朴素的问题:下一个符号是什么? 这个问题的答案,将塑造AI的下一个十年。 本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。 -
苹果整治“陌生人社交”,亮剑打击“网络黑产”应用 IT之家 2 月 7 日消息,科技媒体 9to5Mac 昨日(2 月 6 日)发布博文,报道称苹果更新《App 审核指南》,大幅收紧了对用户生成内容(UGC)的管控,正式将“随机或匿名聊天”应用列入“无需通知即可移除”的高风险名单。“随机或匿名聊天”是一种社交应用模式,用户无需注册实名信息,系统会随机匹配陌生人进行文字、语音或视频交流,此类应用常因缺乏监管而滋生不良信息。IT之家附上苹果官方说明如下: 如果 App 中所含的用户生成内容或服务最终主要用于色情内容、Chatroulette 式体验、随机或匿名聊天、客体化现实生活中的某人(如“性感与否”投票)、进行人身威胁或欺凌,则这些 App 不适合出现在 App Store 中,它们可能会在未经通知的情况下被移除。 如果 App 中所含的用户生成内容来自基于 Web 服务,并且该内容是默认隐藏的(只有当用户通过你的网站将其打开时才会显示),则可以显示意外产生的“NSFW(公众场所不宜)”内容。Chatroulette 式体验指一种通过网络摄像头随机与陌生人配对视频聊天的模式,因常涉及不雅暴露内容而具有负面含义。该媒体解读认为,这一变动意味着所有主打“陌生人随机社交”或“完全匿名通讯”的开发者需立即自查。苹果明确表示,虽然用户生成内容存在知识产权侵权和匿名霸凌等固有挑战,但平台绝不容忍主要功能导向上述违规行为的产品。对于试图通过“匿名”卖点吸引用户的应用而言,生存空间已被极度压缩,未来必须在实名认证、内容审核机制及用户举报系统上投入更多资源,否则将面临随时被踢出生态系统的风险。 -
快递春节停运上热搜 记者实测:不存在全面停运公司 2月6日,#快递停运#话题登上热搜,引发大量讨论,还有不少人分享各快递公司停运时间表。 ▲网传快递停运时间表,信息并不准确2月6日下午,红星新闻记者咨询包括顺丰、京东、邮政、三通一达等在内的众多快递公司发现,没有一家快递公司明确会在春节期间全面停运。其中顺丰京东邮政明确不会停运,其他多家快递则是不同网点存在差异,有的地区停运、有的网点则无法保证春节几天的时效,但都不会整体停运。 ▲中国邮政快递车 资料图#快递停运#热搜话题引发了大量讨论,其中不少网友分享各大快递公司的停运时间表。红星新闻记者6日通过查看各家快递公司官网、咨询客服、联系网点等方式确认,这些网传停运时间表大多并不准确。各家快递公司中并不存在全面停运的公司,但部分地区、部分网点会有停运,部分网点则无法在春节期间保证时效。其中,顺丰、京东和邮政明确春节期间不会停运。顺丰小程序上一条公告显示,顺丰会在2月16日至2月23日春节假期期间,对寄递服务加收资源调节费。记者联系的一位顺丰小哥表示,春节期间会加价10元。京东也提到,1月19日-2月23日期间,在特快重货产品原价格基础上加收0.1元/kg-1.2元/kg的高峰期资源调节费。邮政则没有任何加价政策。 ▲顺丰春节运费调整政策三通一达(申通、中通、圆通、韵达)及极兔快递的安排则存在不同区域和网点的差异。其中,极兔快递客服称不同网点政策不同。记者随机联系了不同城市的几个网点,北京有网点称不停运但加价;也有网点除夕到初七停运,可以收件但无法寄件;天津一网点表示暂时没有消息;还有廊坊、佛山的网点称会有停运。圆通则明确,2月15日至2月23日根据市场预估情况,充分做好人员安排、资源调配、模式调整等方面工作,保障服务畅通和网络安全平稳运行。国内寄递除西藏、甘肃、云南、内蒙古、吉林、广西、湖南、辽宁等部分因第三方物流停运或天气原因无法到达的区域外,其余地区服务正常。韵达客服则表示,春节期间全网正常营运,除部分地区(西藏、新疆、四川部分县级城市、云南、青海部分县市)无法收寄,其他地区均是正常营运。但春节期间会有省内2-3天、跨省4-5天的延时。记者联系几个网点发现,有的尚未接到具体通知,有的则表示不停运但会加价。 ▲韵达快递春节政策中通快递客服表示,春节期间将合理保障客户的快递收发需求,根据全网各地实际情况合理安排人员在岗,保证快件收、转、运、派各个环节的畅通,为广大客户提供持续稳定的物流支持。客服称,不同网点会有差异。记者联系北京几个网点,有的表示暂时还没有消息,有的则提到不打烊但无法保证时效。申通则表示,春节期间不打烊,会正常提供收派服务,具体安排可能根据各地网点实际情况略有调整,期间可能根据实际情况调整运费。记者联系网点发现,南京一网点表示会停运,广州、西安的网点则称不会停运,还有网点称未接到通知。红星新闻记者 刘亚洲 实习生张一驰 苏梦钒编辑郭宇审核 何先菊 -
OpenAI最强AI智能体编程模型:GPT-5.3-Codex登场 IT之家 2 月 6 日消息,OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。 IT之家附上相关基准测试结果如下: 在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%; 在 Terminal-Bench 2.0 测试中,其得分从前代的 64.0% 大幅跃升至 77.3%; 最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中,得分从 38.2% 飙升至 64.7%,表明其在复杂环境下的操作能力实现了质的飞跃。 官方数据显示,该模型不仅在多项编程基准测试中创下新高,运行速度也比前代 GPT-5.2-Codex 提升了 25%。 OpenAI 致力于将 GPT-5.3-Codex 打造为更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”,且不会导致上下文丢失。在 Codex 应用中,模型会高频更新工作进度,允许开发者实时提问、讨论方案并修正方向。官方博文指出,Codex 正从单一的编程智能体演变为更通用的计算机协作者,大幅降低了构建应用的门槛。GPT-5.3-Codex 目前已全面向 ChatGPT 付费用户开放,涵盖 Plus、Team 及 Enterprise 等订阅计划。用户可通过 Codex 应用、命令行工具(CLI)、IDE 扩展插件及网页端立即访问,API 版本也将在近期上线。 -
谷歌向韩国政府补交高精度地图数据外传申请材料 韩联社报道,据韩国政府和信息通信业界2月5日消息,谷歌(GOOGL.US)向政府提交了高精度地图数据外传申请的补充材料。政府去年11月第三次暂缓审批谷歌提出的高精度地图数据外传申请,并要求谷歌在今年2月5日之前补充申请材料。据悉,谷歌在当天提交的材料中表明,将接受韩方对遮蔽地图卫星图像中的韩国境内涉密设施、删除经纬度坐标信息的要求。材料还说明了地图数据处理相关技术,但未包含在韩设立数据中心的内容。韩国政府将召开“测绘成果外传协商机制”会议,基于上述补充材料研究是否批准谷歌高精度地图数据外传申请。预计审批结果公布或需要数月。谷歌曾于2007年和2016年向韩方申请外传地图,但政府以境外设服务器存在信息外泄风险为由不予批准。去年2月谷歌再次申请外传高精密地图数据,政府就此提出三项安全条件,包括对韩国境内涉密设施进行遮挡处理、删除韩国境内经纬度坐标信息、在境内建立数据中心。 -
智库策论丨钟新龙:推动人工智能深度赋能制造业 加快构建现代化产业体系 核心观点当前,全球人工智能技术正处于从“感知”向“认知”“生成”跃迁的关键窗口期,深刻把握人工智能赋能制造业的内在逻辑,以“模数共振”夯实底座、以“智能体”重塑生产关系、以“全流程”拓展应用场景,对于抢占未来发展制高点、保障国家产业安全、实现高质量发展具有重大战略意义。 图片来源/新华社■钟新龙人工智能深度赋能制造业是推动科技创新和产业创新深度融合的重要驱动力,也是构建现代化产业体系的战略制高点。党的二十届四中全会明确提出“坚持智能化、绿色化、融合化方向,加快建设制造强国,构建以先进制造业为骨干的现代化产业体系”,并强调“引领发展新质生产力”。近期,工信部等部门发布的《“人工智能+制造”专项行动实施意见》正是贯彻落实四中全会精神、推动实体经济与智能经济深度融合的“施工图”。当前,全球人工智能技术正处于从“感知”向“认知”“生成”跃迁的关键窗口期,深刻把握人工智能赋能制造业的内在逻辑,以“模数共振”夯实底座、以“智能体”重塑生产关系、以“全流程”拓展应用场景,对于抢占未来发展制高点、保障国家产业安全、实现高质量发展具有重大战略意义。深刻认识人工智能赋能制造业、培育新质生产力的必要性人工智能是培育新质生产力、实现制造业提质升级的关键变量。全会强调要“抓住新一轮科技革命和产业变革历史机遇,不断催生新质生产力”。与传统信息化手段不同,新一代人工智能特别是大模型技术,具备极强的泛化能力、生成能力和逻辑推理能力,正在推动制造业从“数字化辅助”向“智能化代工”转变。这种转变不是简单的效率提升,而是生产函数的根本性重构。它通过将数据这一新型生产要素注入生产全流程,替代低端劳动,增强高端决策,从而大幅提升全要素生产率,为制造业高质量发展提供内生动力。“人工智能+制造”是重塑全球经济版图、抢占未来产业竞争主导权的核心引擎。当前,全球主要经济体均将“AI+制造”作为再工业化的核心战略。据国际数据公司(IDC)发布的《全球人工智能支出指南》预测,到2027年全球人工智能在制造业的支出将翻一番,显示出该领域巨大的增长潜力。我国作为全球唯一拥有联合国产业分类中全部工业门类的国家,拥有海量数据资源和丰富应用场景。通过深入实施相关战略,将庞大的工业数据资源转化为现实生产力,不仅能够巩固我国作为“世界工厂”的地位,更能在智能制造的新赛道上形成独特的竞争优势,实现从跟跑到领跑的跨越。强化人工智能与制造业融合是提升产业链供应链韧性、保障国家产业安全的必由之路。党的二十届四中全会提出要“推进国家安全体系和能力现代化”。在当前地缘政治博弈日趋激烈的背景下,产业链供应链的安全稳定至关重要。人工智能技术不仅是产业升级的工具,更是大国博弈的焦点。顶层设计明确将“关键核心技术实现安全可靠供给”确立为重要目标,不仅关乎技术层面的自主可控,更关乎整个工业体系的生存权和发展权。通过加快工业大模型、高端芯片、智能工业软件的研发突破,能够有效解决制造业“缺芯少魂”问题,减少对外部技术的依赖,筑牢现代化产业体系的安全底板。夯实创新底座,以“模数共振”与自主算力构建产业供给体系“模数共振”是破解工业数据孤岛、释放数据要素价值的核心机制。现代化产业体系的构建离不开数据这一关键生产要素的高效流通与价值转化。长期以来,制造业面临数据质量低、碎片化严重、模型泛化能力差的痼疾。我国数据资源产量虽大,但有效利用率仍有较大提升空间。提出“模数共振”理念,本质是构建“以模引数”和“用数赋模”的双向正反馈循环。一方面,利用先进模型强大的泛化与生成能力,自动清洗、标注和增强存量工业数据,解决数据“脏乱差”难题;另一方面,将高质量数据反哺模型训练,提升模型在特定工业场景下的专业度与精准度。螺旋式上升的闭环机制,是打破数据壁垒、激活沉睡资产的根本之策。构建分层级、全覆盖的工业模型体系是实现精准赋能的技术关键。面对制造业纷繁复杂的细分领域,单一的通用大模型难以“包打天下”,应构建“基础大模型—行业大模型—场景小模型”协同发展的技术生态。战略重心应放在培育一批“懂行业、通机理”的行业大模型上,使其掌握工业知识图谱和工艺机理;同时,鼓励发展面向边缘侧、端侧的轻量化小模型,以满足工业现场对实时性、可靠性和安全性的严苛要求。通过“云—边—端”的模型部署体系,实现云端的大脑思考与端侧的敏捷执行有机结合,从而形成覆盖制造业全链条的智能技术供给能力。制度性变革是保障数据与模型深度融合的软实力支撑。技术层面的“共振”离不开管理层面的制度护航。推动建立企业首席数据官制度,推进数据管理能力成熟度国家标准贯标,是将数据要素真正转化为企业核心资产的必要制度安排。规范数据的采集、清洗、标注流程等环节,是从组织架构上确立了数据资产的战略地位。通过探索建立“数据协同、模型训练、应用开发、安全保障”的一体化机制,可以打通数据从产生到应用的全链条,为行业大模型的持续迭代提供源头“活水”,契合全会关于“完善要素市场化配置体制机制”的战略要求。以我为主的软硬协同算力体系是支撑人工智能赋能制造业的物理基石。算力已成为智能经济时代的战略性资源,直接决定了人工智能发展的上限。面向制造业复杂多样的应用场景,单一的通用算力难以满足需求,应推动智能芯片软硬协同发展。应突破高端训练芯片、端侧推理芯片等硬件瓶颈,更要加强编译器、算子库等基础软件的适配优化,构建自主可控的智算生态。同时,加快建设全国一体化算力网监测调度平台,促进算力资源高效利用,开展智算云服务试点,推动“云—边—端”协同的算力供给体系建设。在有效降低中小企业使用算力门槛和成本的同时,确保在极端环境下我国工业体系算力“不断供”,切实保障产业发展的连续性和稳定性。强化场景牵引,以“工业智能体”与全流程赋能重塑制造业价值链培育“工业智能体”是推动制造业从自动化向自主化跃升的革命性举措。人工智能在制造业的应用正从单纯的辅助工具向具备自主决策能力的“生产主体”演进。不同于传统的自动化脚本,工业智能体具备感知环境、自主决策、精准执行的闭环能力,能够处理非结构化环境下的复杂任务。由智能体驱动的新型生产模式,将极大释放劳动者创造力,重构人机协同关系。更深层次的战略意义在于,通过研制开放协同的智能体协议和接口,实现智能体之间的“互联互通”与“群体协同”,将分散的设备与系统连接成有机的智能网络,是党的二十届四中全会提出的“引领发展新质生产力”在工业微观层面的具体实践。全流程场景赋能将打破环节壁垒,实现制造业价值链的系统性优化。巩固壮大实体经济根基,必须依靠产业链全环节的系统性升级。战略部署强调要加速研发设计、中试验证、生产制造、营销服务、运营管理等全流程转型升级。传统的数字化转型往往局限于单一环节的效率提升,而“人工智能+”旨在打通全链条数据流。据麦肯锡全球研究院发布的报告《生成式人工智能的经济潜力:下一个生产力前沿》测算,生成式人工智能预计每年可为制造业带来4000亿至6600亿美元的价值增长。全流程的深度赋能,将推动制造业从“串行链式”生产向“并行网络”协同转变,有力支撑全会提出的“构建以先进制造业为骨干的现代化产业体系”。研发设计与中试验证的智能化突破是疏通产业创新源头的关键。在制造业价值链的顶端,人工智能正在引发科研范式的变革。在研发设计环节,智能体可以自主探索新材料配方、优化药物分子结构,打破人类经验的局限。据《自然-生物技术》报道,某生物医药企业利用生成式人工智能技术,将一款新药从靶点发现到进入临床二期的时间缩短至30个月以内,相比传统流程缩短了近50%,大幅降低了试错成本。在中试验证环节,通过虚拟仿真和多模态融合技术,可以构建高保真的数字孪生体,大幅降低物理试验成本。高价值场景的突破,将疏通科学发现与产业应用之间的“堰塞湖”,提升工程技术创新能力。生产制造与绿色运营的深度智能化是实现降本增效与可持续发展的根本保障。创新成果的落地最终要体现在生产力的提升上。战略部署明确指出,要深化人工智能在核心流程控制、预测性维护等环节的应用,促进生产过程的智能化决策。例如,利用机器视觉技术进行工业质检,能够大幅提升缺陷识别的准确性与效率。同时,人工智能在绿色制造领域的应用潜力巨大,针对能源和碳排放管理,AI模型可以实时优化能源调度,降低单位产出的能耗与碳排放。“智能+绿色”的协同模式,正是全会提出的“加快经济社会发展全面绿色转型”在工业领域的生动实践。普惠型赋能是解决中小企业转型痛点、夯实产业金字塔基座的战略抓手。现代化产业体系不仅需要顶天立地的龙头企业,更需要铺天盖地的中小企业。针对中小企业面临的“不敢转、不会转”难题,战略部署特别强调要培育“懂智能、熟行业”的赋能服务商,发展MaaS(模型即服务)等新业态。通过提供标准化、低门槛的赋能解决方案,降低中小企业开发应用的边际成本,不仅是消除“数字鸿沟”,提升产业链整体的协同效率,更是促进大中小企业融通发展、构建具有韧性的产业生态的重要举措。完善生态体系,以开源开放与安全治理保障产业行稳致远构建全球领先的开源开放生态是提升我国人工智能产业国际竞争力的战略选择。建设现代化产业体系不能闭门造车,要在更高水平对外开放中实现。全会提出“扩大高水平对外开放”,要求我们在人工智能领域构建开放共赢的生态。通过建设高水平人工智能开源社区,部署优质开源项目,并举办“校源行”等活动繁荣开源文化,能够汇聚全球开发者智慧,加速技术迭代。同时,支持企业“出海”,开展技术验证和合规认证,不仅有助于我国制造开拓国际市场,更是积极参与全球人工智能治理、贡献我国方案的重要体现,有助于塑造国际合作竞争新优势。统筹发展和安全,建立敏捷高效的治理机制是人工智能产业健康发展的底线。安全是发展的前提,发展是安全的保障。面对人工智能可能带来的深度伪造、算法歧视和数据泄露等伦理风险,应建立分类分级、评估评测、应急处置等安全政策标准。应高度重视安全保障,明确提出攻关深度合成鉴伪、工业模型算法安全防护等关键技术。通过“知识库优化、训练语料纠错”等技术手段降低大模型“幻觉”风险,提升系统的透明度和可解释性,确保人工智能技术在工业领域的应用既充满活力又安全可控。坚持投资于人和投资于物紧密结合。建设智算中心、数据平台等新型基础设施是“投资于物”,而培养驾驭先进设施的复合型人才是“投资于人”,两者互为表里,缺一不可。应打破传统学科壁垒,依托卓越工程师学院等载体,深化产教融合,重点培养既懂算法原理又精通制造工艺的“两栖”卓越工程师。通过“硬设施”与“软实力”的双重投入与紧密结合,实现创新链、产业链、资金链、人才链的深度融合,为现代化产业体系提供源源不断的动力。[作者系中国电子信息产业发展研究院(赛迪研究院)未来产业研究中心人工智能研究室主任]总 监 制丨王列军车海刚 监 制丨陈 波 王 彧 杨玉洋主 编丨毛晶慧 编 辑丨蒋 帅 -
深度参与自身开发!GPT-5.3 Codex正式发布,速度提升25% 2月6日消息,就在竞争对手Anthropic发布新模型Opus 4.6的几分钟后,OpenAI随即推出了GPT-5.Codex。该模型是周一刚面世的Codex编程工具的重大升级,旨在大幅提升其性能。 OpenAI表示,GPT-5.3 Codex成功整合了GPT-5.2的推理能力、专业知识以及前沿的编程性能。与上一代(GPT-5.2 Codex)相比,新模型不仅能力更强,运行速度也提升了25%。这使其能够胜任需要长时间运行的复杂任务,例如深度调研、自主调用工具以及端到端的流程执行。 GPT-5.3 Codex是OpenAI首个“深度参与了自身开发”的模型。Codex团队透露,他们曾利用该模型的早期版本来调试训练过程、管理部署工作,并诊断测试结果。这种“自我进化”的能力极大加速了开发进程。 通过引入这一新模型,Codex已从单纯的“写代码工具”进化为“电脑协作者”。它不仅能处理编程任务,还支持软件生命周期的全流程工作,包括系统监控、撰写产品需求文档(PRD)以及指标分析。此外,它的代理能力也扩展到了通用办公领域。在GDPval评测中,该模型在制作演示文稿(PPT)、财务分析报表等专业知识工作上展现出了极强的实力。 在多项行业基准测试中,GPT-5.3 Codex 均刷新了纪录: · 在衡量现实世界编程能力的SWE-Bench Pro测试中,它达到了当前最先进水平; · 在OSWorld电脑操作测试中,它能够利用视觉能力在桌面环境中完成复杂生产力任务,表现已接近人类水平。 为了展示其Web开发能力,OpenAI让新模型在几天内从零开始构建了两款功能完整的复杂游戏(赛车游戏与潜水游戏)。在数百万Token的交互规模下,模型能够根据简单的提示词进行自主迭代,生成的代码质量已接近可直接投产的水平。 在安全性方面,GPT-5.3 Codex是首个被归类为“高能力”的网络安全模型。它经过专门训练,能够识别软件漏洞。为支持防御性研究,OpenAI宣布将投入1000万美元的API额度,用于资助开源软件和关键基础设施的防护工作。据悉,该模型是在英伟达(NVIDIA)GB200 NVL72系统上完成训练并提供服务的。 目前,GPT-5.3 Codex已面向ChatGPT付费用户开放,覆盖了应用端、IDE插件及网页端。 这场发布会背后还有一个极具戏剧性的插曲:OpenAI与Anthropic原本都计划在北京时间凌晨2点发布新工具。但Anthropic在最后关头耍了个“小心思”,将发布时间提前了15分钟,在这场发布竞速中抢占了先机。(易句) (本文由AI翻译,网易编辑负责校对) -
互联网络发展报告发布 AI赋能养老、跨境支付互联 释放消费潜力 《中国互联网络发展状况统计报告》昨天(5日)发布。截至2025年12月,我国网民规模达11.25亿人,互联网普及率突破80%,数字发展成果惠及更广泛群体,生成式人工智能用户规模达6.02亿人,较2024年底增长141.7%。人工智能赋能老年康养“养老”迈向“享老”《中国互联网络发展状况统计报告》显示,“十四五”时期,数智技术的加速应用让公共服务更加普惠便捷,特别是人工智能产品以更精准、高效的方式逐渐改善医疗、养老和教育等民生领域的服务质量,深化了互联网普惠成果。人工智能在民生领域创新融合程度加深,极大提升了公众生活品质。如在养老领域,工业和信息化部、民政部联合开展智能养老服务机器人结对攻关与场景应用试点工作,加快推动机器人赋能智慧养老发展。截至2025年12月,我国60岁及以上网民中使用过人工智能的规模达3090万,半年增长944万。 在浙江杭州,记者就探访了一座专门为老年人打造的生活服务创新空间,各种专为老年人设计的智能机器人和装备几乎涵盖了社交娱乐、情感陪伴、健康管理等多个领域。 如AI下棋机器人不仅会下围棋、中国象棋、五子棋等,还会自动调节对弈的难易程度,解决了老年人在家缺少棋搭子的难题,AI智能眼镜也深受老年人的追捧。 杭州市民 刘东芝:如果跟儿子不在一起,有的时候电话接不到,用这个眼镜就能跟儿子联系上,特别方便,能显示出来。智能技术的加速推进和政策的推动,也让智能养老正在从“概念”走向“日常”。目前杭州市实施智慧养老赋能行动,赋能“15分钟养老生活服务圈”升级;上海市已建成70多家智慧养老院,采用智慧体检设备,智能机器人等智能终端康养设备优化适老化服务。 中国国际电子商务中心电商首席专家 李鸣涛:国家在“人工智能+”行动方案里提到了智慧养老服务场景,人工智能和养老的结合是全方位的、多方面的,让复合养老需求能够得到很好的匹配和满足。高级别自动驾驶进入商业化元年《中国互联网络发展状况统计报告》还显示,2025年高级别自动驾驶进入商业化元年。2025年12月,工业和信息化部正式公布了我国首批L3级有条件自动驾驶车型的准入许可,高级别自动驾驶汽车获准在指定区域开展上路试点,产业进入商业化应用的关键一步。根据我国《汽车驾驶自动化分级》,自动驾驶分为L0—L5几个级别,当前广泛投入使用的是L2级,即组合驾驶辅助。L3级为有条件自动驾驶,L4级为高度自动驾驶,L5级为完全自动驾驶。2025年12月,首批L3级自动驾驶车辆在北京和重庆的指定区域进行试点测试。前不久记者也乘坐自动驾驶车辆,体验了重庆繁忙的晚高峰。 刚刚上路不久,记者就遇到了一次复杂路况:左侧车道前方两辆车因为事故停在路边,而画面中白车正在缓慢强行变道。 长安科技智驾系统设计与分析副总工程师 刘玉清:使用了一些先进技术,能让这套系统在近距离横穿、遮挡行人横穿,即“鬼探头”,还有逆光、夜晚、雨雾等状况下,适应性及安全性变得更好。除了记者体验的重庆内环快速路,该车型还获准在交通拥堵状况下的新内环快速路和渝都大道的部分路段实现自动驾驶功能,最高车速不超过每小时50公里。 除了L3级有条件自动驾驶车辆外,L4级即高度自动驾驶无人公交车也在深圳投入使用。这辆车不光没有驾驶员,也没有后视镜、雨刮器,方向盘会自动旋转。中国国际电子商务中心电商首席专家 李鸣涛:未来的智能驾驶汽车更多是依靠了算法算力、传感器,包括未来的车路协同技术,从上车到目的地,全程不用接管,它带给消费者更加惬意、舒适的驾乘体验。跨境支付互联互通释放入境游消费潜力同时《中国互联网络发展状况统计报告》还显示,2025年我国网络支付交易规模保持高位运行,特别是跨境支付互联互通取得突破,统一网关提升入境支付体验,极大提升了境外人士来华消费便利度。在中国人民银行指导下,跨境二维码统一网关于2025年7月底上线试运行。统一网关就像一个“翻译员”和“调度员”,有助于实现不同国家二维码支付系统的互联互通。这也意味着境外人士来华消费,可直接使用其本地电子钱包在中国的商户扫描二维码付款,实现了与在本国一样的支付体验。 2025年在中国入境游的带动下,支付服务加速迭代,外卡支付覆盖率超95%。 中国银联推出的“Nihao China”APP成为核心枢纽,兼容Visa、万事达等国际卡种,覆盖交通、住宿等数千万商户,支持160余种货币实时换算。 支付宝国际版与亚太40个电子钱包合作,1.5亿家商户实现境外本土支付应用直接使用。 广西东兴试点中越跨境二维码支付,越南游客在口岸扫码即可畅享广西美食。 支付便利化释放入境消费潜力的同时,也进一步提升了中国入境游的吸引力。 中国国际电子商务中心电商首席专家 李鸣涛:通过支付的便利性可以解决入境游客消费方面的障碍,同时障碍解决或者便利性提升会成为来华综合消费体验的重要组成部分。(央视) -
春节里一场不得不打、且必须此刻打响的战役 【文/观察者网专栏作者 心智观察所】 除夕夜的倒计时还没开始,互联网世界的硝烟已经弥漫至每个家庭的客厅屏幕。 2026年农历新年前夕,一场代价高昂的战役悄然升级。人们熟悉的“红包大战”仍在继续,但舞台中央的主角,已悄然从移动支付应用,换成了野心勃勃的AI助手。 阿里巴巴旗下的“千问”掷出三十亿启动“春节请客计划”,腾讯“元宝”豪撒十亿现金红包,百度“文心”亦分五亿入局。而字节跳动,则以一种更隐晦却更深入的方式参战——成为央视春晚的独家AI云合作伙伴。粗略计算,几家巨头为这个春节预备的营销弹药,已经超过四十五亿元。 这场看似熟悉的“撒钱”竞赛,内里却进行着一场彻底的基因置换。巨头们争夺的,早已不是用户钱包里那个小小的支付通道,甚至不再是某个应用的下载数字。它们真正押注的,是定义下一个时代人们如何与机器对话、如何与世界交互的“超级入口”权。 中国互联网产业的核心叙事,由此正式从移动互联网的流量内卷,转向AI原生生态的卡位与构建。 临界点:一场不得不打、且必须此刻打响的战役 为什么是2026年?为什么是这个春节?一切偶然的背后,是技术曲线、市场水温与竞争态势交汇成的必然。 首要的原因是,用户心智的堰塞湖到了必须开闸泄洪的临界点。数据显示,中国生成式AI用户规模在2025年中已突破5亿大关。 这意味着,AI已经完成了从极客玩具到大众谈资的跨越,正悬在“广泛使用”的门槛之上。春节,这个中国社会注意力最集中、代际交流最频繁、尝试新事物意愿最强烈的国民级场景,自然成为了教育市场、植入习惯的最佳“预装”时机。 每一家巨头,心底都藏着一个2015年微信红包借助春晚逆袭支付宝的旧梦,它们渴望复刻的,正是那种一夜之间重塑数亿人习惯的“神话”。 更深一层看,技术竞赛的宽容窗口正在急速收窄。有观察者指出,科技革命的节奏一代快过一代。个人电脑时代,领先者可以享受十数年的红利;移动互联网时代,从iPhone问世到格局初定,压缩到了四年;而在AI时代,这个窗口期可能更短。 字节跳动掌门人梁汝波将豆包定为必须短期攻克的“山头”,并坦言“时间窗口”不等人,这并非危言耸听。当各家的基础模型能力都已迈过“可用”的门槛后,纯粹的技参数比拼让位于生态和场景的落地速度。此时,一场高强度的、覆盖数亿用户的“压力测试”兼“心智强占”行动,就成了确立市场地位的胜负手。 战场虽硝烟弥漫,但格局远未板结。头部的AI应用,用户量级或许已有差距,但并未形成类似微信或淘宝那样令人绝望的护城河。市场仍处于混沌的青春期,任何一方都有机会通过一次精准而猛烈的侧翼攻击,改变战局。腾讯核心人物马化腾公开承认在AI领域“动作慢了”,并视其为“唯一值得投入的方向”,其背后正是这种迫在眉睫的危机感与抓住窗口的急切。 因此,2026年春节的这场豪赌,是一场在正确时机、正确地点发起的战略性决战,目标直指未来十年的产业座次。 基因决定论:四大巨头的路径分叉 有趣的是,尽管目标一致,但四位重量级选手选择的攻击路径却大相径庭,宛如一场企业基因的公开展览。 阿里的打法,充满了“商业帝国”的厚重感。三十亿的“请客计划”,金额创下纪录,但其精髓绝非简单撒钱,而是将红包与自身庞大的商业生态进行毛细血管级的缝合。活动串联起淘宝、飞猪、盒马、高德等几乎所有核心业务,口号直指“吃喝玩乐,免单不停”。 这背后的逻辑清晰而霸道:他们要证明,千问不再是一个陪你闲聊的机器人,而是一个能真正办事的智能枢纽。从“一句话点外卖”到“直接订机票酒店”,阿里试图将AI的价值,从信息生成延伸到交易履约,完成从“对话”到“办事”的商业闭环。 这是一条典型的“产业渗透”路线,依托其深厚的B端基建和商业生态,在C端市场筑起一道以交易和数据为核心的护城河。如果成功,阿里将把AI变成其商业操作系统的自然延伸。 腾讯的选择,则深深烙印着“社交王者”的肌肉记忆。元宝的十亿红包,从设计上就在复刻十一年前那个决定性的夜晚:红包可直达微信零钱,传播完全依靠微信与QQ的关系链裂变。其意图不言自明——他们想要重现那个凭借社交关系一夜逆袭的“诺曼底时刻”。腾讯的威力在于,它能以最低的成本,瞬间唤醒中国互联网最庞大、最活跃的社交网络。活动启动后,元宝红包链接会如野火般蔓延至无数微信群,甚至引起部分用户对“群聊变任务板”的调侃,而这恰恰是其策略成功的注脚。 然而,腾讯真正的挑战不在于外部获客,而在于内部进化:如何在不损伤微信这个“国民级应用”体验的前提下,完成整个生态的AI化转型。其内测的“元宝派”功能,试图在群聊中创造一个AI与真人共存的社交子空间,正是这种将AI能力“原子化”并注入社交基因的关键实验。 字节跳动的战术,则体现了其“颠覆者”的激进本色。它没有在现金红包的数额上正面交锋,而是剑走偏锋,拿下了“央视春晚独家AI云合作伙伴”这个更具象征意义的制高点。通过火山引擎为春晚提供底层支持,让豆包深度参与节目互动,这无异于一场面向全国观众的技术可信度“路演”。 但字节的野心远不止于一个App的曝光。它的战略是“抢占一切可能的入口”,从试图成为操作系统级智能体的“豆包手机助手”,到传闻中的AI硬件,字节在布局一个“无处不在的豆包”。这条“系统级”路线之所以危险,是因为它试图越过现有应用商店的规则,直接成为用户与数字世界交互的底层中介。这不可避免地会与微信、支付宝等超级应用产生关于边界、隐私与控制的摩擦。春晚,对字节而言,既是技术实力的成人礼,也是为其更庞大的生态蓝图争取公众信任的关键一票。 百度的路径,显露出“老牌搜索巨头”的独特思虑。它没有强力推广一个独立应用,而是将五亿红包活动,丝滑地嵌入月活超七亿的百度App中。用户无需额外下载,在传统的搜索框旁,就能自然唤起文心助手并参与活动。这是一种“无感迁移”策略,旨在将搜索时代积累的巨量用户与习惯,平稳过渡到AI时代,巩固其“搜索+AI”作为信息获取第一入口的地位。同时,通过成为北京台春晚的AI合作伙伴,并推出大量AI创意玩法,百度在娱乐场景中展示其多模态能力,以吸引更广泛、更年轻的用户群体。 红包雨之后:生态卡位与持久战的无形战场 在除夕的钟声敲响,红包雨落定后,真正的竞赛其实才刚刚拉开序幕。这场战争的本质,早已超越了流量争夺的浅滩,进入了深水区的生态卡位。竞争的焦点,正从实验室里的“技术赛马”,转向现实世界的“场景刺刀战”。评判标准不再是冰冷的跑分,而是谁能调用更多服务、解决更具体的问题。 因此,我们看到了阿里整合内部商业版图,腾讯探索社交场景重构,字节布局硬件与系统底层,而百度则通过开放协议连接外部服务。未来的AI入口之争,必将是生态体系丰富度、开放性与协同效率的全面对抗。 随之而来的终极考验,是“用户留存”这个古老而残酷的命题。历史反复证明,依靠补贴吸引的用户,其忠诚度如同流沙。春节狂欢过后,如何避免用户“领完即走”,是横亘在所有玩家面前的峭壁。这也解释了为何各家的活动设计,都千方百计诱导用户与AI进行真实、多次的交互——它们试图利用春节这个高强度使用期,强行“编译”用户新的行为习惯。 然而,能否让AI从“节日玩具”变为“日常工具”,取决于它是否提供了微信般的社交刚性或淘宝般的消费便利,这远非一场营销闪电战所能保障。 最终,一切喧嚣都将回归商业的本质:可持续性。目前,主流AI应用仍处于巨额投入的“输血”阶段。寻找健康的商业模式——无论是订阅制、企业服务还是交易抽成——是整个行业悬而未决的达摩克利斯之剑。春节的烧钱大战,在完成惊险的用户获取一跃后,如何将流量转化为长期价值,是巨头们必须面对的、比春节营销更复杂也更深刻的下一道难题。 2026年春节的这场AI狂欢,是中国互联网巨头在时代换轨前夜集体焦虑与战略抉择的集中展演。阿里、腾讯、字节、百度,沿着各自基因图谱预定的轨迹,投入重兵,向同一个模糊而巨大的未来入口发起冲锋。 这场战役的最终胜负,并不会在元宵节的灯火中揭晓。真正的赢家,或许不是除夕夜数据最漂亮的那一个,而是在节后漫长的平凡日子里,能让AI技术如空气般融入亿万用户的生活纹理,并在此基础上,构建出一个真正繁荣、稳固且具有生命力的新生态的那一位。 本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。 -
“太意外了……竟然一抬头看见马老师!”马云深夜现身阿里总部,和这件事有关 “太意外了……竟然一抬头看见马老师!”2月4日晚9点30分左右,一位阿里员工在社交媒体分享自己在园区偶遇马云的经历,并拍下一张照片。图片显示,马云所在的位置,是位于阿里全球总部的千问项目组区域。 这位网友说:“远远走着还以为眼花了,细看下竟然还真是啊!戴着帽子,看着挺放松的。准备大请客,开心过大年!”据说昨晚马云现身阿里总部,是为了慰问千问春节项目组。 事实上,今年春节的第一波年味,是AI带来的,也被认为是首个“AI春节”。继腾讯元宝10亿元现金“摇人”后,从2月6日起,千问将正式启动30亿元 “春节请客计划”,以免单福利请全国人民春节吃喝玩乐,沉浸式体验 AI 时代的全新生活方式。这一投入不仅刷新了阿里历年春节活动的投入纪录,也是今年春节各大厂 AI 大战中投入最高的。如果说去年春节是“深度思考”出圈的DeepSeek时刻,这个春节,可能是“AI生活Agent”出圈的千问时刻,有望开启全球AI购物元年,普及AI时代新的生活方式。有业内人士猜测,千问App或将会延续“会办事”的思路,推出AI买年货、奶茶咖啡、电影票、飞机票、酒店、景点门票等功能,并通过请客的方式直接免单。其间不需要在多个APP间反复跳转,只需要向AI表达意图,就可以完成从决策到履约的全过程,带来AI时代的全新消费体验。橙柿互动·都市快报 记者 沈积慧 -
奥尔特曼评“AI专属社区”Moltbook:或为昙花一现,技术代表未来 IT之家 2 月 4 日消息,据路透社报道,当地时间周二,OpenAI CEO 奥尔特曼表示,最近爆红的 AI 社交网络 Moltbook 可能只是昙花一现的现象级产品,但支撑 Moltbook 运作的“机器人自主行动”能力,才真正代表未来方向。奥尔特曼是在旧金山举行的思科 AI 峰会上作出这一判断的。在这次峰会上,“AI 专属社区”Moltbook 成为大佬们热议的话题。据IT之家了解,Moltbook 是一个类似 Reddit 的平台,AI 机器人会在上面互相交换代码,甚至议论自己的“人类主人”。 Moltbook 最初只是上个月末的小圈子实验,却迅速演变成一场更大的讨论焦点:计算机距离真正具备类人智能还有多远?热度背后也伴随着安全隐患。网络安全公司 Wiz 指出,Moltbook 存在严重漏洞,导致数千名真实用户的隐私数据意外暴露。Moltbook 的主要“居民”是一个曾叫作 Clawdbot 或 Moltbot 的开源机器人 OpenClaw。支持者把 OpenClaw 视为全能助手:可以管理邮件、对接保险事务、办理航班值机,并完成各种复杂任务。奥尔特曼说:“Moltbook 也许只是昙花一现,但 OpenClaw 不是。代码本来就很强大,而代码结合通用电脑操作能力,会更加强大,这种趋势不会消失。”Anthropic Labs 负责人迈克 · 克里格在峰会上谈到 OpenClaw 的热潮时指出,大多数人目前还没准备好让 AI 完全接管自己的电脑。奥尔特曼还提到 OpenAI 的 Codex,并强调 Codex 也具备类似潜力。Codex 上个月的使用开发者超过 100 万。然而他也认为,AI 的普及速度比自己预期慢得多,即便应用场景已经扩展到医学研究和软件开发等多个领域。“我当时可能太天真,没有深入思考这一点。现在回过头看,再结合历史经验,其实不该感到意外。” -
黄仁勋否认与OpenAI交易生变传闻 在近期市场传出英伟达与OpenAI合作触礁的流言后,英伟达CEO黄仁勋接受采访时回应,双方关系“完全没有争议”,投资计划正“按计划推进”。黄仁勋确认英伟达将参与OpenAI的下一轮融资,并将其定义为“史上最大规模的私募融资”。此外,他透露英伟达有意参与OpenAI未来的每一轮融资,直至其最终IPO。双方曾达成初步意向,英伟达计划向OpenAI投资最高1000亿美元,而OpenAI则承诺构建基于英伟达技术的10吉瓦级AI基础设施。OpenAI首席执行官Sam Altman近期也打破沉默,在社交平台上赞誉英伟达制造了“世界上最好的AI芯片”,并表达了长期合作的意愿。Altman坦言目前OpenAI算力供给不足,无法完全满足ChatGPT等产品的需求。 -
两会对话|钛米机器人董事长潘晶:中国将在十年内成为全球机器人产业源头 “上海机器人产业正站在一个全新的历史起点上。雄厚的产业基础、齐全的产业门类、丰富的应用场景和成熟的资本市场,是上海发展机器人产业最宝贵的财富和最坚实的依托。” 2月3日,上海市人大代表、钛米机器人董事长潘晶在接受澎湃新闻记者采访时表示,机器人作为变革中的关键载体和未来产业的核心方向,是数万亿级美元的巨大市场,而目前产业总量不足百亿,这一战略性的时机点对于中国,对于上海都是一个千载难逢的产业机遇。潘晶认为,与AI产业源头仍在硅谷不同,机器人产业技术创新+制造的双重属性与中国产业核心优势高度匹配,加上应用市场的场景丰富和规模巨大,中国很有可能十年内在全球机器人产业上成为产业源头。潘晶认为,一个值得关注的现象是,由于科创板对于盈利能力和“硬科技”属性的严格要求,对于收入体量不大且属于应用型技术的机器人企业并不友好,许多稍具规模、细分行业领先但尚未实现稳定盈利的机器人公司,被迫选择远赴香港交易所递交上市申请。这不仅造成本土优质资产的流失,也削弱了上海资本市场对产业的牵引力。潘晶在建议中提到,据非官方统计,2025年当年,上海几乎所有细分领域冒头的机器人企业都递表港交所。这一方面反映了企业发展的迫切融资需求,另一方面也折射出上海本土资本市场在支持和培育机器人这类长周期、高投入的未来产业方面,仍存在一定的机制性障碍,需要进一步优化和完善。潘晶告诉澎湃新闻记者,目前行业内存在一个比较突出的问题——由于缺少精准的数字支撑,很多细分场景下没有产出符合市场期待的机器人产品,这也是制约机器人产业进一步发展的关键瓶颈之一。卖油翁之所以能做到“惟手熟尔”,关键就在于长期针对性的训练。人通过训练可以熟练掌握特定技能,机器人产业的发展也是如此,未来机器人必须依据具体的应用场景,完成系统化的训练,才能更好地适配需求、发挥价值。潘晶建议,绘制上海机器人产业地图,摸清企业底数、细分市场、产业链分布和人才状况,建立动态更新的产业数据库。梳理目前市、区政府固投以及服务采购项目中可以使用相关机器人技术进行产业升级的范围,构建存量“升级”市场,同时从“十五五”投资计划中规划增量,为企业提供市场地图。从推动机器人产业发展角度制定两个维度的目标:机器人本体要“上量”, 具身智能模型要“突破”,针对各类机器人需求侧,特别是有需求但“用不起”的潜在客户,制定相关补贴政策;针对机器人供给侧,特别是有落地案例,需批量复制的企业制定相关奖励政策。同时对于已经初步落地的细分应用场景建立中试平台,推动语料积累,构建数据集和训练场,加速细分行业具身模型的训练、部署和迭代使用。潘晶提到,利用浦东政策以及立法优势,先形成政策验证的小闭环,加快探索在智慧医院和社区卫生中心建设、智能工厂改造、公共服务(养老、环保等)投入等政府固投以及服务采购项目中的存量“升级”市场,新基建、智能化、高质量发展等有财政支撑的增量市场,明确一定比例的增量资金,采购本地创新机器人产品系统,打通产业精准扶植的任督二脉,加快扶植独木/独角类企业上市。针对不同机器人应用场景遇到的与现行管理,伦理,安全等政策法规方面的不适配以及风险防范机制,探索治理、立法、各相关产业机器人赋能和机器人行业发展的“上海模式”。澎湃新闻记者 范佳来 -
阿里深夜开源80B编程模型!专攻智能体,周靖人、林俊旸最新成果发布 智东西 作者 李水青 编辑 心缘 智东西2月4日报道,今日凌晨,阿里开源了一款小型混合专家模型Qwen3-Coder-Next,专为编程智能体(Agent)和本地开发打造。该模型总参数80B,激活参数仅3B,在权威基准SWE-Bench Verified上实现了超70%的问题解决率,性能媲美激活参数规模大10-20倍的稠密模型。Qwen3-Coder-Next的主要增强功能如下:1、高效MoE架构:仅需激活3B参数,可达到与激活参数数量高出10-20倍的模型相当的性能,包括37B激活参数的DeepSeek-V3.2、32B激活参数的Kimi K2.5等,降低显存与算力需求。2、更强智能体能力:擅长长段推理、复杂工具使用以及从执行失败中恢复,在动态编程任务中性能强大。3、与真实世界的IDE多样化集成:其256k的上下文长度,加上对各种脚手架模板的适应性,使其能够与OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等不同的CLI/IDE平台无缝集成,支持多样化的开发环境。Qwen3-Coder-Next在实际开发中能理解需求、编写代码,还能与环境交互、完成任务,可以在没有人工干预的情况下生成可玩的网页游戏,部署服务并自动测试。阿里在编程智能体上进展不断。就在昨日,阿里云CTO周靖人、阿里千问大模型技术负责人林俊旸署名的论文在Arxiv平台上发表,为推进下一代编程Agent的发展提供了新资源和可靠方法。简单来说,他们提出了一个可扩展的高效框架SWE-Universe,用于从GitHub拉取请求自动构建真实世界的软件工程(SWE)可验证环境。利用一个构建Agent,团队将真实世界的多语言SWE环境的数量扩展到接近百万级(807693 个)。最后,团队将该技术应用于Qwen3-Max-Thinking,并在SWE-Bench Verified测试中取得了75.3%的高分。 ▲论文截图论文地址:https://www.arxiv.org/abs/2602.02361回到本次面向产业推出的新模型来看,团队已正式开源Qwen3-Coder-Next(Base)与Qwen3-Coder-Next(Instruct)两个版本,支持研究、评测及商业应用多种场景。Qwen3-Coder-Next一经发布引起了广泛关注,有网友在社交平台X上称这一模型“尺寸完美”,也有网友表示自己等便携版的Qwen3-Coder已经很久了。 ▲社交平台X网友对Qwen3-Coder-Next模型的部分评论魔搭社区地址: https://www.modelscope.cn/collections/Qwen/Qwen3-Coder-Next Hugging Face地址: https://huggingface.co/collections/Qwen/qwen3-coder-next GitHub地址: https://github.com/QwenLM/Qwen3-Coder 技术报告地址: https://qwen.ai/blog?id=qwen3-coder-next一、实测媲美10-20倍激活参数稠密模型,赶超DeepSeek 尽管激活参数规模很小,Qwen3-Coder-Next在多项智能体评测上仍能匹敌或超过若干更大的开源模型。该模型在SWE-Bench、TerminalBench 2.0和Aider等多个主流编程智能体基准上的表现如下。 ▲Qwen3-Coder-Next实测表现使用SWE-Agent框架时,Qwen3-Coder-Next在SWE-Bench Verified上达到70%以上,超过了DeepSeek-V3.2,接近GLM-4.7、MiniMax M2.1。在多语言设置以及更具挑战的SWE-Bench-Pro基准上,Qwen3-Coder-Next同样超过了DeepSeek-V3.2,还较大幅度领先于GLM-4.7、MiniMax M2.1。在效率方面,Qwen3-Coder-Next与同类模型在SWE-Bench-Pro基准上进行对比分析,每次推理仅激活3B参数,却能达到与激活参数量达其10-20倍的模型相当的基准性能,包括37B激活参数的DeepSeek-V3.2、32B激活参数的GLM-4.7、32B激活参数的Kimi K2.5等。虽然专有的全注意力模型在绝对性能上仍保持领先优势,但Qwen3-Coder-Next在面向低成本智能体部署的应用场景中,仍能在效率与性能之间取得更优的帕累托权衡。 ▲Qwen3-Coder-Next实测表现二、创新智能体训练配方:强化智能体训练的信号 Qwen3-Coder-Next模型基于Qwen3-Next-80B-A3B-Base构建,采用混合注意力与MoE的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在降低推理成本的同时,提升编程与智能体能力。Qwen3-Coder-Next并不只依赖参数规模扩张,而是将重点放在扩展智能体训练信号(agentic training signals)上。团队使用大规模的可验证编程任务与可执行环境进行训练,让模型能够直接从环境反馈中学习,而非仅依赖静态文本。训练过程主要包括:1、持续预训练:在以代码与智能体为中心的大规模数据上进行。2、监督微调:基于高质量的智能体交互轨迹,优化模型的行为。3、领域专家训练:针对软件工程、问答、Web/UX 等特定领域,精细化专家能力。4、专家知识蒸馏:最终将27个专家的能力融合至一个轻量的、可部署的单一模型。这套“配方”的核心目标,是教会模型长时程推理、熟练使用工具,以及从执行错误中有效恢复——这些正是实用编程智能体所需的核心能力。三、多样化集成下游应用,游戏生成测试无需人工干预 Qwen3-Coder-Next的价值还体现在于其低部署门槛与应用体验。得益于仅3B的激活参数,开发者可灵活将其集成至多种场景:作为本地IDE插件,实现自动修复与代码生成;构建命令行智能体(CLI Agent),通过自然语言操作终端、管理项目;部署于企业内网环境,打造私有化、高响应的编程辅助系统。“小激活、快响应、强能力”为编程智能体的规模化落地提供了更具可行性的路径。该模型可集成到多种下游应用中,覆盖OpenClaw、Qwen Code、Claude Code、Web Dev、Browser use、Cline等多种开发环境。结语:研发落地双投入,阿里加码编程智能体 编程智能体正成为阿里通义千问团队的强攻领域。Qwen3-Coder-Next在编程智能体基准上表现强劲,展现了技术在实用场景中的应用价值。而周靖人、林俊旸署名的新论文则代表了其编程智能体新的前沿进展,形成了研发和落地两条路快步走的趋势。展望未来,团队认为强大的智能体能力,如自主使用工具、应对难题、管理复杂任务,是更好编程智能体的关键。接下来团队计划提升模型的推理与决策能力、支持更多任务,并根据使用反馈快速迭代更新。 -
黄仁勋全球连轴转,最新演讲称AI将重塑全球工厂 英伟达CEO黄仁勋最近的行程非常满。当地时间1月21日,黄仁勋在瑞士举办的达沃斯论坛上大谈过去一年AI模型的三大进展。随后,他开启访华行程,先后出现在上海、北京、深圳、中国台湾。当地时间2月3日,黄仁勋又出现在工业软件公司达索系统于美国休斯顿举办的活动上,这次演讲的主题是工业AI。“过去,我们花了1/3的时间在设计和数字化上,也许花了2/3的时间在构建物理形态上。未来很有可能我们将花100%的时间在数字化上。即使完成了设计、模拟、验证,还必须做软件集成。”黄仁勋称,无论是设计、描绘、模拟还是操作,未来都将由软件定义,从一双网球鞋到其他所有东西都是如此,汽车是软件定义的,机器人所在的工厂也是软件定义的。 当天英伟达宣布了与达索系统的合作,双方将利用虚拟孪生技术合作构建工业AI平台,达索的虚拟孪生技术将与英伟达AI基础设施、开源加速软件库结合,建立经科学验证的行业世界模型,用于生物学、材料科学、工程和制造等领域,除了在工程和制造领域实现软件定义的生产系统,还能用于推动新分子和下一代材料发展。黄仁勋表示,双方技术的融合将使工程师能在比以往大10万倍的规模上开展工作,工作时看到的不再是预先渲染或离线模拟画面,而是实时生成的虚拟孪生世界。工程师设计产品、在风洞中实时模拟、模拟机器人实时运行,在接下来5~10年将带来非常大改变。谈到物理AI与仿真的结合,黄仁勋表示,AI可以学习如何预测物理行为,当这个过程实时运行时,就能预测1万倍以上的规模,在设计中结合模拟和仿真将带来革命性改变。而在工厂中,数以百万计的工厂可以在虚拟孪生世界中先完成生产线安排、机器人组织等。“今天,制造和物流系统僵化、难以扩展且脆弱。”在媒体沟通会中,达索系统研发执行副总裁Florence Hu-Aubigny向记者表示,未来工厂则将由软件定义生产系统,物理AI与虚拟孪生技术结合将使工厂能在虚拟环境中测试和重新配置生产,使相应过程的耗时从几个月缩短至几个小时。AI工厂的复杂性更是比普通工厂复杂,如果不进行预先模拟,就难以确保整个系统正常工作。黄仁勋也提到AI工厂等基础设施建设中应用相关技术的必要性。他提到,现在全世界开始了史上最大规模的工业基础设施建设,价值数万亿美元甚至数十万亿美元的基础设施正在被建造。为满足AI基础设施建设需求,有三个产业正在扩大规模:芯片工厂、计算机工厂和AI工厂。这些工厂非常复杂,在破土动工之前,先在虚拟孪生世界设计和模拟将能节约大量时间和金钱。近一年来,英伟达频频在工业AI领域布局。去年6月,英伟达宣布在德国建设全球首个工业AI云,配备1万颗Blackwell GPU,在英伟达展示的图景里,汽车可以在虚拟环境中设计,机器可以在虚拟环境中训练,并在优化后放到现实工厂运行。黄仁勋提出,每个制造商都将有两个工厂,一个用于制造产品,另一个创造驱动这些产品的智能。