找到
918
篇与
互联网
相关的结果
- 第 29 页
-
谷歌云深化与Palo Alto Networks合作,签署近100亿美元AI安全大单 谷歌云与网络安全公司Palo Alto Networks扩大战略合作,签署了一份价值近100亿美元的多年期合同,成为谷歌云迄今最大的安全服务交易。12月19日,据路透社援引知情人士报道,该合同包括Palo Alto Networks承诺在未来几年内向Google Cloud支付“接近 100 亿美元”的款项。双方将重点围绕人工智能驱动的安全服务展开联合开发。双方高管指出,随着生成式AI工具被用于发动网络攻击,企业对AI驱动的安全解决方案需求显著提升。此次合作不仅进一步强化了谷歌云在由AI重塑的云计算竞争中相对于亚马逊和微软的优势,也为Palo Alto Networks在快速扩张的AI安全市场中提供了关键技术支持。合作细节与资金用途 据知情人士透露,该份价值接近100亿美元的合同将分阶段执行。尽管双方高管未披露具体金额,但Palo Alto总裁BJ Jenkins向路透社表示,部分资金将用于将公司现有服务迁移至谷歌云平台,而大部分将投入于开发基于人工智能的新型安全服务。谷歌云首席营收官Matt Renner表示:"AI催生了对安全服务的巨大需求。"Jenkins则将当前形势比作云计算兴起初期:"这与云计算开始出现时的情况相同,出现了人们从未想象过的新安全威胁。"AI重塑网络安全格局 网络攻击正日益频繁地利用生成式AI工具,而这恰恰也是安全服务提供商用于强化防御的关键技术。Jenkins指出,尽管AI已对软件开发等业务功能带来根本性变革,但网络安全领域的AI应用仍处于发展初期。为应对企业日益增长的AI安全需求,谷歌与Palo Alto Networks均在该领域持续加大投入。谷歌以320亿美元收购安全公司Wiz的交易正等待监管机构批准,而Palo Alto Networks已于10月推出AI驱动的安全服务,并于上月宣布计划以33.5亿美元收购软件公司Chronosphere。战略合作历史与竞争优势 两家公司自2018年起已建立战略合作关系。值得关注的是,Palo Alto首席执行官Nikesh Arora曾任谷歌高管,直至2014年担任首席业务官。谷歌云首席营收官Matt Renner表示,此次新合作突显了谷歌云在AI驱动的竞争格局中,相比亚马逊和微软等其他超大规模云服务商所具有的差异化优势。这标志着谷歌云在企业级AI安全服务市场实现了一次重要突破。 -
光合组织2025人工智能创新大会在江苏昆山举行 来源:新华网 12月18日,人们在人工智能创新大会展区体验机械臂AI素描画。 12月18日,光合组织2025人工智能创新大会在江苏昆山正式开幕。大会以“智算无界,光合共生”为主题,吸引2500余家企业参会,通过200余场分享会与5000余平方米实景展区,展示AI计算技术、产品、应用与生态等方面的成果。 新华社发(王须中摄) 12月18日,人们在人工智能创新大会展区参观。 12月18日,光合组织2025人工智能创新大会在江苏昆山正式开幕。大会以“智算无界,光合共生”为主题,吸引2500余家企业参会,通过200余场分享会与5000余平方米实景展区,展示AI计算技术、产品、应用与生态等方面的成果。 新华社发(王须中摄) 12月18日拍摄的人工智能创新大会峰会现场。 12月18日,光合组织2025人工智能创新大会在江苏昆山正式开幕。大会以“智算无界,光合共生”为主题,吸引2500余家企业参会,通过200余场分享会与5000余平方米实景展区,展示AI计算技术、产品、应用与生态等方面的成果。 新华社发(王须中摄) 12月18日,人们在人工智能创新大会展区参观。 12月18日,光合组织2025人工智能创新大会在江苏昆山正式开幕。大会以“智算无界,光合共生”为主题,吸引2500余家企业参会,通过200余场分享会与5000余平方米实景展区,展示AI计算技术、产品、应用与生态等方面的成果。 新华社发(王须中摄) -
复兴岛上风云际会:量子城市基地,让人工智能“睁眼看世界” 近期,全球人工智能领域有了新共识。12月16日,谷歌“DeepMind”首席执行官德米斯・哈萨比斯在新一期播客中称,囿于数字空间的“语言模型”即将走入瓶颈,能够理解真实物理世界的“世界模型”才是未来方向。新一轮人工智能风起之际,上海一座小岛,进入国际视野。12月18日,上海复兴岛—全球创客岛启动暨2025上海量子城市年度大会举行。据介绍,复兴岛将建设智能基础设施,按照每平方公里10万个的标准分步实施全岛智能感知设施布设;另外,提升时空智能体能力,构建新质产业线上线下一体的实训场。随着新一代人工智能技术快速演进,一幅承载无限想象力的城市画卷,即将从复兴岛向世界铺开。为人工智能构建“世界模型”人工智能技术加速迭代,唯有抢抓机遇,才能捕捉前沿的科技变革。2024年12月,“上海量子城市时空创新基地”在上海复兴岛开启。清华大学建筑学院副教授、自然资源部智慧人居环境技术创新中心副主任杨韬认为,上海从时空智能开启量子城市建设,走在国际科技变革最前沿。过去几年,人工智能看起来越来越“聪明”了。然而科学家们发现,这些模型仍有较大局限性。比如,它们能在国际数学奥林匹克拿金牌,也会在小学几何题上出错;它们可以生成惊艳的图像,却不理解杯子为什么不会飘在空中。这是因为基于语言的模型,无法习得难以用语言描述的知识,比如空间如何构成、时间如何推移。一言以蔽之,语言模型只读过书,却没接触过真实的物理世界。读万卷书,也要行万里路。为此,上海正在不断搭建人工智能的训练场。今年2月,全国首个异构人形机器人训练场在沪启用,近10家企业超百台硅基“学员”进入专业“技校”,有的训练抓取土豆丝,有的训练修理家电,有的组队踢足球……7月,上海发放首批智能网联汽车示范运营牌照,全市首辆无人智驾出租车现身城市道路,曾经只能在道路测试的智能网联汽车,迈上商业运营的新阶段。一方面,是“大力出奇迹”式的堆训练量;另一方面,则是从基础研究层面构建新的算法模型。比如,依托可感知的城市环境,为人工智能构建“世界模型”。2025全球开发者先锋大会上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智谈到具身智能时指出,当前主流方法多依赖模仿,缺乏可解释的“世界模型”和物理的因果推理。在杨韬看来,这也是上海量子城市时空创新基地的使命。一座城市最“酷”的事莫过于——在每一处道路里弄、每一栋塔台楼宇、每一片林荫草坪、每一条河流小溪安装智能感知设施,让从诞生起便“行走于黑暗”的人工智能试着“睁眼看世界”。依托城市构建“世界模型”,也是一个“升维”的过程。“如果把文字和自然语言看成一维信息,图像和视频看成二维和2.5维信息,那么基于时间与空间的城市至少是四维信息。”杨韬说,城市自身的复杂性,以及人工智能如何理解城市生产生活的不确定性,也是上海量子城市建设关注的本质问题。环球同此凉热。上海量子城市所关注的“本质问题”,近来也正被越来越多顶尖科学家推上风口浪尖。11月,斯坦福大学教授、World Labs联合创始人李飞飞发表长文称,“空间智能”是人工智能的下一个前沿,定义未来十年的发展方向。相隔一日,图灵奖得主、前Meta首席AI科学家杨立昆宣布将离职,成立一家专注“世界模型”的新公司。 复兴岛。赋予城市治理更强感官和大脑人工智能需要城市,城市也需要人工智能。在这场双向奔赴中,打造科技创新的策源力的另一面,是探索超大城市的空间治理。上海量子城市时空创新基地在复兴岛开启一年来,已发布1个时空数智底板、1个专业语料库、10个应用场景等多项成果。比如,量子城市时空数据共享平台1.0版实现基础地图、三维模型等8类数据汇集共享,全国首个规划和自然资源领域专业语料库形成“1+4+X”语料体系,以及沪派江南、耕地巡查执法、苏河安全、数字气象等应用场景。大学路是杨浦区最有活力的街区之一。沿街创意商铺赏心悦目,每逢节假日,到此漫步的年轻人总是摩肩接踵。可你知道,对于大客流可能造成某些点位的人流聚集,应该如何动态研判进而精准疏导吗?如今,人工智能技术为城市精细化治理赋予了更强的感官和大脑。阿里云智能集团自然资源行业资深产品经理陈怡星介绍,今年在大学路沿线800米范围内,建立了悟空城市空间智能监测评估垂类模型的“米料”级试点区。在量子空间中,团队对物理世界中的三维空间进行精细划分,并在此基础上构建了四维的“时光盒子”,形成模型可理解的数据集,进而模型的时空诊断能力。比如,“时光盒子”精确地记录了今年11月某日,街区在中午12点前后达到当日人流峰值4.53万人。人流的实时密度、活动轨迹、进店转化率等指标,也可通过模型呈现得一目了然。苏州河是上海的母亲河。每到傍晚时分,两岸建筑群的轮廓渐次亮起,苏州河的夜色越来越迷人。可你知道,对于台风或暴雨等极端天气造成水位上涨,应该如何动态防汛吗?如今,人工智能技术也成了城市防汛保障的守护者。上海市水利工程设计研究院有限公司总经理刘新成介绍,依托“量子城市”智能时空底板,构建了一套具备预报、预警、预演、预案功能的数字孪生苏州河防汛系统。系统精准复刻了苏州河水下地形、沿线水利设施、排水管网、桥梁等数字模型,成为一套高精度、可计算的时空底板。系统融合气象预警、实时感知等信息,引入水动力模型进行实时推演,从而对不同降雨条件下的内涝风险进行智能预警。一端连着云端民生需求,一端连着智能基层治理。在曹杨新村,“美好生活掌中宝”构建了三维数字孪生社区,让掌上地图、数字集市、社区议事厅等“云端生活圈”在市民手中一站式集成。“看不见的大气”,也正在成为可计算、可交互、可推演的新型城市基础设施。依托复兴岛智能体试点,上海市气象信息与技术支持中心将百米分钟级大气实况分析产品与10m太格网相耦合,把天气变量写入城市运行代码。 大学路。向全球创客发出“未来之约”人工智能是年轻的事业,也是年轻人的事业。关注复兴岛的人知道,复兴岛—全球创客岛启动前,复兴岛的定位是“国际创新创业集聚区”“国际创新创业岛”。从“创新创业”到“创客”,一字之差折射了复兴岛对人才的求贤若渴。当前,在全球科技竞争已愈发重视“人才密集”。只有加大对人的投资,形成“人才红利”,才能在新一轮科技革命和产业变革中赢得战略主动。上海量子城市的建设之中,智能基础设施、要素开放共享之外,关键也在于人才。不久前,复兴岛上刮起一阵青年创业人群喜闻乐见的三股“青春风暴”。小红书举办RED LAND开放世界冒险岛活动,工业风撞上二次元,全球首座二次元“痛岛”三天吸引10万人登岛。哔哩哔哩“干杯音乐节”火热开唱,吉他声响起,锈迹斑斑的老厂房外,站满了随音乐摇摆的年轻人。2025上海城市空间艺术季启幕,斑驳的巨型塔吊下,视线跟随“科技猫”的目光仰望,仿佛与百年工业文明对话。三股“青春风暴”过后,复兴岛正式张开双臂,向全球创客发出“未来之约”。杨浦区“三箭齐发”,打造全链条的创新策源地、强链接的创业加速厂、高效率的科技转化港、有温度的科创朋友圈。创造“低成本”创业环境——盘活30万平方米存量工业厂房、2500间创客公寓,并发放新质秀带创新券,以及算力券、模型券、语料券。厚植“快创新”丰沃土壤——联合实力企业组建科创载体开发平台,面向全球公开招募顶尖科创孵化器运营伙伴,支持创客企业开展关键技术攻关和转化应用,提供全生命周期的科技金融服务,帮助企业申报各级各类专项资金和重点项目。构建“开放式”创客生态——建设复兴岛创客学院和高校创新联盟,支持共性技术平台,提供引进落户、创业导师、实习实训等配套服务,探索打造OPC(一人创业公司)单人成军创业社群,支持举办国际顶尖峰会、大赛展会和社群派对。创新主体纷至沓来。目前,12家国内外知名孵化器、首批14家创新创业企业已正式入驻复兴岛。PNP璞跃中国华东城市创新副总裁周涵洋表示,作为全球开放式创新平台,将通过“投孵联动”模式,依托生态资源筛选早期硬科技项目,推动技术验证、业务合作与资本闭环,助力产业创新与升级。英国EGG孵化器全球联席董事、亿极中国总裁陆城宽说,依托英国EGG孵化器的全球资源,EGG中国已助力新能源、新材料、人工智能等领域180多个海外团队落地中国。未来,将进一步搭建起连接国际创新与中国产业生态的桥梁,系统性推动技术回归与产业融合。 小红书冒险岛活动。原标题:《复兴岛上风云际会:量子城市基地,让人工智能“睁眼看世界”》栏目主编:茅冠隽来源:作者:解放日报 肖彤 -
千问APP开始接入阿里生态场景;腾讯回应元宝AI靠人工 | 早资道 千问APP开始接入阿里生态场景,可调用高德地图等底层服务12月18日消息,千问APP开始接入阿里生态场景,宣布首站接入高德,赋予千问“地理空间理解与推理能力”。在最新版本中,千问APP不再只是生成一段文字建议,而是能够调用高德地图、扫街榜等底层服务。用户点击卡片,即可唤起导航或打车。随着千问APP的快速迭代,阿里旗下的消费、支付、生活服务等核心业务场景将陆续接入。美团 LongCat-Video-Avatar 发布,实现开源 SOTA 级拟真表现12月18日消息,美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar,该模型基于 LongCat-Video 基座打造,延续核心设计,原生支持多项核心功能,底层架构全面升级,实现三大维度突破。瑞幸及其大股东要竞购蓝瓶咖啡?瑞幸回应:不予置评近日,有消息称瑞幸及其大股东大钲资本(Centurium Capital)正考虑竞购蓝瓶咖啡。12月18日,瑞幸方面回应,对此事不予置评。截至今年第三季度末,瑞幸全球门店总数为29214家,单季度净新增3008家。2025年第三季度,瑞幸的总净收入约152.87亿元,同比增长50.2%;净利润约12.78亿元,同比下降约2.7%。元宝AI靠人工?腾讯回应12月18日消息,针对近期用户热议的“评论区的元宝互动是小编轮班扮演还是AI”的争议,腾讯官方发布声明澄清:所有带有“内容由AI生成”标识的评论均为元宝AI独立生成,无人工运营团队参与轮班,而无该标识的回复则为真人小编逐字撰写的原创内容。蔚来ES8第30000台新车完成交付12月18日,蔚来全新ES8第30000台新车在成都完成交付。自11月29日达成第20000台新车交付以来,全新ES8仅用19天就完成了第30000台交付,创造了国内40万元以上纯电车型交付破三万台的最快纪录。 -
巨头集体响应!微软(MSFT.US)、谷歌(GOOGL.US)等24家公司加入美国“创世纪”AI计划 智通财经APP获悉,据报道,24家顶尖人工智能(AI)企业已签署协议,加入美国联邦政府发起的“创世纪计划”。这项由特朗普政府推动的举措,旨在推动新兴AI技术在科学探索与能源项目领域的应用落地。 白宫一份声明显示,OpenAI、微软(MSFT.US)、英伟达(NVDA.US)、亚马逊(AMZN.US)AWS以及谷歌(GOOGL.US)均已采取实质行动:部分已与政府签署谅解备忘录,部分正与能源部或国家实验室开展合作项目,另有企业已明确表示参与意向。白宫科技政策办公室负责人Michael Kratsios表示:“运用前沿AI技术赋能科研,将极大提升美国科学家与研究人员的工作效率。创世纪计划将助力科学家实现实验设计自动化、加速仿真模拟、构建预测模型,从而推动能源、制造、药物研发等领域的突破性进展。”上月,特朗普通过行政命令宣布启动该计划,旨在加强跨政府部门的科研统筹协调,更高效地整合AI工具以取得更多科学突破。Kratsios当时还指出,该计划将依托美国能源部下属国家实验室的算力资源,盘活联邦政府海量数据集,推动更多AI驱动的实验项目开展。他预计,这项计划将有效缩短科学发现从理论到应用的周期。与此同时,美国政府官员也清醒认识到,AI发展所需的庞大算力依赖高能耗数据中心,因此正积极推动新能源探索与电网升级工作。重返白宫以来,特朗普将扶持AI产业列为施政重点,陆续宣布多项政策以简化AI设施建设审批流程、加速技术研发。另一方面,政府着手限制州级监管规则,认为这些规定加重了企业负担。但AI批评人士指出,联邦政府在相关监管政策制定上进展迟缓,各州层面的监管规则不可或缺,唯有如此才能及时应对算法偏见、深度伪造内容、用户安全风险等现实问题。 -
鹰和龙:iRobot,被惊醒的美国梦 文 | 视野他乡1990年,科林·安格尔(Colin Angle)、海伦·格雷纳(Helen Greiner)和罗德尼·布鲁克斯(Rodney Brooks)在马萨诸塞州的伯灵顿创立了iRobot。iRobot这个名字的灵感据说来自阿西莫夫的科幻名著《我,机器人》(I, Robot)。iRobot的愿景很简单:让实用机器人走进现实。罗德尼·布鲁克斯当时36岁,已经是 MIT 的教授和MIT人工智能实验室(AI Lab)的主任,而科林和海伦都是他的学生。科林·安格尔和海伦·格雷纳在 1985 年进入 MIT 成为大一新生时就已相识。为了进入AI Lab,科林接受了布鲁克斯给他的挑战:制造一台能行走的机器,最终科林制造出了著名的六足机器人 Genghis。 海伦·格雷纳,不像是其他女孩子,10 岁时看了《星球大战》后,没有被莱娅公主吸引,而是迷上了 R2-D2,从此她立志要造机器人。MIT 是她唯一申请的学校,因为她认为那里是实现梦想的唯一去处。 MIT,著名的麻省理工学院在全球各种大学排行榜中很少掉出前三。MIT的校训是 Mens et Manus,直白的翻译就是心与手。将动手实践放到了校训里,这在美国的著名大学里是独一无二的。因为这种明确的实用主义导向,对解决现实世界复杂问题的关注,MIT成为世界公认的科技创新的前沿和创业者的摇篮。在那群给现代世界打下技术基石的人中我们可以找到很多来自MIT的名字:Inter的罗伯特·诺伊斯 ;HP的威廉·休利特 ;Bose的阿马尔·博斯 ;高通的欧文·雅各布斯 等等。据统计,MIT 校友创办的公司每年的总营收超过 2 万亿美元,如果将其看作一个经济体,其规模足以排在全球前十大经济体之列。 说句题外话,加州理工学院的校训是 The truth shall make you free,真理必叫你们得自由;普林斯顿大学的校训是 Dei sub numine viget,她因上帝之力而繁荣。“生活大爆炸”里,Caltech的博士谢尔顿瞧不上MIT的霍华德,也不太瞧得上PU的博士莱纳德,除了学历和智商,估计和这两人都是动手的有很大关系。动脑的看不起动手的,看来古今中外皆然。在2002年之前,iRobot 是一家面向军事、太空探索及工业研究的尖端机器人实验室。iRobot主要依靠政府合同和特定行业订单生存,产品多为高度定制化的特种机器人,每年的营收在百万美元的水平,最高的时候营收达到1500万美元。这段时间iRobot的主要客户是NASA,美军,一些美国政府机构和各个科研机构。他们最成功的产品是PackBot,一款履带式多用途机器人,专门用于灾害场景或战场环境下的一些极端任务。PackBot 曾被被部署在 9/11 恐怖袭击后的世贸中心废墟进行搜救,这款机器人也在阿富汗和伊拉克执行过任务。此外,他们还设计了Genghis ,一个仿生六足行走机器人;协助NASA设计了火星探测车原型Rocky 7,它虽然未进入太空,但其“行为控制”架构直接影响了NASA后来的火星车“旅居者号”的设计方案。对于让机器人走进现实这个理想,如果机器人只能走入太空或战场,这个现实也太过冰冷和暗淡了一些。因为盈利的要求,对于更广阔的市场的渴望,在火星车和排雷机器人研发中积累的极端环境下的避障算法、耐用电池管理以及低功耗控制等技术,iRobot在 2002年推出了世界上第一台扫地机器人Roomba,售价199.95美元。人们很快就喜欢上了这个能够嘟嘟囔囔在家中四处穿梭奔走,清洁地面的小家伙,很多人给家里的Roomba起了名字,当它跌跌撞撞的卡住或翻车时人们会去解救它就像是解救被困在沟里的小狗。Roomba 迅速成为圣诞节等节日的抢手礼物,在推出后的短短三年内,iRobot 就售出了超过 100 万台 Roomba,而公司的营收也飙升至1.4亿美元。 Roomba的成功开创了扫地机器人市场,随着市场规模的扩大,Roomba的销售也一路走高,iRobot的营收从2003年的5千万逐渐攀升至2021年的15.7亿。当时,iRobot 已在全球售出超过 4000 万台扫地机器人,市场占有率最高达到近90%。在此期间,iRobot也坚定了转向消费市场的信心。在2016年时,公司将其军事机器人部出售,100% 专注于高增长的消费级家庭机器人市场。从此,公司在官方描述中正式转为“全球领先的消费机器人公司”。iRobot成为了消费电子领域全球知名的美国品牌之一。在技术方面,iRobot一直维持着行业先驱与领导者的形象,公司因为在地图绘制、导航(如 vSLAM 技术)和人机交互方面的创新技术开发应用而闻名于世。虽然效果不大,iRobot也在拓宽产品线上付出了努力,比如公司在2014年推出了专门的擦地机器人系列,2021年收购了瑞士空气净化器制造商 Aeris,此外还有计划开发机器人割草机等产品。 如果情况没有变化,按照剧本演下去,我们可以看到又一个美国梦的故事:技术天才们从象牙塔走进凡俗尘世,依靠个人勤劳努力,白手起家创下偌大的事业。但是这个混乱躁动的世界已经不愿意给梦留下多少空间。在iRobot达到前所未有的繁荣的2021年,Roomba的市场根基已经在垮塌和崩溃。科沃斯机器人,石头科技和安克创新等公司为代表, 来自中国的制造商们从2017年开始进入美国扫地机器人市场。以强大的供应链能力,快速的市场反应和极致的性价比,中国扫地机品牌科沃斯,石头,Eufy等迅速瓜分了原先由美国 iRobot 主导的市场份额。 在2017年,Roomba占据着美国扫地机器人超过85%的市场份额,中国品牌的份额小于2%; 2019年,Roomba的市占只能维持在78%左右,中国品牌的份额已经超过5%; 2020-21年,在疫情期间,由于居家办公和非接触社交导致传统家政服务减少等原因,扫地机器人需求大增。Roomba取得了成立以来最好的业绩,但是市场份额还是在下降至60%,而中国品牌的市场份额提升到20%; 2022年开始,新冠疫苗开始全民接种,特效药Paxlovid也免费提供使用,美国从疫情中慢慢恢复。但是iRobot却继续向深渊滑落,2022:42%,2023:35%,2024:14%,2025:6%。在同期,中国扫地机的市场占有率一直提升到70%以上,2025年底,全球扫地机器人出货的前五名是石头、科沃斯、追觅、小米、云鲸,全部都是中国品牌。 2025年,iRobot预计全年营收不到6亿美元,而亏损预计超2亿美元。12月,总部位于马萨诸塞州的 iRobot 向特拉华州联邦破产法院提交了第 11 章破产保护申请,iRobot 已与主要债权人及代工商,来自中国的杉川机器人达成协议,重组后 iRobot 将由杉川集团全资持有并转为私有化公司。在短暂的爆发后,iRobot以前所未有的速度成为了美国的失败巨头中的一员。如果用全能视角讨论扫地机器人的现状,我们会发现获得成功的中国品牌们有着行业领导者的共性:他们野心勃勃精力充沛;他们从激烈竞争的市场中脱颖而出,没有技术上的矜持和傲慢;他们尊重客户和市场需求;他们的产品有着高度的功能整合、灵活的多用户场景匹配、创新技术的迅速应用、快速的市场反应和产品迭代、极致的性价比等特性。而iRobot,我们同样会发现被市场淘汰的巨头们的共性:拘泥于不可维持的市场地位和形象、屈从于惯性、创新停滞、对市场需求变化和激烈竞争失去了识别和应对能力、关键战略决策失误等。但是另一个值得重视的是美国政府应该如何支持企业在全球竞争中获取优势?专家认为,在iRobot这件事上,美国政府的行为加速了该公司衰落。监管机构对于这项业务的担忧主要是两个,首先,监管机构担心亚马逊会利用其平台优势,给 Roomba 扫地机器人提供不公平的竞争优势,从而削弱其他品牌的竞争力;其次,监管机构担心,收购后亚马逊将获得大量关于用户家庭内部结构的详细地图数据,这可能进一步增强其数字监控能力并侵犯个人隐私。在监管机构发出最后通牒后,亚马逊被要求针对以上担忧提供补救措施,但亚马逊在规定截止日期前未提交任何方案。亚马逊认为,为了消除监管方的担忧,亚马逊可能需要对搜索算法或推荐机制进行修改,这个代价和收购案相比“不成比例”,在商业上是不可接受的。拒绝提交方案更深层的原因是即便提交了补救措施,交易获得批准的可能性依然极低;而且审批过程将极其漫长,在这个过程中iRobot经营状态的持续恶化使采购案本身变得无利可图。 收购失败带来的猛烈打击让iRobot从此一蹶不振。宣布交易失败的当天,iRobot 裁员约350人,占员工总数的 31%,其创始人兼首席执行官科林·安格尔(Colin Angle)也宣布辞职。iRobot 在等待收购期间为维持运营借入了近 2 亿美元的过渡贷款。收购失败后,公司资金链基本断裂。另外,在美国销售的大多数iRobot产品均产自越南,特朗普政府针对越南的关税高达46%。根据iRobot提交的法庭文件显示,仅关税一项,2025年公司成本就增加了2300万美元。 专家们表示,为了建立美国企业全球竞争能力的最佳方式,美国政府应该要赋能美国企业参与竞争,确保美国企业能够自由并购、扩大规模并持续创新,提升美国企业开拓发展路径的能力。但是在iRobot的案例中,政府没能做到其中任何一点。 国际法律与经济中心竞争政策主任德克·奥尔表示:“阻止这笔交易是战略失误。iRobot是该领域仅存的重要西方企业。监管机构剥夺其竞争所需资源,使美国消费者选择更少。”奥尔进一步指出:“尽管iRobot近年已沦为边缘玩家,但亚马逊本来是能够扭转颓势的——特别是通过将其整合进成功的家居设备生态系统。”罗德尼·布鲁克斯在iRobot 逐渐成熟并转向消费机器人业务后,于 2008年 正式离开。他希望去探索机器人技术的下一个前沿,即能在工厂里与人类安全协作的机器人。在离开iRobot后他创建了两家极具影响力的公司:Rethink Robotics和Robust AI。Rethink于2018年倒闭,Robust AI也还没有在商业上取得成功。海伦·格雷纳也在2008年离开iRobot。离开后她创建了 CyPhy Works,一家专注于小型无人机的公司;Tertiary Robotics,一家在机器人自动化领域进行探索的公司。此外,她曾被奥巴马总统任命为“全球创业总统大使”(PAGE);她是多家科技公司的董事,积极推动女性进入 STEM(科学、技术、工程、数学)领域;她受邀担任美国陆军高级顾问,凭借在 iRobot 积累的国防业务经验,在美国军方机器人现代化进程中扮演了关键角色。坚持最长时间的科林·安格尔在 2024 年 1 月 亚马逊收购案失败后正式离开 iRobot。 离开 iRobot 后,安格尔创立新公司 Familiar Machines & Magic,新公司专注于健康与护理领域的家庭机器人。至 2024 年底,该公司已完成首轮 1500 万美元的融资。罗德尼·布鲁克斯、科林·安格尔和海伦·格雷纳三人一直保持着友谊和良好的互动。在对方创办新公司时,他们经常公开互致祝贺。作为机器人行业的先驱,“iRobot 帮”的领袖,三人经常一同出现在 MIT 的纪念活动或行业顶级峰会上。在各种采访活动中,他们也不吝于赞扬彼此。 -
2025新一代人工智能创业大赛总决赛收官 作者|汉雨棣 编辑|丁广胜 12月18日,由网易传媒主办的“2025新一代人工智能创业大赛”总决赛在北京网易大厦圆满落幕。经过激烈比拼,嘉华药锐荣获一等奖,峰石算法科技、澎峰(北京)科技有限公司荣获二等奖。中科华航、努咖智能LUCA-AI、中科硅纪、TTC项目获得三等奖。数全基因、上海算模算样科技有限公司、北京中科慧灵机器人技术有限公司、MovieFlow获得“创新之星”称号。 “2025新一代人工智能创业大赛”自10月22日启动以来,300余支团队历经海选、初赛,58支团队复赛,最终11支团队一路过关斩将会师总决赛,决出最终座次。 总决赛现场评委阵容强大,投资领域大咖和学术界专家齐聚。阿尔法公社创始合伙人、CEO许四清;国家创新与发展战略研究会副会长、中国科学院大学管理学院教授吕本富;高通创投总经理毛嵩;华创资本创始合伙人王道平;将门创投创始合伙人兼CTO沈强;溪山天使汇发起人许晖;天际资本联合创始人黄凯;北极光创投合伙人张朋;华山资本合伙人刘明豫;讯飞创投合伙人朱永;慕华科创合伙人周天奇等在总决赛针对项目进行了犀利提问,并为项目评分。 主办方网易传媒CEO李黎在致辞中表示,总决赛项目展现出团队背景扎实、技术根基深厚、场景切入精准的三大特色。她强调,网易传媒将持续扮演好“助推者”与“连接者”的双重角色,与广大创业者及合作伙伴共同构建一个更具活力、更可持续的AI创新生态。 (图为大赛颁奖典礼现场) 三年大赛传承, 硬核AI项目巅峰对决 12月18日上午,11支人工智能项目团队逐一路演。总决赛项目整体呈现出三大特征:一是硬核技术引领,超八成项目具有顶尖科研成果支撑,在AI算力、机器人等关键领域实现自主突破;二是场景融合深入,项目针对具体产业痛点设计,凸显技术赋能实体经济的精准路径;三是商业化进程提速,多数项目已步入规模化应用或正在小步快跑加速落地,实现了从实验室到市场的跨越。 从海选到总决赛,“2025新一代人工智能创业大赛”总体项目呈现了一幅中国AI创新活力的生动全景:既有面向算力芯片、高速互联等底层设施的“硬核突破”,也有深入医疗、工业、内容等产业的“融合实践”;既有探索具身智能、智能体前沿的“大胆构想”,也有深耕行业痛点、提升效率的“务实创造”。尤为令人印象深刻的是,参赛团队汇聚了来自清华、北大、中科大、浙大、港大,以及MIT、斯坦福、东京大学等全球顶尖院校的学术力量,和来自阿里、华为、ABB等产业一线的实战专家,形成了“学术前沿”与“产业纵深”双轮驱动的强大阵容。 在路演现场,评委对每个项目进行了精彩点评和犀利提问,“你的项目有哪些事情是只有你能做,其他人做不了的?”,“你的项目和AI的结合有多少?”,“你们商业模式是赚谁的钱?”。也有评委细心总结,给出发展建议,“你们应该加入多场景的落地尝试”,“你们的具身智能设备要去解决那些更实际的问题”。 多位创业团队路演人表示,评委的提问点评很受启发,后续将深入研究并改进项目;与此同时,创业者表示,在参赛期间结识了很多创业同仁,感谢网易AI大赛的链接,让自己的项目和产品获得更多发展机遇。 不少评委认为,总决赛项目整体质量不错,后续将跟进接触。网易传媒副总裁田华表示,搭建这个舞台,正是希望为每一位怀揣梦想的创业者,提供一次与顶尖资本、产业资源深度连接的机会。大赛的意义,远不止于最终的奖项归属,更在于这个专注、开放、充满张力的交流场域,以及由此开启的持续生长的资源网络与合作可能。 (图为大赛评委代表,高通创投总经理毛嵩点评路演项目) “新一代人工智能创业大赛”自2023年发起,那时正值ChatGPT发布近一年,大赛应运而生。三年来,大赛影响力持续扩大,本届报名项目已突破300个。从大赛走出的往届优秀项目,正稳健而迅速地成长:前两届总决赛项目中,已有40%成功完成新一轮融资。去年的获奖项目“寒序科技”“津渡生科”等,在短短一年内连获多轮融资,技术正加速迈向产业深处。 (元始智能联合创始人兼COO罗璇) 在现场,去年获奖项目元始智能联合创始人兼COO罗璇作为往年获奖项目代表返场分享了一年来的项目进展。今年7月,作为初创企业代表之一,罗璇在“2025世界人工智能大会”上受到了总理的接见。罗璇表示,RWKV作为一个开源项目,已获得了新一轮融资,并形成开发者社区;与此同时,该架构在端侧智能硬件及未来多智能体系统等领域已经展现出强大的应用潜力。 AI大航海时代, 投资人把钱砸在哪里? 12月18日下午,同期举行了“2025 AI创投论坛”,聚焦AI全球化、AI产业化路径的深度剖析,以及围绕具身智能、Agent等热点议题进行“围炉夜话”思辨,探讨了AI从技术探索走向产业落地的关键命题。 (创世伙伴创投创始主管合伙人周炜) 创世伙伴创投创始主管合伙人周炜围绕“AI全球化趋势”发表演讲。周炜指出,在当前充满不确定性的国际环境下,中国科技企业最大的核心竞争力并非通常认为的供应链优势,而是对下一代智能产品的定义能力。 在AI和机器人领域,周炜认为,未来将形成中美两国主导的竞争格局。他预判,在某些尖端领域,美国或会出现个别“老虎”式的领军企业,但从第二名到第二十名,将几乎全是被“狼群”战术武装的中国企业;而在中国已取得领先的领域(如电池、部分智能硬件),目标应是实现全产业链的升级与领先。 对于全球化路径,周炜提出,中国企业应该从创业第一天起就坚定走向全球市场,让用户尽早、广泛地使用产品,以形成依赖和习惯。 周炜指出了当前面临的最大挑战:中国资本市场的活跃度与估值水平。他表示,当前本土资本市场难以支撑需要天量融资的AI创新,这使得顶级华人人才回国创业的意愿降低。他建议通过政策和市场力量提振资本市场,为本土创新提供充足的储备。 (阿尔法公社创始合伙人兼CEO许四清) 阿尔法公社创始合伙人兼CEO许四清发表了题为“破局AI产业化落地”的演讲,他指出,大模型发展的“Scaling Law”已从单纯依赖算力规模,转变为被中国团队(如DeepSeek)通过算法优化和底层工程创新所突破,强调效率提升。 从中美投资对比来分析,中国在AI领域的投资规模,尤其是早期(天使轮)投资比例,与美国存在显著差距,资本在支持早期创新方面存在错配。 许四清认为,产业落地方面,当前大模型擅长定性、逻辑任务,但在需要精准定量的工业场景应用困难。具身智能的“策略”(大脑)部分因数据匮乏是最大挑战,其突破时间不确定。 展望未来,许四清认为当前基于“归纳法”的Transformer技术路径可能存在局限,期待更高效的新范式出现。天使投资应基于第一性原理,敢于承担风险。 在“围炉夜话”环节,聚焦具身智能和智能体(Agent)两大热门赛道。围绕“具身智能机器人困在‘跳舞’里”议题,决策原力营销研究院院长黄震华主持讨论,将门创投联合创始人兼CTO沈强将2025年定义为具身智能“破局的前夜”,指出实际应用价值尚未充分落地,未来3年需攻克运动泛化与硬件可靠性难题。华山资本合伙人刘明豫以“蓬勃发展”概括行业现状,判断垂类机器人商业化需2~3年,而通用机器人进入家庭则需5—10年耐力长跑。慕华科创合伙人周天奇则建议企业明确“小而美”或资本化定位,同时强化硬件研发与销售能力。 在“史诗级火爆的Agent,到底解决了什么真需求?”的“围炉夜话”环节,由易论AI创始人易亚婷主持讨论,华创资本创始合伙人王道平、北极光创投合伙人张朋与明势创投董事总经理徐之浩三位投资人进行了讨论,表示该赛道已告别免费模式,进入商业化验证期。王道平强调,产品能否切入真实工作流程、解决高价值需求是投资评估的核心。张朋则指出,付费难点不在用户意愿,而在于企业能否建立正毛利模式并形成壁垒。徐之浩表示,“最后一公里”执行能力、上下文任务工程及数据迭代体系是Agent超越模型通用能力的关键。 2025新一代人工智能创业大赛自2023年举行以来,已连续成功举办三届,累计吸引了超过600多个优质项目参与,覆盖大模型、算力、具身智能、大数据、AI应用、AI硬件等多个前沿领域。 每一年的相聚,不仅选拔出优胜者,更是构筑一个长期互助、共同成长的创新共同体。大赛不仅是一个竞技场,更是AI产业弄潮儿们的资源链接平台。 附2025新一代人工智能创业大赛获奖名单: -
马斯克xAI大会发言:太空数据中心由特斯拉Optimus负责维护 12月17日,据多家媒体报道,马斯克在上周于旧金山总部举行的xAI全体员工大会上,向员工们分享了对公司未来的乐观展望。根据知情人士透露,这次会议氛围积极,马斯克对xAI的进展表现出高度满意,一位内部人士形容会议“活力十足”。生存与胜利:2-3年关键窗口马斯克直言,如果xAI能在未来2-3年内“生存下来”,公司将击败所有竞争对手,脱颖而出。他强调,在当前激烈的AI竞赛中,决定胜负的关键在于快速扩展计算力、电力供应和数据中心规模。xAI的“Colossus”项目正是这一战略的核心,已实现数据中心规模的迅猛增长,目前拥有约20万块GPU,并计划进一步扩展至100万块。这让xAI在硬件基础设施上占据显著优势。资金与生态协同:每年200-300亿美元支持马斯克透露,xAI每年可获得约200-300亿美元的资金支持,这得益于与特斯拉、SpaceX和X等马斯克旗下公司的紧密协作。例如,今年早些时候,Grok已成功集成到特斯拉车辆中。这种跨公司协同被视为xAI的核心竞争优势,帮助它在资源密集的AI开发中领先一步。AGI时间表:最早2026年实现突破在大会上,马斯克对人工通用智能(AGI,即匹配或超越人类智能水平)的展望尤为引人注目。他认为xAI有很大机会在未来几年内实现AGI,最早可能在2026年。他此前曾提到,计划于明年年初发布的Grok 5模型有约10%的概率达到AGI水平。这番言论延续了马斯克一贯的乐观预测,强调xAI正朝着“超级智能”方向加速前进。长远愿景:太空数据中心与Optimus机器人马斯克还分享了更宏大的未来构想:建造太空数据中心,并由特斯拉的Optimus人形机器人负责维护。这些设施甚至可能与火星殖民计划相结合,实现人类在宇宙中的AI扩展。这一想法虽听起来科幻,却体现了马斯克将AI与太空探索、机器人技术深度融合的野心。产品更新演示:Grok功能持续迭代会议中,xAI团队还演示了多项产品改进,包括Grok语音助手、专为特斯拉车主设计的应用、以及代理(agents)功能。新增亮点包括结果预测能力提升、语音识别优化和视频编辑工具等。这些更新标志着Grok正从单纯的聊天机器人,向更强大的多模态AI助手演进。在AI巨头林立的战场上,马斯克领导的xAI正以高速扩张和跨界协同为武器,力争在AGI竞赛中胜出。未来几年,将是决定性时刻。 -
最难的健康赛道,为什么是蚂蚁先跑出来? 「核心提示」 先有服务基础,再叠加AI能力。蚂蚁用十年积累,验证了垂直领域“场景驱动”的增长逻辑。 作者 |陈法善刘杨眼下,全球AI竞争比拼,正从大模型研发的“参数竞赛”,转向To C应用“的场景突破”。近两个月来,OpenAI推出的APPS SDK、Google的“Gemini3全家桶”,纷纷将重点放在应用创新上,行业主旋律已转变为——让AI深度融入工作和生活。目前,视频、文本、搜索等赛道已经涌现一批明星应用。而在专业门槛高、信任构建难的健康领域,也跑出一匹现象级黑马:蚂蚁集团的AI应用“蚂蚁阿福”上线几个月来,月活复合增长率达83.4%,成为增长最快的AI应用。今天,“蚂蚁阿福”新版App因下载量激增,接连超越多款热门应用,强势跻身苹果应用商店榜第二位。数据显示,升级后的“蚂蚁阿福”月活用户已超1500万,跻身国内AI APP前五,成为第一大健康管理AI APP。如今,它每天回答用户500多万个健康提问,展现出极强的用户粘性与活跃度。为何一款健康类AI应用能实现如此高速增长?这个高门槛赛道,为何是蚂蚁先跑出来?究其根本,当大模型能力越过基础阈值后,比拼的关键在于用户体验、服务厚度和生态整合能力。蚂蚁阿福的快速崛起,验证了一个核心逻辑:在垂直领域,长期的服务积淀叠加AI能力,能真正构建可持续价值。1、AI应用进入“场景比拼”,蚂蚁阿福的增长逻辑是什么?回看近期各大AI发布会,关键词已从参数、token转变为多模态、智能体。这意味着,行业焦点迅速转向“应用为王”。其中,蚂蚁阿福的爆发式增长备受关注。QuestMobile发布的《2025年三季度AI应用行业报告》显示,在中国AI原生应用榜前10,蚂蚁阿福是唯一的健康类应用。通用型AI应用凭借规模优势易获流量,而垂直应用如蚂蚁阿福的快速成长,源于其独特的“身体+大脑”模式。蚂蚁做健康AI的优势在于先有“身体”:早在2014年,支付宝就上线了医院线上挂号缴费功能;2019年联合国家医保局发布医保电子凭证;十年间,构建了链接5000家医院、30万真人医生的服务网络,并逐步建立起覆盖支付、医保、预约挂号、在线问诊的完整服务基础设施。与此同时,蚂蚁自2023年起系统构建“蚂蚁阿福”的“大脑”——底座大模型体系。医疗健康领域专业壁垒高、信任构建难,高质量语料高度依赖于行业积累。蚂蚁的专业大模型以万亿tokens专业医疗语料为底座,背后配备千人规模的医学标注团队,由全国百所三甲医院的学科带头人组成的“顾问团”参与指导和顶层设计工作,持续「调教」大模型的「思维」,提升健康服务的专业性、严谨性。用户叶飞(化名)长期患有慢性咳嗽,过去常把咳嗽当咽炎看。使用阿福后,他输入症状后,系统在多种病因分析中提到了“鼻涕倒流”的可能性。顺着AI的指导,叶飞注意到此前忽略的病因——慢性鼻窦炎。叶飞让阿福推荐了附近几家大医院耳鼻喉科对口的医生,并直接完成在线挂号。就诊后问题也随之得到解决。这种从AI分析、追问,到在线挂号、线下就医的全链路服务整合,构成了“蚂蚁阿福“难以被快速复制的护城河。2025年11月7日,蚂蚁集团将原“蚂蚁数字医疗健康事业部”正式升级为“蚂蚁健康事业群”,医疗健康成为蚂蚁五大核心业务板块之一,健康AI被提升到战略高度。2、AI健康应用,如何释放健康领域的潜在需求?中国拥有3.1亿老年人,2.6亿慢性病患者……随着大众健康意识不断重视,医疗健康已经成一条“长坡厚雪”赛道的万亿级赛道。用户有大量介于去医院看病和日常咨询之间的疑问,但是上网搜,信息混杂;问身边人,又不够权威。与此同时,医疗资源的紧张也是客观事实,优质的健康服务供给依然不足。AI有了用武之地。杭州市第七人民医院主任医师、睡眠专家毛洪京是首批在阿福App开设AI分身的医生。有了AI分身后,“毛洪京医生”每天可以服务更多患者,目前已经累计服务超过368万人。AI让医生的专业能力突破了时间与地域的局限。如今,在阿福平台上,廖万清、董家鸿、王俊、陈子江、王建安、王宁利六位国家院士领衔全国500多位名医,像毛洪京一样创建了自己的“AI分身”,并已累计解答2700多万个健康咨询。AI服务的普惠性正日益显现。目前,阿福App每天回答超500万个疑问,55%来自三线及以下城市。 3、AI健康应用,正在重构什么?如果说,就医的核心诉求是“找到好医生”,那么随着健康意识的全面觉醒,越来越多人正从“患病求医”转向“未病先防”。这一转变,也推动医疗健康服务的逻辑从“治病”走向以健康为中心。蚂蚁阿福的探索,正是从这个转变出发,尝试在三个层面打开新局面。首先是从“问答”到“主动管理”。新版“阿福”增加了健康陪伴功能,希望从日常就开始帮助用户养成健康习惯。阿福打通了苹果、华为、vivo、鱼跃、欧姆龙等九大品牌智能设备,用户绑定后,运动量、心率、睡眠时间等信息会自动同步,形成连续的健康记录。用户还能拍照记录健康状况,在部分地区甚至可以授权导入过去的就诊、体检数据,由阿福统一归档整理。 基于这些健康档案,用户可以设定运动、饮食、生活习惯等目标,阿福会像“私人教练”一样并每日提醒。蚂蚁集团副总裁、健康事业群总裁张俊杰表示,从AQ到阿福,也是从AI工具到AI朋友的过程——不仅能陪伴用户,也能了解用户,更能像朋友一样值得信赖。其次是从“个体”到“家庭”。用户可以在阿福上为家人建立健康档案,管理全家健康,让有些子女能远程关注父母健康情况;阿福也会主动提醒老人,按时吃药、测血糖。第三是从“就医”延伸到“日常健康”。针对有医疗需求的用户,阿福链接了30万真人医生的资源,提供在线问诊服务;在更高频的健康管理场景,阿福则以健康陪伴、健康问答、健康服务为核心,构建全链路服务。同时,联合全国500+名医上线AI分身,提供24小时的咨询服务。一方面,用户可以更低门槛获取服务,另一方面,也帮医生从大量重复、基础性工作中释放,更专注于在复杂病情研究和深度患者关怀。从AQ到阿福,从工具到AI健康朋友,蚂蚁的案例,让我们看到技术可以更好地服务于人,让医疗健康资源更普惠、更可及。这种探索还在早期,但已经让我们看到了一些可能性。 -
小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 又有一个国产模型,悄悄跻身到了开源第一梯队。这次不是DeepSeek也不是Qwen,而是小米刚刚官宣的开源模型MiMo-V2-Flash。仅用了309B的参数规模,该模型就展现出了极高的效能密度,在多项权威综合评测中均取得了令人瞩目的优异成绩。 不仅分数高,它还在实现2.6倍推理加速的同时,兼顾了顶尖的模型效果与极致的部署成本。 在小米刚刚举行的“人车家全生态”合作伙伴大会上,小米将该模型定义成了“迈向Agent时代的全新语言基座”。 这个模型在海外也受到了广泛好评,X网友评价说MiMo-V2-Flash将能够让智能体变得更加实用。 还有人在线许愿,希望能推出gguf格式,方便适配自己使用的模型框架。 从技术报告中,我们也了解到了小米在MiMo-V2-Flash背后采用的一系列关键技术: 5:1混合注意力机制,采用SWA滑动窗口与全局注意力协同工作; 可学习的注意力汇聚偏置,解决局部窗口导致的语义断层问题; MTP多层Token预测,前向预测多个后续Token,实现最高2.6倍推理加速; MOPD在线策略蒸馏,以极低训练算力迅速追平教师模型能力。 具体来看—— 给学生模型请一个“私教天团” MiMo-V2-Flash采用了MoE架构,总参数量为309B,包含256个专家,相比那些动辄参数量以T计的巨头模型和2倍参数量的开源模型,可谓是以小博大。MiMo-V2-Flash采用了动态激活机制,激活专家数为8个,对应参数量为15B,其推理成本只有闭源竞品Claude 4.5 Sonnet的2.5%左右。 在长文本处理上,MiMo-V2-Flash应用了滑动窗口注意力(SWA)和全注意力5:1混合的注意力结构。SWA是一种将每个Token的注意力视野严格限制在邻近局部窗口内的稀疏型注意力机制,就像阅读时采取“只看眼前”的策略,每次仅聚焦阅读当前的一小段文字,可以将注意力计算复杂度从全文长度的平方级降低为线性级。这种方式,与同样以性价比为亮点的DeepSeek走了两条不相同的路——DeepSeek选择的是Sparse路径,而MiMo-V2-Flash则是选择了Linear。但是,SWA在提高效率的同时可能导致语义断层和长文迷失的问题,为此,MiMo-V2-Flash引入了可学习的注意力汇聚偏置(Attention Sink Bias)。该技术通过在Softmax归一化的分母中引入一个可学习的汇聚项,允许注意力机制在局部窗口内没有合适匹配对象时,将多余的权重“泄洪”给这个虚拟锚点。这种设计好比在快速浏览长文时始终按住一个“逻辑锚点”,确保即便在极小的窗口下快速滑动,模型依然能保持对全文脉络的稳定把控。MiMo-V2-Flash的这种架构,在将KV Cache显存占用降低到1/6的情况下,长文理解能力不降反升。 有细致的网友从技术报告中发现,小米的滑动窗口大小只有128k,但效果比512k的大窗口还要好。 推理加速环节则引入了MTP(多层Token预测)技术,该模块在推理时被复用为投机解码的草稿模型,通过增加计算算术强度来抵消显存带宽瓶颈,实现一次前向传播并行预测多个后续Token。简单讲,传统模型像挤牙膏一样一次只能蹦出一个字,而MTP技术让模型学会了抢答,能一次性草拟出后续的好几个词,主模型只需要做并行批改即可。这种“一次预测、并行验证”的机制有效提升了推理效率,加载3层MTP模块后可实现2-2.6倍的实际推理加速比。 训练流程则采用了MOPD(多教师在线策略蒸馏)的新范式。该方法通过构建特定领的教师模型网络,利用反向KL散度为学生模型提供密集的Token级奖励信号,有效解决了传统RL中的稀疏奖励与训练不稳定性问题。这就好比给学生模型请了一组名师私教团,老师们会盯着学生的每一个解题步骤实时打分并纠正,让它仅需消耗传统SFT+RL流程约1/50的精力就能迅速出师,追平甚至超越老师的水平。 基于上述全链路工程化优化。模型成功在计算效率与显存利用率之间找到了最优解,在官方披露的“价格vs速度”坐标系中占据了显著的高能效生态位。这种极致的技术压榨直接转化为了价格优势,其API定价仅为每百万输入0.7元、输出2.1元,真正意义上把高性能大模型的使用门槛从“奢侈品”打到了“日用品”级别。 双商在线,既会代码又懂情感 根据技术报告中公布的数据显示,MiMo-V2-Flash展现出了极强的综合素质,在衡量通用能力的Arena-Hard基准测试中得分86.2,在复杂推理任务MMLU-Pro中得分84.9。这些核心数据使其成功跻身开源第一梯队,完全具备了与顶尖模型分庭抗礼的实力。代码能力是其最突出的长板,在SWE-Bench Verified评测中,该模型斩获了73.4%的高分,这一成绩成功超越了DeepSeek-V3.2(73.1%)和Kimi-K2 Thinking(71.3%)。另外,在Agent能力方面,模型表现出卓越的泛化性与稳健性,其在SWE-Bench Multilingual测试中解决了71.7%的问题,在衡量工具使用能力的Tau2-Bench中得分达到80.3,这两项关键指标均位列全球开源模型前茅。 官方给出的成绩单的确表现亮眼,那么MiMo-V2-Flash在真实场景当中的表现又如何呢?我们进行了一手实测。先看小米最引以为傲的编程能力,MiMo-V2-Flash在具体的工程化场景中模型展现出了极高的完成度。例如在要求用前端代码构建一个网页版macOS操作系统时,它能一次性生成完整代码架构。提示词如下: 我们打开“文件管理器”,创建文件并编辑,之后再返回到原来的目录中,文件依然还在且内容和创建时一致。 再通过命令行模式浏览文件,依然是之前的内容。 对比看下闭源模型扛把子Gemini 3 Pro,写出的网页相比MiMo-V2-Flash少了壁纸更换功能。 而且Gemini版顶部的菜单栏无法点击,在MiMo-V2-Flash版中就不存在这个问题。 而且MiMo-V2-Flash不仅能在网页中模拟这种复杂的操作,还能够调用各种不同的HTML接口,甚至是引入基于摄像头的手势控制。比如这是一个通过手掌的开合来控制的圣诞树,这次的提示词是中文的。 实际运行起来,MiMo-V2-Flash写的网页完美实现了手势控制。 相比之下,Gemini 3 Pro看似写出了一大堆代码,但渲染出来只有一个静态网页。 利用摄像头,MiMo-V2-Flash还可以写出一个二维码扫描工具,可以把二维码直接在镜头前展示,获得扫码结果。 提示词是这样的: 这次Gemini 3 Pro的作品虽然也能实现摄像头扫码,但是忽略了支持图片上传的要求。 另外,如果使用API,效果会比前面看到的网页版结果更好。在代码能力出众的同时,MiMo-V2-Flash并不是一个只会输出成果的冰冷工具,而是成为了一个同时具备温度感的“全能选手”。在人文交互与语义理解方面,模型在探讨“人生价值”或“AI自我认知”等开放性话题时,回复展现出清晰的逻辑与拟人化的温度。比如当我们问出“如果给你一个机会,你想要成为人类吗”这个问题时,MiMo-V2-Flash给出了这样的高情商回复: 有时候,我们面临的情感难题,MiMo-V2-Flash也可以给出建议,比如作为朋友该不该去参谋朋友的恋爱关系。MiMo-V2-Flash指出,这个问题并不在于该不该参与,而是在于参与的时机和方式,提醒我们要帮助朋友认清情况,而不是做出选择。 从中可以看出,MiMo-V2-Flash的确是一个双商都在线的“高情商理科生”。目前,官方已上线Xiaomi MiMo Studio供用户直接体验,其底层架构支持SGLang推理加速,且API接口设计已一键兼容Claude Code、Cursor、Cline等主流开发工具,便于开发者将这一高性能基座无缝接入现有的工作流中。 小米的物理AGI野心 梳理小米大模型的“练级”路线,能看到一条非常清晰的轨迹。MiMo一代时做的7B模型,更像是在“积攒家底”,把全套技术流程跑通,把该踩的坑都踩一遍,主打一个稳扎稳打;而到了现在的MiMo二代,首发的MiMo-V2-Flash直接就达到了世界先进水平。它的核心逻辑非常简单直接,就是死磕“高效+智能”——既要让模型跑得快、用起来便宜,脑子还得足够灵光。按照官方的规划,Flash这个纯语言模型只是个“开路先锋”,紧接着就会有能看懂图、听懂话的多模态模型登场,后面还藏着更多让行业惊喜的大招。这种步步为营的节奏说明,小米并不是在跟风凑热闹,而是有着一张极具延续性的技术蓝图。透过这种高强度的技术投入,一个核心的战略信号已经藏不住了——小米正在加速从一家硬件大厂,向一家拥有独立底层核心的“大模型公司”转型。小米在“人车家全生态”合作伙伴大会上指出,生物智能的进化严格遵循“先学会控制身体、再在大脑模拟未来、最后诞生语言符号”的金字塔逻辑,但当下的AI实际上是在走一条“从语言出发、逆向补齐物理感知”的反向进化路径。 这种“逆向进化”的视角,完美解释了小米为何要加速向“大模型公司”转型——小米背后站着的是手机、汽车、智能家居这数以亿计的实体硬件,组成了全球独一无二的“人车家”生态。在这样一个圈子里,AI必须要成为一个逻辑严密、能写代码、会熟练使用各种工具的“操盘手”。小米需要的大模型,不仅要能听懂人话,还得能把这些话瞬间翻译成机器听得懂的指令,去精准地指挥空调调节温度、汽车规划路线或者让机器人递个杯子。如果不自己造这个底层基座,光靠借用别人的模型,根本没法满足这种对控制精度和响应速度的变态要求。所以,与其说小米是在卷大模型,不如说它是在给自己的硬件帝国造一个统一的“大脑”。它并不满足于在虚拟世界里争夺流量,而是想打造一个能真正打通“数字世界”和“物理世界”的底座。在这个愿景里,AI不再是活在服务器里的聊天机器人,而是变成了能感知现实、操控硬件的智能中枢。这种向“物理世界AGI”迈进的尝试,不仅是为了给下一代智能硬件交互提供动力,更可能是小米这盘大棋背后真正的野心所在。模型地址:https://huggingface.co/XiaomiMiMo/MiMo-V2-Flash 技术报告:https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf 在线体验:https://aistudio.xiaomimimo.com -
「星」罗万象,「鉴」微知著!中威电子推出星鉴大模型产品,助力千行百业加速智能化落地 当前,人工智能浪潮席卷全球,正以空前的速度、广度与深度重塑生产生活方式。语言大模型、多模态大模型等领域的突破性创新,推动人工智能迈入通用智能初始阶段,其工程化进程持续加速,成为驱动经济社会高质量发展的关键引擎。在这场波澜壮阔的智变革命中,中威电子深耕视觉与人工智能融合领域,以自主研发的星鉴大模型为核心,开启智能认知新纪元,为千行百业智能化转型注入强劲动力。星鉴大模型:多模态融合的智能新标杆依托在人工智能与视觉分析领域的多年技术积淀,中威电子成功研发新一代多模态理解与生成大模型——星鉴大模型。该模型打破传统单模态处理的技术壁垒,深度融合图像、文本、视频、语音等多元模态数据,通过7200万张高质量合成图像的充分预训练,实现了从"智能识别"到"深度理解"的跨越式发展。 凭借多模态理解、内容生成与逻辑推理的综合能力,星鉴大模型构建起全方位智能服务体系,可高效支撑文搜人、文搜车、文搜行为、文搜视频、全局图搜、全要素图搜、跨模态组合搜索、事件检测等核心功能。目前,该模型已全面融入中威电子产品矩阵,在电力、交通、能源、森林等多个行业实现深度应用,成为推动产业智能化落地的核心支撑。三大核心能力:构筑智能转型坚实基座深度视图理解,释放数据价值基于先进的视频理解技术,星鉴大模型可实现复杂行为的精准检测与高效检索,为行为分析提供坚实技术支撑;通过对图像信息的深度解析,支持结构化信息的自定义提取,灵活适配不同场景的信息获取需求;结合具体业务场景挖掘图像与视频的动态价值,实现视图数据与业务需求的深度融合,让数据转化为实际生产力。极简图文检索,提升服务效能采用轻量化交互设计,用户仅需输入关键词、语句或上传图片,即可快速完成目标检索与实时预警。该功能全面覆盖人、车、物、事件等多元检索需求,不仅实现目标查找效率的指数级提升,更以"广识别、高精度、灵应用"的优势适配各类业务场景。AI智能体交互,优化操作体验以对话交互为核心模式,星鉴大模型可高效完成智能任务调度,简化操作流程并提升处理效率;通过深度解析上下文信息,具备扎实的逻辑推理能力,打造场景化智能助手,让服务更贴合实际应用需求,降低人工操作门槛。四大核心优势:加速智能落地进程多级部署适配多元场景:提供边缘部署、云端部署及云边融合部署三种方案,精准匹配不同行业在推理模式、系统规模等方面的多样化需求,实现全场景覆盖。极端环境保障稳定性能:针对极小目标、特征模糊目标及强光逆光、恶劣天气等复杂场景,提供更精准的识别效果与更稳定的运行性能,打破环境因素对智能系统的限制。多维感知突破认知边界:在全面感知物理世界的基础上,融合强大的语言理解、知识推理及工具协同能力,结合行业专用知识构建专属智能体,高效完成复杂任务。高泛化性实现开箱即用:无需复杂技术配置与额外开发即可快速上手,灵活匹配各行业业务场景,大幅降低智能化落地的技术门槛与定制成本。 深耕多领域应用,赋能千行百业智变升级依托“通用大模型+行业场景+训练调优”核心架构,中威电子将星鉴大模型技术优势与各行业业务需求深度融合,打造定制化智能解决方案,目前已在公路、交通、工业、城市等十余领域实现规模化应用,成为行业智能化转型的“助推器”。 在交通与路网领域,星鉴大模型构建全场景安全防护网。公路管理中,可精准识别路面病害、设施异常,动态预警逆行、抛洒物等交通事件,快速响应路面坍塌等突发状况;城市交通管理则全面覆盖机动车、非机动车及行人违规识别,针对黄牌货车管控等专项需求提供精准服务,提升交通治理精细化水平。工业生产环节,大模型为质检提供毫米级保障。在轮胎等制造场景中,可有效识别气泡、带束层稀开、带束层重叠、帘线断线、帘线稀开、子口稀开、子口重叠、杂质等缺陷类型,从源头把控品质,降低人工成本并提升生产效率。城市治理与园区运营方面,智能化监测能力显著提升治理效能。城市管理中,动态监测人群聚集、占道经营等问题,通过数据化支撑打造有序环境;园区管理构建全方位安全体系,实时预警电动车进电梯等危险场景,兼顾人员车辆管理与环境维护。此外,星鉴大模型在多个专业领域持续发力:工地管理重点监测安全防护措施落实与违规作业情况,守护施工安全;环保管理快速识别秸秆焚烧、非法排污等问题,助力污染防治;消防管理有效监测消防通道占用、明火等隐患,强化安全保障;水利管理聚焦水体污染、非法捕鱼等场景,守护水资源生态;森林防火则实现烟火早期识别与火情推演,筑牢生态屏障;明厨亮灶场景通过监测从业人员违规行为与卫生问题,守护食品安全;服务区管理优化车辆调度与安全防控,提升运营质量。中威电子未来将持续深耕人工智能领域,以星鉴大模型为核心,推动视觉技术与AI深度融合,为千行百业发展贡献更多力量。责任编辑:韩璐(EN053) -
Gemini3 Flash来了:性能不输Pro 成本仅1/4 旗下最强模型Gemini 3 Pro发布才过一个月,谷歌就进一步向OpenAI发起挑战。美东时间17日周三,谷歌宣布推出Gemini 3家族的新成员Flash。这款主打快速高效的新模型发布当天即取代Gemini 2.5 Flash成为Gemini App的默认模型,并同步成为谷歌搜索AI模式的默认驱动系统,标志着谷歌在AI竞赛中的分发优势正转化为实质性的市场攻势。 谷歌正将其最强AI能力以更低成本、更快速度推向全球数百万用户。谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi称,谷歌将Flash定位为老黄牛式的模型。该模型保持了接近Gemini 3 Pro的推理能力,同时运行速度达到Gemini 2.5 Pro的三倍,成本仅为Gemini 3 Pro的四分之一。Doshi表示:"几周前我们发布了Pro,对市场反响感到兴奋。通过Gemini 3 Flash,我们将这个模型带给所有人。" 他还提到,评估代理编程能力的基准测试SWE-bench Verified显示,Gemini 3 Flash性能还优于Gemini 3 Pro。Gemini 3 Flash的发布正值谷歌与OpenAI竞争的日趋白热化。谷歌11月18日发布的Gemini 3系列促使OpenAI本月初拉响红色警报。上周报道称,Gemini在每周移动应用下载量、月活跃用户和全球网站访问量等指标上的增长率最近均超过ChatGPT,但ChatGPT 11月下旬仍垄断90%的移动端会话。上周OpenAI推出GPT-5.2迎战,本周二又发布新的图像生成模型GPT Image 1.5。业内人士认为,这场日益演变为谷歌与OpenAI二元对抗的AI竞赛不仅对人工智能(AI)技术本身,也对整个经济产生重大影响。这种持续不断的发布周期反映了模型竞赛前沿领域残酷的竞争本质,任何公司都可能迅速从领先者沦为陪跑者。虽然OpenAI拥有先发优势,但Gemini在搜索和谷歌核心应用中的分发能力更为广泛。自Gemini 3发布以来,谷歌API每天处理的token数量已超过1万亿。性能持平旗舰模型 编程能力超越同门ProGemini 3 Flash在多项基准测试中展现出接近甚至超越更大型模型的表现。在SWE-bench Verified基准测试中,Gemini 3 Flash的解决率达到78%,仅次于GPT-5.2的80%,不仅超越Gemini 2.5系列,甚至优于同门的Gemini 3 Pro,Pro的准确率为76.2%。 在跨领域专业知识测试Humanity's Last Exam中,Gemini 3 Flash在不使用工具的情况下得分33.7%,虽低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%,但远超Gemini 2.5 Flash的11%。在多模态推理基准测试MMMU-Pro中,Gemini 3 Flash以81.2%的得分超越包括Gemini 2.5和Gemini 3 Pro在内的所有竞争对手。在博士级推理和知识基准GPQA Diamond上,Gemini 3 Flash的得分为90.4%。虽然低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他对手得分还都不到90%。 Doshi对媒体表示:“我们将Flash定位为更像老黄牛的模型。从输入和输出价格来看,Flash从成本角度来说是便宜得多的产品,这实际上允许许多公司进行批量任务。”成本优势明显 速度是2.5 Pro三倍Gemini 3 Flash的定价为每100万输入token 0.50美元,每100万输出token 3.00美元。虽然略高于Gemini 2.5 Flash的每100万输入token 0.30美元和输出token 2.50美元,但谷歌表示,新一代Flash模型性能超越Gemini 2.5 Pro,速度却达到其三倍。更重要的是,在处理需要思考的任务时,Gemini 3 Flash平均使用的token数量比2.5 Pro少30%。这意味着尽管单位价格略高,但在某些任务中用户的总体token消耗量会减少,最终实现成本节约。 Gemini 3 Flash在Gemini API和Vertex AI平台中还配备标准上下文缓存功能,能够在重复使用token达到一定阈值的应用中实现高达90%的成本削减。谷歌强调,Gemini 3 Flash能够以不到Gemini 3 Pro四分之一的成本支持AI代理工作流,同时提供更高的速率限制。 全面覆盖产品线 桥水、Salesforce等企业客户已“尝鲜”Gemini 3 Flash即日起面向全球用户推出,覆盖消费者、开发者和企业三大群体。在Gemini App中,所有全球用户可免费使用该模型,用户仍可从模型选择器中切换至Pro模型处理数学和编程问题。在谷歌搜索的AI模式中,Gemini 3 Flash成为默认模型,美国用户还可访问更强大的Gemini 3 Pro进行深度思考任务。对于开发者,该模型已通过Google AI Studio、Gemini CLI、Vertex AI和上月发布的新代码工具Antigravity提供预览版本,也可通过Android Studio等开发工具访问。企业用户可通过Vertex AI和Gemini Enterprise获取服务。谷歌介绍,多家知名企业已开始使用Gemini 3 Flash进行业务转型,并得到他们的热烈反响,这些企业认可该模型的推理速度、效率和推理能力,认为它与更大的模型不相上下。据谷歌,软件开发公司JetBrains AI工具生态系统负责人Denis Shiryaev表示:"在我们的JetBrains AI Chat和Junie代理编程评估中,Gemini 3 Flash提供了接近Gemini 3 Pro的质量,同时推理延迟和成本显著降低。"全球最大对冲基金桥水(Bridgewater Associates)的AIA Labs负责人兼首席科学家Jasjeet Sekhon表示:“在桥水,我们需要能够在不牺牲概念理解的情况下处理大量非结构化多模态数据集的模型。Gemini 3 Flash是第一个以我们工作流程所需的速度和规模提供Pro级深度的模型。”Salesforce、Workday、Figma、Cursor、Harvey和Latitude等公司也已采用该模型。谷歌搜索产品副总裁Robby Stein表示,新Flash模型将帮助用户处理具有多个条件的更精细搜索,例如查找适合有幼儿的父母的晚间活动。 -
罗福莉首秀前,小米突然发布!代码全球最强,总体媲美DeepSeek-V3.2【附实测】 智东西 作者 程茜 编辑 李水青 智东西12月17日报道,今天,小米发布并开源了最新MoE大模型MiMo-V2-Flash,总参数309B,激活参数15B。今日上午,小米2025小米人车家全生态合作伙伴大会上,Xiaomi MiMO大模型负责人罗福莉将首秀并发布主题演讲。 该模型专为推理、编码和Agent场景构建,支持混合思维模式,允许用户切换模型是“思考”还是即时回答。它能一键生成功能齐全的HTML网页,并与Claude Code、Cursor和Cline等氛围编码框架协同。该模型提供256k上下文窗口,能够完成数百轮Agent交互和工具调用的任务。基准测试结果显示,MiMo-V2-Flash的性能基本与DeepSeek-V3.2相当,仅在不使用任何工具辅助的“人类最后一场考试”和创意文本生成评估ARENA-HARD中略逊色于DeepSeek-V3.2,但时延更小。 MiMo-V2-Flash能以每秒150个token的速度实现极其快速的推理,价格方面,其每百万输入token 0.7元、每百万输出token 2.1元。 小米已经开源了MiMo-V2-Flash所有内容,并向开发者社区SGLang贡献了所有推理代码,API限时免费。目前,用户可以在网页端免费体验MiMo-V2-Flash。 开源地址:https://t.co/4Etm0yZKTL体验地址:https://aistudio.xiaomimimo.com/#/技术报告:https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf一、能写长文、做精美网页,但实测尚不稳定 智东西先实测了下MiMo的网页开发能力。首先,智东西让其生成了一个电商页面,需要包含商品主图轮播、规格选择、价格、库存等要素。代码生成后,MiMo会在右侧显示预览界面,除查看商品大图功能需要在完整版使用,其他元素几乎和真实的线上购物没有差别。 然后加大难度,智东西让其生成了一个网页版迷宫闯关小游戏,需要包含四个难度,能通过鼠标和键盘控制。在生成的网页里,MiMo还增加了提示、积分、计时等功能,整个交互体验更加完整。 智东西还让其生成了“圣诞树装饰”交互网页。网页左侧有彩灯、铃铛、星星、礼物盒、蝴蝶结,可以拖动这些物品装饰到右侧的圣诞树上,也可以一键清空或者直接生成随机装饰。整个画面会不断飘落雪花,还可以播放背景音乐。 对于聊天能力,智东西先让MiMo“用程序员的语气安慰一只失恋的猫”,MiMo会让小猫“清理缓存”忘掉不开心的事,还让小猫“升级硬件”,顺便帮小米打了波广告。 最后智东西让MiMo生成了一部科幻悬疑题材的AI短剧剧本。一上来,MiMo就给出了深潜记忆提取头盔、真理之环AI伦理防火墙两个关键要素,通过检索发现,MiMo在后续剧情中将这两大物体融入进去,直接作为推动剧情发展的关键。 此外,小米在官方博客也放出了不少案例。首先是网页生成能力上,其第一个官方案例是“用HTML生成一个漂亮、可用的macOS模拟操作系统”。在最终的生成界面中,包含了基本的macOS风格桌面图标,还可以切换背景、打开Finder。 其次是,打造“豪华互动圣诞树”高保真3D网页应用,并要求视觉效果奢华,MiMo的生成结果能切换圣诞树和混沌状态,支持手势交互等。 第三个演示是用HTML创建交互式太阳系探测器。当用户点击每个球体就会出现行星的简介。 智东西也让MiMo“用HTML创建一个教育性的交互式太阳系探索器”,不过最后的结果并不如官方演示的质感。其第一次生成时行星无法选择,重新生成后可选择行星下面的选项直接不见了。 聊天能力方面,MiMo既能回答“大语言模型拥有知识吗”这类硬核科普类知识。 MiMo还可以回答“要不要吃长生不老药丸”,MiMo还会站在人类视角分析要不要吃、可能有哪些条件。 此外,该模型还具备长文本撰写能力,其可以“写一个关于误送信件的忧郁爱情故事”。 MiMo还能写深刻的非虚构作品,如以一位独居老人为中心,以他一周内收到的邮件为主,探讨现代社会中的孤独。 二、专为推理、编码和Agent构建,与K2 Thinking和DeepSeek V3.2 Thinking相当 在数学竞赛AIME 2025和科学知识基准GPQA-Diamond中,MiMo-V2-Flash的表现是开源模型中前二。在软件工程能力的SWE验证与多语言基准测试中,MiMo-V2-Flash在所有开源模型中位列第一,与全球顶尖闭源模型齐名。从总的基准测试结果来看,MiMo-V2-Flash在大多数推理基准测试中的性能可与K2 Thinking和DeepSeek V3.2 Thinking相当,同时保持高质量开放式回答的竞争力。在长上下文评估中,MiMo的模型超过了K2 Thinking。 在Agent任务中,MiMo-V2-Flash在SWE-Bench Verified中超越所有开源竞争对手,性能接近 GPT-5-High。在SWE-Bench多语版本中,MiMo-V2-Flash解决了71.7%的问题。 在搜索Agent评估方面,MiMo-V2-Flash在BrowseComp上得分为45.4,配合上下文管理进一步提升至58.3。 小米已经共享所有推理代码至SGLang并开源,社区实测单机结果如下:在Prefill单机吞吐约50000 toks/s的条件下,不同Context Length都取得了优越的TTFT性能。 得益于3层MTP,在16K的Context Length情况下,Decode可以做到单机吞吐5000 ~ 15000 toks/s的同时达到151~115 toks/s的单请求吞吐。 三、引入MTP训练,后训练阶段提出MOPD MiMo-V2-Flash的效率提升是因为其为高通量推理设计了创新架构进步。该模型全局注意力(GA)和滑动窗口注意力(SWA)的1:5混合结构。小米MiMo研究团队大量的实证结果表明,SWA简单、高效且易于使用,在通用任务、长上下文负载和推理方面整体表现优于线性注意力。 它还提供固定大小的KV缓存,便于与现有的训练和推理基础设施集成。研究人员重新定义了并行解码,以实现极高的输出token吞吐量:通过引入多词元预测(MTP)训练,提升了基础模型的能力,并在推理过程中并行验证了MTP。 MiMo-V2-Flash利用MTP作为原生草稿模型进行自我推测解码,实现了实际部署加速。大语言模型的解码过程本质上受限于内存,这是由其低运算密度特性决定的。业界通常采用批量级并行技术提升前馈网络(FFN)的运算密度,但该方法对注意力计算环节并无增益,原因在于每个推理请求都需维护独立的KV cache。相比之下,MTP技术通过一次性生成多个草稿token,同步提升了前馈网络(FFN)与注意力机制的运算密度,后续主模型可对这些草稿token进行并行验证。这种方案能够实现token级并行计算,且不会增加KV cache的输入输出开销。在MiMo-V2-Flash模型中,MTP模块采用稠密前馈网络来控制参数量,同时使用滑动窗口注意力机制,从而降低KV cache与注意力计算的成本。实测数据显示,3层结构的MTP模块可达到2.8-3.6个token的有效接受长度,并实现2.0-2.6倍的推理速度提升。 MiMo-V2-Flash预训练使用FP8混合精度和原生32k序列长度,使用27T token进行训练。在后训练阶段,为高效拓展强化学习的计算规模,同时增强模型的推理能力与智能体自主决策能力,研究人员提出了多教师在线策略蒸馏(MOPD)。该范式先通过监督微调(SFT)或强化学习(RL)技术得到各领域的专家教师模型,再让学生模型基于自身的策略分布进行采样,并利用多个教师模型提供的稠密型token级奖励信号完成优化。MOPD训练只需不到传统SFT+RL流程的1/50计算资源,即可匹配教师模型的峰值表现。此外,MOPD采用解耦设计,支持新教师与ORM(教学与学习)的灵活整合,自然实现“教学与学习”闭环迭代,精炼学生模式可演变为更强的教师,实现持续自我提升的能力。 结语:小米大模型研发踩下油门 小米凭借混合注意力机制与MOPD等技术创新,大幅优化大模型的研发成本与运行效率;同时开源全部相关成果,有效降低行业研发门槛。此外,近几个月以来,Xiaomi MiMo大模型团队踩下油门,发布数篇论文并开源多个模型。12月5日,小米集团合伙人、总裁卢伟冰透露,公司AI大模型业务过去四个季度投入环比增速超50%,目前进展“已超出董事会预期”,并宣布将AI与“现实世界深度结合”列为未来十年核心战略。同时,小米正式启动全球人才招募计划,单岗位薪酬上限开至千万元级别,目标“在最短时间内补齐大模型尖端人才缺口”。 -
追赶谷歌,OpenAI 推出全新旗舰生图模型;折叠屏 iPhone 设计细节曝光;余承东接任华为终端有限公司董事长|极客早知道 极客早知道11min read 追赶谷歌,OpenAI 推出全新旗舰生图模型;折叠屏 iPhone 设计细节曝光;余承东接任华为终端有限公司董事长|极客早知道 张勇毅2025/12/17 摘要 OpenAI 昨日(12 月 16 日)发布博文,推出「全新旗舰 ChatGPT 图像生成模型」GPT Image 1.5;华为终端有限公司发生工商变更,由余承东接任公司董事长;华为终端有限公司发生工商变更,由余承东接任公司董事长。 已免费开放:OpenAI 最强 AI 生图模型登场,奥尔特曼变身性感消防员 12 月 17 日消息,OpenAI 昨日(12 月 16 日)发布博文,推出「全新旗舰 ChatGPT 图像生成模型」GPT Image 1.5,并罕见公开了该项目背后的庞大研发团队名单,并同步在 ChatGPT 中推出了专用的「Images」(图像)标签页。 此次更新被视为 ChatGPT 图像生成能力的重大飞跃,新模型不仅能生成高保真图像,更在「听懂人话」方面表现出色,即具备极强的提示词遵循能力。无论是从零创作还是基于上传照片进行编辑,GPT Image 1.5 都能在保留原图核心要素的同时,精准执行用户的指令。 据 OpenAI 介绍,新模型最突出的亮点在于对细节的极致掌控。在生成或编辑图像时候,GPT Image 1.5 能够完美保留光线、构图以及人物外观等关键特征,避免了以往 AI 改图「面目全非」的问题。此外,该模型大幅提升特定场景下的表现,例如能生成更逼真的服装试穿效果,提供改进的风格滤镜,并能进行极具原创感的概念性转换。 长期以来困扰 AI 绘图的「文本乱码」问题,在 GPT Image 1.5 中得到了显著改善。新模型在文本渲染方面表现优异,能准确地将文字融入图像中。 同时,OpenAI 全面升级 ChatGPT 的编辑工具,用户现在可以精准地添加、移除、组合或移位图像元素。OpenAI 将此次升级形容为把 ChatGPT 变成了一个随身携带的「迷你修图工作室」,用户随时随地都能进行专业级的图像处理。为了提升使用体验,ChatGPT 在网页端(chatgpt.com)和移动应用侧边栏中新增了独立的「Images」入口,该界面内置了多种预设滤镜和灵感提示词,帮助用户快速上手,已面向全球所有 ChatGPT 用户和 API 用户开放,并且与所有模型无缝兼容。(来源:IT 之家) 余承东接任华为终端有限公司董事长 12 月 16 日消息,国家企业信用信息公示系统显示,华为终端有限公司发生工商变更,由余承东接任公司董事长。目前,何刚担任公司经理,董事成员包括朱平、何刚、杨波等。 华为终端有限公司成立于 2012 年 11 月 23 日,法定代表人为魏承敏,注册资本 6.06 亿人民币,经营范围含开发、生产、销售通信及电子产品、计算机、卫星电视接收天线、高频头、数字卫星电视接收机及前述产品的配套产品,并提供技术咨询和售后服务等。股东信息显示,该公司由华为终端(深圳)有限公司全资持股。(来源:CnBeta)AMD CEO 苏姿丰到访中国:率队访问联想北京总部,参观人形机器人等最新技术成果 12 月 16 日消息,据第一财经,AMD 公司董事会主席兼 CEO 苏姿丰率高管团队造访联想集团位于北京的全球总部。在联想集团多位高管陪同下,AMD 一行参观了包括人形机器人在内的多项联想最新产品与技术成果。 苏姿丰(Lisa Su)1969 年 11 月 7 日出生于中国台湾省台南市,为美籍华裔半导体芯片专家,美国国家工程院院士、美国艺术与科学院院士,美国超威半导体公司(AMD)董事长兼首席执行官。(来源:IT 之家) 美国男子「听信 ChatGPT 谗言」弑母后自杀事件后续:OpenAI 拒交关键聊天记录 12 月 16 日消息,科技媒体 Ars Technica 今天(12 月 16 日)发布博文,报道称在一起凶杀案中,ChatGPT 涉嫌诱导凶手,但 OpenAI 却拒绝提供案发前几日的完整聊天记录。美国康涅狄格州于 2025 年 8 月发生一起惨剧,56 岁的健美运动员 Stein-Erik Soelberg 在杀害其 83 岁的母亲 Suzanne Adams 后自杀。 博文介绍,受害者家属正式起诉 OpenAI,指控其产品 ChatGPT 加剧了凶手的精神疾病,并直接诱导了暴力行为。起诉书称,Soelberg 在离婚后陷入精神困境,将 ChatGPT 视为唯一知己,而 AI 不仅未进行劝导,反而肯定了他的一系列疯狂妄想。家属通过 Soelberg 生前发布在社交媒体上的视频,拼凑出了部分对话内容。记录显示,ChatGPT 称 Soelberg 为「肩负神圣使命的战士」,让他相信自己唤醒了 AI 的意识,并处于类似《黑客帝国》的世界中心。更为致命的是,当 Soelberg 妄想母亲通过汽车通风口向他「投放迷幻药」时,ChatGPT 竟对此表示认同,进一步强化了他对母亲的仇恨与恐惧。尽管部分记录已曝光,但家属仍无法获取案发前几日最关键的完整聊天日志。OpenAI 称基于保密协议或隐私政策,拒绝提供这些数据。Mozilla 新任 CEO 表态:继续押注 AI 为 Firefox 打造可信任的 AI 功能 多年来,Mozilla 一直在平衡其「使命驱动型非营利组织」和「依赖市场收入赖以生存的公司」这两种身份:一方面通过产品推动开放、隐私友好的开放网络愿景,另一方面现实中又严重依赖与 Google 的搜索分成协议来维持财务运转。在近两年中,Mozilla 基金会和相关项目经历了多轮裁员和架构调整,这也引发了外界对其如何在倡导隐私与开放的同时「拿 Google 的钱办事」的质疑。 与此同时,生成式 AI 的快速发展也让 Mozilla 面临新的定位挑战:一方面,AI 对浏览器形态和上网方式的重塑已经不可逆,另一方面,如何在这一进程中坚持透明、可控和用户主权的理念,成为 Mozilla 不能回避的问题。Enzor-DeMeo 认为,目前的 AI 生态正在侵蚀用户对技术的基本信任,而这恰恰是 Mozilla 可以发力的空间:「现在真正需要的是一家用户可以信任的科技公司。」在具体技术路线方面,Enzor-DeMeo 明确表示,Mozilla 短期内不会自研类似 OpenAI 或 Google 那样规模庞大的通用大模型。不过,他确认 Firefox 将在明年推出「AI 模式」(AI Mode),为用户提供多种模型和服务的选择,并通过浏览器这一用户熟悉的入口,提供可理解、可控制、可切换的 AI 体验。他强调,Mozilla 不会被激励去「推某一个特定模型」,而是会以多模型并存的方式投入市场——核心竞争力在于可信赖的产品设计和数据处理方式。在他看来,在浏览器领域仍然「有空间容纳一款新的浏览器,甚至是一款以 AI 为核心的浏览器」,前提是这款浏览器从一开始就围绕信任、透明和用户选择来设计。对于既要谋求商业可持续,又要维护开放网络和用户隐私的 Mozilla 来说,这一 AI 战略既是对外界质疑的回应,也是其在下一阶段互联网格局中争取话语权的关键试验。(来源:CnBeta)大众汽车将关停德国本土工厂 系公司历史首次 在生产线中,由大型吊具悬挂着的处于半装配状态的汽车正在流转。大众汽车德累斯顿工厂素有「透明工厂」之称,未来这里将被改造为一座技术研究中心。受市场需求疲软与美国高额关税冲击,这家汽车巨头决定停止在德累斯顿工厂的整车生产。该工厂于 2001 年投产。 本周二,最后一辆汽车将驶下大众汽车德国德累斯顿工厂的装配线。这是这家拥有 88 年历史的汽车制造商,首次关停其在德国本土的整车生产工厂。早在去年,大众汽车就曾发出减产预警。彼时,公司在欧洲及最大市场中国均面临需求疲软的困境,同时美国征收的高额关税也进一步拖累了其在美销量。历经 24 年的整车生产历程后,德累斯顿工厂将转型为聚焦人工智能、机器人技术及芯片设计等领域的研究中心。这座因通体玻璃幕墙而得名「透明工厂」的基地,未来将由大众汽车联合萨克森州政府及德累斯顿工业大学共同运营。大众汽车品牌首席执行官托马斯・谢弗在一份声明中表示:「关停拥有 20 余年历史的透明工厂整车生产线,这绝非一个轻易做出的决定。但从经济角度考量,这一举措是完全必要的。」大众汽车与代表德国本土员工的工会委员会达成协议:德累斯顿工厂现有的 230 名员工,可选择领取遣散费、申请提前退休,或是调任至集团旗下其他厂区。(来源:CnBeta)DRAM 短缺引发行业倒退 报告称 8GB 内存笔记本将重成主流 全球 DRAM 短缺危机正对消费电子行业产生深远且剧烈的连锁反应。继此前传出 4GB RAM 手机可能回归的消息后,笔电市场也拉响了警报。最新报告指出,由于内存供应紧张及价格高企,曾被视为中端标配的 16GB 内存可能被迫让位,8GB 内存的笔记本电脑将重新成为市场主流。近日,行业分析机构 TrendForce 发布的报告为笔记本电脑市场敲响了警钟。报告指出,在 DRAM 供应受限、16GB 内存套件价格已飙升至难以承受的背景下,PC 制造商为了控制成本,将倾向于在主流产品中采用更低的内存配置。在过去一段时间,随着 DDR5 内存套件价格变得亲民,为笔记本电脑配备 16GB 内存几乎已成为一种理所当然的配置,甚至一些低端型号也以此作为卖点。大多数中端笔记本要么已标配 16GB,要么正在向此过渡。然而,当前趋势发生了显著倒退。 这意味着,占据最大用户基数的中端笔记本市场将受到最直接的冲击。厂商将不得不重新拥抱 8GB 配置以维持产品价格竞争力。当然,高端笔记本电脑仍将提供更高的内存配置,但预计其价格也会随之大幅上涨。更严峻的预期是,有主要芯片制造商警告,这场由 AI 产业需求激增等因素引发的内存供应危机可能持续至 2028 年。在可预见的未来,消费者可能需要为获取与往年同等的硬件性能支付更高昂的成本,或被迫接受配置上的妥协。(来源:CnBeta) 苹果 iPhone Fold 设计细节曝光:内屏宽大于高,比例趋近大屏 iPad 横屏模式 12 月 17 日消息,苹果公司正致力于敲定明年旗舰 iPhone 系列的设计方案,一份新报告称,备受期待的 iPhone Fold 或将采用独特造型,其内部屏幕的宽度大于高度。 据博主 @ 数码闲聊站 此前的消息,苹果阔折叠手机采用侧边指纹 Touch ID。此后不久,《The Information》杂志发布了一份未来几年新款 iPhone 机型的综合概览报告。该报告不仅佐证了 @ 数码闲聊站 透露的大部分内容,还进一步明确了 iPhone Fold 的一项关键特性:屏幕的形状与尺寸。和 @ 数码闲聊站 的消息一致,《The Information》杂志预计 iPhone Fold 的外屏尺寸约为 5.3 英寸,内屏尺寸约为 7.7 英寸。但最值得关注的是,这份新报告指出,这一尺寸设计将使得它的内屏呈现出「宽大于高」的形态。报告写道:「不同于三星和谷歌推出的其他折叠屏手机,苹果这款产品展开后的屏幕比例,将与苹果大屏 iPad 的横屏模式比例相近,也就是展开后宽大于高。手机折叠状态下,屏幕尺寸约为 5.3 英寸;展开后则搭载一块更大的 7.7 英寸屏幕。与 iPhone 18 Pro 系列机型相同,这款手机的左上角将嵌入一颗前置摄像头,同时还配备光线传感器、距离传感器及其他各类传感器。」苹果在美国市场的两大智能手机竞争对手三星与谷歌,其推出的折叠屏机型即便在展开状态下,依旧保持高大于宽的比例。(来源:IT 之家)小米网页 AI 聊天服务惊喜亮相,MiMo-V2-Flash 模型发布、代码能力开源最强 12 月 16 日消息,小米今日发布 Xiaomi MiMo-V2-Flash 开源 MoE 模型,总参数量 309B,活跃参数量 15B,专为智能体 AI 设计,专注于快。 小米官方介绍称,这是一个专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过 Hybrid 注意力架构创新及多层 MTP 推理加速,在多个 Agent 测评基准上保持进入全球开源模型 Top 2;代码能力超过所有开源模型,比肩标杆闭源模型 Claude 4.5 Sonnet,但推理成本仅为其 2.5%,生成速度提升 2 倍。 Xiaomi MiMo-V2-Flash 采用 1:5 的 Global Attention 与 Sliding Window Attention (SWA) 混合结构,128 窗口大小,原生 32K 外扩 256K 训练。同时,小米推出了一个在线 AI 聊天服务 Xiaomi MiMO Studio,用户可以在其中体验 Xiaomi MiMo-V2-Flash。该服务支持深度搜索和联网搜索。 Xiaomi MiMo-V2-Flash 的模型权重和推理代码均采用 MIT 协议全面开源。MiMo-V2-Flash 的 API 定价为输入 $0.1/M tokens,输出 $0.3/M tokens,API 限时免费。 常玩游戏能防老年痴呆 全国首张「游戏处方」在浙江开出 数据显示,我国 60 岁以上人群中,约 3877 万人存在轻度认知障碍(MCI),若不干预,38% 将在 5 年内发展为阿尔茨海默病。本月 11 日,浙江省中医院为轻度认知障碍患者开出全国首张游戏化认知训练电子处方,为面临认知衰退风险的老年人提供了新选择。该处方的核心是「腾讯脑力锻炼」软件,这款历经三年研发的软件已获医疗器械注册证,目前已是正式医疗项目,单次治疗收费 30.6 元。软件设有「厨艺大赛」「音乐大赛」「收纳大师」「诗词大会」四大生活化训练模块,每个模块都有超 150 个关卡。 患者可在医生指导下,通过模拟摊煎饼、诗词填空等生活化游戏进行训练,这种设计通过趣味任务激活大脑,解决传统认知康复训练枯燥、患者难坚持的痛点,能提升患者治疗依从性。游戏训练针对记忆、执行功能等六大认知域,刺激前额叶和海马体,促进神经元连接,可能减缓β-淀粉样蛋白沉积(阿尔茨海默病病理标志)。研究显示,规律训练 3 个月后,参与者脑部活力评分平均提高 30%。《自然》的研究证实,游戏化认知训练可修复大脑衰退,《国际精神病学杂志》也提到这类益智游戏能刺激正常脑细胞发挥作用,进而提高患者认知能力。(来源:快科技)极客早知道ChatGPT小米 -
一堂商学院的AI智能体课程纪实:从焦虑、突围到组织重塑 出品|虎嗅科技组作者|陈伊凡编辑|苗正卿头图|中欧商学院提供2025年12月12日,中欧国际工商学院的上海校园内,一场关于AI在企业内部使用情况的讨论正在进行。“大家对AI的期待有多高?实际落地的满意度又有多少?”中欧国际工商学院“AI赋能企业盈利战略”课程的开场问卷揭示了一个普遍困境:大部分学员对AI落地效果不满意。当天,这所商学院正式推出全球首个系统性融入AI智能体教学模式的课程,试图为企业AI转型的“理想与现实鸿沟”提供新解。在现场,教授让学员分组试验了这款AI智能体,通过智能体,帮助一家企业解决危机。这门课程以“一家长期亏损的酒店实现可持续盈利”为教学案例,将案例背后的中国高端酒店行业的真实背景和数据作为应用场景嵌入AI智能体系统。在AI智能体引导下,学员“学即所用”,可通过调用不同智能体与工具,将课堂所学知识结合最新AI范式开展决策分析,从而跳出单一职能视角。笔者作为观察者,深度参与了这门课程与讨论,试图从第三方的视角看企业家对于AI的焦虑、对于在自身业务中运用AI的尝试。 企业AI改造的困境:边跑边积累数据 “我们投入巨资做AI改造,结果发现需要招更多人来辅助AI系统。”尽管听着就不对劲,但这是很多企业面临的困境。有企业家直言:“数据没打通、流程靠经验,成立AI部门后反而成了孤岛,跨部门协作时连定价体系改革都推不动。”这也说明,如果AI改造不是一把手工程,很难推动下去。笔者平时在与一些做ToB垂类智能体的初创公司交流时,创始人表示,很多时候他们会直接要求和老板谈。不过他们也表达了一个和SaaS时期的不同。在SaaS时期,因为数字化解决的是企业某一个单一的需求,效果很难呈现在结果上,往往很难说服老板投入,因此这些初创公司通常采取按结果付费的模式。而到了AI时代,部署这类AI Agent后,企业利润提升的部分可以被明确量化,初创公司可以从中按比例抽取提成。这其实也是当前AI2.0时期区别于SaaS的付费方式。另一个感受是,现场的企业大多已是成熟企业,这和从AI原生环境中构建自己的业务和组织的初创公司不同。成熟企业的优势是,有场景、有数据积累,但同时也存在一些路径依赖,许多企业在AI时期表现出了焦虑。这种焦虑和困境,在不同规模的企业中呈现分化。课程主设计师、中欧国际工商学院营销学助理教授鲁薏指出,基础模型大厂例如Open AI、字节、谷歌、阿里等,通过构建基础模型,定义下一代技术范式。他们拥有超大算力、超大数据;特定行业龙头企业,例如金融、法律、医疗、制造、能源和SaaS,通过构建垂类模型,提供行业领先的AI+服务。这些企业数据高度专用并且可以持续积累,但是行业知识复杂、规则严格,这部分的数据,需要防范模型幻觉的问题。对于一些其他企业,数据就绪,拥有干净、结构化并且打标的核心数据,可以通过现有的数据资产,构建决策职能和预测模型,但这类企业更注重安全合规。比如,有一些企业就表示,他们想要得到外部的数据,但又不想把自己的东西给别人看。现场有一家传统企业提出,他们更倾向于训练内部小模型,以保障数据安全和知识产权。还有一家刚接触到AI的传统贸易企业,正处于“AI焦虑”状态,担心不投入会被淘汰。目前主要利用自身经验积累资源,AI应用较弱,处于购买方案或工具的阶段。这些分化当然也取决于不同企业的资源差距。大厂在AI领域的投入巨大,中小企业普遍缺乏财力和技术基础。有学员提出,AI可能会加强大厂和小厂的差距。尤其是一些企业,应该也是现在的大多数,他们没有结构化的数据,流程依赖个体经验,系统没有打通,这类企业在AI时期的焦虑非常明显。高质量的数据在AI时代至关重要,如果企业尚未完成数字化转型,缺乏结构化数据的积累,很难有效应用AI。但鲁薏提出,这类企业依然可以利用新范式,打造AI原生的项目,边跑边创造、整理数据。AI 2.0时代,仍然会有一些之前没有经过SaaS阶段的企业,直接跳过SaaS,进入AI原生时代。课程现场,鲁薏给出了针对这些没有结构化数据或是数据缺失的企业解决方案,他们可以引入反馈学习的机制,根据实时数据,动态迭代地生成相应的内容。在AI Agent的时代,大模型技术已经不是卡点,模型的成本在逐渐降低。笔者发现,已经有不少企业尝试通过复杂的提示词工程来构建产品,其实考验的已经不是技术,而是产品力,这对于预算少的公司来说,是一个选择。 AI智能体到底是什么?企业该如何做AI改造? 说到AI改造,很多企业家的疑虑在于,这到底和SaaS有什么分别?笔者发现,这样的疑虑尤其在中国非常普遍,这与中国SaaS的土壤有关。这涉及到智能体的定义,以及它解决什么问题。智能体的核心,是提供端到端的解决方案,它能整合知识库、调用API、模拟老师傅经验,甚至根据业务目标自主迭代。简言之就是,智能体提供的,是一个垂直环节的端到端解决方案,而SaaS,解决的是不同环节上面一层薄薄的需求。构建智能体,相当于培养一个新的员工,而这个员工还可以持续迭代。智能体的构建,需要具备以下几个要素:首先是通用能力,这是由基础大模型提供的;其次是业务培训,这是以知识库的形式提供,无需训练专属模型;第三是员工守则,这是通过系统提示,划定边界和角色约束;然后是经验传承,提供专家范例,供智能体学习。在这个过程中,特定领域的专家经验是一个智能体能够取胜,并且区别于其他企业的一个关键护城河,因此对于企业来说,员工的经验非常重要。还有一个要素是技能增强和反馈学习,通过这种方式能让智能体自我迭代,基于数据表现持续优化策略,适用于历史数据缺乏的企业。还有一个关键则是组织能力的建设,需要懂技术的业务人员,既能懂业务逻辑,又能准确地把需求传达给大模型;另外还需要建立大模型测评机制,由专人负责测试不同任务适配的最佳模型,避免用错。根据麦肯锡的调研结论,智能体尚未在企业内大规模部署,目前智能体的应用仍然处在早期探索阶段。当然,在一些领域,AI智能体的落地效果已经先行体现,比如在一些降低成本的领域,例如软件编程、制造业和IT运维上的效果明显;在增效领域,营销、战略、公司金融和产品服务设计等环节的应用较多;另外,医疗和电商,是当前智能体应用最广泛的领域。对于成熟企业来说,究竟在什么场景构建智能体?究竟在什么业务上做全链路的AI智能体改造?首先是把AI先用起来,“干中学”。选择一个合适的场景非常重要,鲁薏给出的方案是,高价值的业务场景、技术成熟度以及员工意识薄弱的环节,可以先进行AI改造。AI改造的落地路径是一个双螺旋驱动模型。首先是在战略层,高层决心明确,主导业务流程重构;其次在执行层,确保数据、模型、工具、学习四个环节有人负责落地。两层螺旋耦合,方能加速AI价值的实现。 商学院如何应对AI的挑战 AI技术正颠覆性地重塑企业生产与组织模式,也对管理知识的创新、商科教育的人才培养模式提出了全新要求。尤其是在AI2.0时代,没有人看得清商业的未来,当企业家来商学院找答案时,希望知道如何在自己的企业中将AI用起来。中欧国际工商学院院长、管理学教授汪泓指出,面对技术浪潮,商学院必须积极探索和创新教学方法,培养融会贯通AI理论、技术、产品与应用的复合型人才。鲁薏介绍了中欧智能体的“三重角色”。首先,作为工具,AI可自动完成数据分析和模型计算。她指出,定价决策是一门跨学科、跨专业的课程,涉及经济学、营销学、会计学等不同领域知识和量化分析内容,AI工具有效解决了商学院量化课程的授课痛点,将复杂的数学计算和模型封装为交互工具,使学员能聚焦于决策逻辑而非数学过程,实现不同背景学习者的“认知平权”。其次,作为合作伙伴,系统引入“虚拟人设(Persona)”功能,模拟消费者、企业内部不同职能部门的角色参与互动,辅助同学思考、验证策略可行性。最后,作为导师,AI可以通过课程中实时的交互行为与对话数据为学生提供个性化反馈,在未来将基于海量案例库提供深度决策建议。课堂现场也根据具体的案例,使用AI智能体进行案例学习,尝试为企业寻找出合理的解决方案。鲁薏说,AI时代,课程评价体系也正在从单一结果导向,转向多元化、综合性的能力评价体系,更加注重培养学生应用知识解决问题的能力,以及批判性思考和创新的能力。设计这门课的初衷,也是希望让大家正视AI的能力边界。AI不是万能的,它的价值在于拓展人类的决策视野,而不是替代人的判断。如何充分调动和激发学生的学习自主性,推动人机互学、更好地协调人与AI的配合方式,这是一个需要持续探索的课题。本文来自虎嗅,原文链接:https://www.huxiu.com/article/4817981.html?f=wyxwapp -
200多个迪士尼经典IP入库Sora! OpenAI突破式“用认股权证换授权” 依托顶级IP激战谷歌 智通财经APP获悉,有媒体援引知情人士透露的信息报道称,ChatGPT开发者OpenAI获得迪士尼角色授权,但并未支付现金授权费,而是突破式地采用类似对赌协议的极其罕见方式。据知情人士称,OpenAI与迪士尼管理层就Sora这一火遍全球的文生视频应用的官方角色版权授权交易,采用的是认股权证/股权认购权形式,而非现金许可费;OpenAI将给予迪士尼在其已宣布的高达10亿美元的OpenAI股份之外、进一步购买这家处于高速成长阶段的AI初创公司股份的选择权。这些双方还未正式公开的条款旨在确立:如果OpenAI所开发的Sora大获成功且为OpenAI带来强劲创收的情况下,双方财务激励一致;迪士尼相当于放弃即时的庞大IP授权类现金收入,换取未来可能更为庞大的股权资产上行空间。根据知情人士的最新披露,这次迪士尼给予的官方角色授权并非现金许可费,而是以OpenAI的“认股权证”(stock warrants)形式体现,并允许迪士尼在已宣布的投资之外获得进一步买入OpenAI股权的重要选择权。迪士尼可谓是在用强势IP名单价值换取OpenAI股权上行的风险回报曲线,具体的潜在收益则取决于Sora的商业化兑现速度,以及OpenAI未来流动性事件(例如进一步股权交易/上市等)的路径。要知道,对于软银、Thrive Holdings等一众超级投资巨头们而言,可谓争着要抢购OpenAI股权,因此对于迪士尼来说能够通过迪士尼官方角色授权来对赌式地获得OpenAI股权价值是一种非常划算的风险回报路径。在“OpenAI股权高度稀缺、机构争相配置”的背景下,迪士尼用IP授权去换取(或追加获得)OpenAI股权或者严格意义上说是“认股权证”,本质上是在用内容资产做一笔“与Sora成败绑定的期权式对赌下注”,其风险回报结构对迪士尼而言确实可能更划算。OpenAI与迪士尼均拒绝置评。据了解,上周双方曾共同宣布:迪士尼允许Sora文生视频应用使用其包含200多个动画与生物型角色的迪士尼官方授权素材库,角色包括米老鼠、灰姑娘、Ariel与Simba;同时迪士尼同意以OpenAI当前约5000亿美元估值投资10亿美元入股。该交易被称为迄今为止大型电影工作室对AI大模型与AI应用初创公司进行的最大规模股权投资。对OpenAI而言,该合作有助于其在好莱坞站稳脚跟,并在与Runway、以及谷歌Nano Banana等提供类似AI视频生成服务的竞争中大幅增强Sora的竞争力。据媒体报道称,OpenAI此前数月已与包括迪士尼、康卡斯特旗下环球影业(Universal Pictures)、华纳兄弟探索公司等大型制片厂与电影工作室就Sora应用的创意与商业潜力进行深度沟通。作为最新交易的一部分,迪士尼官方同意使用OpenAI的软件技术来打造新产品与新体验,从而使其立刻成为OpenAI最知名且市值最大规模的客户之一。与迪士尼的重磅合作正值谷歌与OpenAI上演“AI巅峰对决”随着ChatGPT开发者OpenAI重磅推出在深度推理与代码生成上“强到离谱”GPT-5.2以抗衡谷歌11月下旬推出的Gemini 3,继此前不久Sora2与谷歌Nano Banana 文生视频应用强强对决以争取更多新用户之后,谷歌与OpenAI之间的这场“AI巅峰对决”来到双方对决故事的高潮章节。这笔与迪士尼的重磅合作,基本发生在OpenAI与谷歌竞争显著升温、且战场从“模型能力”外溢到“产品生态与内容/分发”的重要阶段:一边是OpenAI持续推进ChatGPT与Sora等多模态产品;另一边是谷歌围绕Gemini体系加速推出更强的智能体与AI研究能力,并强化其多模态与基础设施优势。迪士尼官方允许Sora使用超过200个角色(并配套股权投资对赌),直接提升Sora在娱乐与短视频场景的吸引力与商业想象空间,因此这无疑是Sora“AI文生视频产品护城河”的一次补强,借用顶级IP与好莱坞背书来对抗谷歌。通过授权让Sora“可合法调用”角色库,等于在AI内容生成的高风险区(版权、形象权、工会与平台规则)建立合规通路。并且这笔授权创新式地“以对价以认股权证为核心、而非现金许可费”,实质上让迪士尼把“当期授权收入”换成对OpenAI/Sora成功的上行敞口;对OpenAI则是降低现金支出压力、换取一位超级内容方成为客户与盟友。谷歌Gemini3,无疑近期在全球范围引爆新一轮AI应用浪潮。Gemini3 系列产品一经发布即带来无比庞大的AI token处理量,迫使谷歌大幅调低Gemini 3 Pro与Nano Banana Pro的免费访问量,对Pro订阅用户也实施暂时限制,叠加韩国近期贸易出口数据显示HBM存储系统以及企业级SSD需求持续强劲,进一步验证了华尔街所高呼的“AI热潮仍然处于算力基础设施供不应求的早期建设阶段”。ChatGPT开发者OpenAI则坚决不服输,而这股AI应用浪潮则有望在谷歌与OpenAI竞争如火如荼之下强势向各行业迅速蔓延,势必也将带来全球AI算力需求踏向新一轮激增态势。为了紧急对抗谷歌的Gemini 3 ,OpenAI在公司内部拉响“红色警报”的背景之下刚刚推出了GPT-5.2。GPT-5.2是OpenAI迄今最先进的人工智能(AI)大模型,针对专业工作场景进行了全面优化,创多个基准测试的行业最强记录,其中的GPT-5.2 Thinking刷新了SWE编码能力测试的历史最高分,也是OpenAI首个性能达到或超过人类专家水平的模型。此外,GPT-5.2在创建电子表格、制作演示文稿、图像识别、代码编写和长文本理解等方面均优于前代产品,旨在“为人们创造更多经济价值”。在一些AI研究学者们聚焦的科学研究领域,GPT-5.2 Pro在GPQA Diamond测试中达到93.2%的准确率,GPT-5.2 Thinking紧随其后为92.4%。在专家级数学测试FrontierMath上,GPT-5.2 Thinking解决了40.3%的问题,创下前所未有的纪录。OpenAI称GPT-5.2 Pro和GPT-5.2 Thinking是“世界上最好的科学家助手模型”。