找到
878
篇与
互联网
相关的结果
- 第 42 页
-
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用 西风 雷刚 发自 凹非寺 量子位 | 公众号 QbitAI 今天开始,使用ChatGPT有了OpenAI官方浏览器ChatGPT Atlas——阿特拉斯(古希腊扛住地球的神)——作为OpenAI首款AI原生浏览器,正式对外发布。 能干啥?ChatGPT对话能力:每个标签页打开都能直接聊天对话; 浏览器上下文助手能力:浏览器内你正在看的文章页面,都可以直接提问,不用再复制粘贴,也不用交代上下文背景信息; 内置记忆能力:如果你启用了“浏览器记忆”功能,会记录你浏览过的关键内容、开始过的任务、你关注的话题;“Cursor Chat”功能:你可以选中文本,直接让ChatGPT编辑、润色改写,不用再切换;智能体能力:拥有Agent Mode,ChatGPT可以替你完成网页上的一系列操作。比如:深度研究、比较、填写表单、加入购物车、预订餐厅/机票等等。总之,ChatGPT当前已经有的能力,开始被端到端集成到浏览器中,接下来ChatGPT的功能,也应该会被集成到ChatGPT Atlas浏览器。这是OpenAI全新的入口,一个让用户不再经由谷歌Chrome、微软 Edge浏览器上网使用ChatGPT的流量入口 ChatGPT横空出世以来,搜索已经被重新定义。而现在,OpenAI官方下场,重新定义浏览器和上网入口。即日起,苹果Mac用户就可以先行下载使用。 OpenAI首款ChatGPT浏览器发布 作为首款浏览器,ChatGPT Atlas浏览器的发布没有更多预热,显得快速又富有针对性——原因我们后面说。OpenAI介绍,这是一款真正AI原生、AI驱动的浏览器,但依然基于谷歌开源的Chromium内核打造。而且不仅是一个浏览器,更像是一个“浏览+对话聊天+任务代理”一体化工具:你浏览网页的同时,ChatGPT 就在旁边可用,并且在一定条件下可替你“操作”网页。第一,每个标签页都整合了ChatGPT聊天对话。在传统浏览器中,你需要打开网页,打开跳转ChatGPT网站或开启新标签,才能开始聊天对话,但在Atlas浏览器,每个标签页旁、侧边栏都可以直接对当前网页内容提问或聊天。 比如你正在用浏览器打开了量子位的这篇文章,你可以更直接问“这篇文章的核心观点是什么?”……或者直接问“ChatGPT Atlas浏览器和其他浏览器的优劣?”。不用再复制粘贴网址或者想要问的内容了。第二是ChatGPT的助手能力。你正在看的内容,在开启登录和隐私允许的情况下,ChatGPT也在帮你看,当你要问的时候,他可以回答得更有针对性,也就是对你的专属性。你正在看旅游攻略和网站,ChatGPT大概就能上下文感知知道你可能需要“三亚7天行程”这种语境了……可以更精准帮你规划和生成,另外页面旁边有“Ask ChatGPT”侧栏,用户能够随时交互。第三是记忆能力被带到了浏览器。开启浏览器记忆之后, ChatGPT会记住你访问网站的背景信息,并在需要时调取这些信息。所以当你需要的时候,不用再交代背景信息和提示了,直接跟ChatGPT说——“找出我上周浏览的所有职位招聘信息,并总结行业趋势,帮我准备面试。” 但这就涉及最关键的用户浏览隐私了。所以OpenAI强调,Atlas中的浏览器记忆功能完全可选,可随时在设置中查看或归档记忆,清除浏览历史也会同步删除相关的浏览器记忆。第四是“Cursor Chat”功能,你可以选中文本,直接让ChatGPT编辑、润色改写。 在邮件回复、整理报告,或者一些信息改写上,效率更高了,也省得不同产品和应用之间切换。 反正OpenAI希望你再ChatGPT Atlas浏览器里完成所有上网时候要做的事情——甚至就只开它这一个就够了。第五则是Agent模式。该模式结合你的浏览上下文,速度更快、实用性更强,能更好地进行研究与分析、自动化任务,以及在你浏览时规划行程或预订预约。比如你给ChatGPT指令“我想办一个晚宴,帮我找菜谱并把所需食材放到购物车、直接下单送货”。Atlas的Agent Mode能尝试替你完成从研究到下单的整个流程。 这是Agent进程之下,OpenAI预留的大杀器。毕竟随着模型能力增强和各类Agent越来越多,OpenAI可以靠这个围绕浏览器建立起一个全新的Agent生态,就像谷歌Chrome做过的那样。Agent能力同样是OpenAI和ChatGPT Atlas的商业模式之一——因为目前Atlas的智能体模式目前面向付费用户Plus、Pro 和Business用户开放预览。值得注意的是,风险和隐私安全是ChatGPT Atlas浏览器发布后被关注和质疑最多的担忧。OpenAI也反复强调,从一开始就优先考虑了安全,并做了多重增强。 ChatGPT Atlas浏览器不能做什么? 无法在浏览器中运行代码、下载文件或安装扩展;无法访问您计算机上的其他应用或文件系统;在特定敏感网站(如金融机构)操作时会暂停以确保用户确认;可在退出登录模式状态使用智能体,限制其访问敏感数据及代操作的风险。另外,OpenAI还设置了家长控制模式。当然最后最重要的是,这个浏览器允许开启和关闭用户隐私息息相关的记忆能力和浏览历史记忆。可以无痕模式使用。OpenAI为什么此时发布浏览器?AI原生浏览器已经不令人模式,但对于OpenAI来说,为什么是现在。最直接的原因,自然是精准狙击谷歌因为各种爆料信息来看,Gemini 3的发布近在眼前,而Gemini 3的发布里,或许就会有对浏览器的重塑和整合。更深层次的是原因,是OpenAI对流量入口、搜索模式、广告商业变现的进一步强化。目前主流的信息检索、流量分发渠道仍被谷歌和Chrome主导,OpenAI如果想要分蛋糕,就需要有一个自己端到端主导的阵地。如果用户习惯从Atlas浏览器开启ChatGPT“对话式检索”、而不是传统输入关键词、点链接,谷歌的流量、广告分发模式就会开始受到根基动摇。OpenAI自然可以取而代之,或者建立自己在这个领域的商业模式。实际上,围绕浏览器+Agent的商业模式,已经开始了。这次付费订阅+Agent功能就是牛刀小试,后面可以进一步对齐苹果的应用生态和应用商店。而对于整个行业而言,OpenAI下场自研浏览器,意义也是不言自明的。在AI智能助手发展到现在,核心能力和边界正在逐步清晰,相应的产品和应用形态,也正在被进一步重塑。浏览器在被重塑。 传统浏览器主要是网页打开、渲染、标签管理、用户插件扩展的工具。但ChatGPT Atlas浏览器的发布,展现的是浏览器正在转型为“智能助手 + 任务自动化”平台。此外,AI能力从“被动推荐”向“主动执行”发展“Agent Mode”允许 AI 不仅回答问题,还能在浏览器中替用户执行任务(比如比价、购物、预订) ……这是一个趋势的印证,AI不只是“提供建议”,而是“代表用户做事情”。从工具到智能体 (assistant → agent) 的转变,也会改变诸多互联网行业的现有模式,诸如电商、旅游、金融服务、SaaS等等行业,都要重新思考“用户接口 +服务提供方式”。互联网正在进入一个全新的Agentic时代。Are you ready?官方链接:https://openai.com/index/introducing-chatgpt-atlas/ -
OpenAI推出AI浏览器ChatGPT Atlas,直接与谷歌竞争 OpenAI周二推出该公司首款由人工智能驱动的网页浏览器,媒体称,标志着这家ChatGPT的开发商在新战线上与Alphabet旗下的谷歌展开竞争,因为越来越多的网民开始依赖人工智能来获取信息。OpenAI将这款浏览器将命名为ChatGPT Atlas,旨在为用户提供更个性化的上网体验,同时还能代表用户执行任务,例如预订航班或编辑文档。公司表示,这款浏览器是围绕ChatGPT构建的,每当用户访问网页时,页面上都会出现“Ask ChatGPT”的选项,点击后即可在侧边栏与ChatGPT互动。比如,用户打开一篇电影评论,可以让ChatGPT帮忙总结内容;或者找到一个菜谱,再让ChatGPT帮忙在网上订购所需食材。OpenAI首席执行官Sam Altman在周二的直播活动中表示, “这是一个以ChatGPT为核心、由人工智能驱动的浏览器。” “我们认为,人工智能为重新思考浏览器的意义提供了一个十年一遇的机会。” “这是一款全方位优秀的浏览器——流畅、快速,而且用起来非常舒服。” OpenAI表示,Atlas现已在macOS上全球发布,随后将陆续推出Windows、iOS和Android版本。目前,只有付费用户(ChatGPT Plus与Pro订阅者)才能使用更高级的AI代理功能。OpenAI表示,目前已有超过8亿用户在使用ChatGPT,但其中许多人使用的是免费版本。OpenAI目前仍在亏损运营,正寻求实现盈利的新方式。媒体称,借助自家浏览器切入网络搜索入口,可能帮助OpenAI这家全球估值最高的初创公司吸引更多网络流量,并借此获得数字广告带来的收入。媒体表示,OpenAI由此加入了一批正在借助AI重新构想浏览器产品的公司队伍。这类产品最早可追溯至1990年代。AI初创公司Perplexity AI近期刚刚推出了Comet浏览器,其设计理念是充当数字助手,能够为用户自动完成任务。Opera和The Browser Company也都在为自家浏览器添加更多AI功能。ChatGPT进入侧边栏,内置AI代理 OpenAI负责Atlas项目的工程主管Ben Goodger在周二的直播中表示,ChatGPT是该公司首款浏览器的核心。用户在ChatGPT Atlas中可以与搜索结果进行对话,就像在Perplexity或Google的AI模式中一样。其他AI浏览器的“杀手级功能”是内置的侧边聊天面板(side panel)——聊天机器人会自动获取用户屏幕上的上下文信息。听起来似乎微不足道,但很多用户每天都在不断复制粘贴文字、拖拽文件或链接到ChatGPT中,以便提供背景信息。而这个侧边功能则消除了这些繁琐步骤,让使用体验更加顺畅。 OpenAI产品负责人Adam Fry在直播中表示,ChatGPT Atlas同样配备了这种“sidecar”功能。此外,Atlas还具备“浏览历史”功能,也就是说ChatGPT可以记录用户访问的网站及其操作内容,并据此提供更个性化的回答。 在Atlas中,每当你点击搜索结果的链接时,默认会显示分屏界面:左侧是网页,右侧是ChatGPT对话记录。这样设计的目的是让AI“助手”始终伴随在旁。用户也可以关闭分屏模式。员工在直播中还展示了浏览器的网页摘要功能,以及如何在邮件中选中一句话并点击按钮让ChatGPT即时润色的功能——这一特性被称为“光标聊天(cursor chat)”。 AI浏览器的另一个常见特点是内置AI代理(agent),旨在帮助用户自动完成网页上的任务。根据媒体的测试,早期版本的网页AI代理仍有待改进。虽然Perplexity的Comet和OpenAI的ChatGPT代理在执行简单任务时表现良好,但在处理用户真正想交给AI的复杂事务时仍显力不从心。正如外界预期,OpenAI的浏览器也配备了网页代理功能。用户可通过“agent模式”让ChatGPT在浏览器中代为完成一些小任务。公司表示,该功能在发布初期仅对ChatGPT Plus、Pro和Business级别的用户开放。Fry表示, “在Atlas中,ChatGPT现在可以替你执行操作……它能帮你预订餐厅或航班,甚至直接编辑你正在处理的文档。” 在OpenAI的DevDay大会上,ChatGPT主管Nick Turley在接受媒体采访时表示,他受到浏览器重新定义操作系统形态的启发。Turley指出,浏览器彻底改变了人们在线工作的方式,而他认为ChatGPT也是一种类似的革命性现象。正面挑战Chrome,谷歌股价应声下跌 至于OpenAI的浏览器能否撼动目前拥有全球超过30亿用户的Google Chrome,还不得而知。受这一消息影响,谷歌股价一度下跌达4.8%,跌幅随后有所收窄。 Chrome目前在全球拥有约30亿用户,媒体称,Chrome的巨大成功为OpenAI进入浏览器市场提供了潜在的范本。谷歌在2008年发布Chrome时,微软的Internet Explorer(IE)浏览器仍占据主导地位,当时几乎没人相信有新浏览器能构成实质性威胁。但Chrome很快凭借比IE更快的网页加载速度,以及其他优势,赢得了大量用户,从而颠覆了整个市场。微软最终放弃了IE,转而推出新的Edge浏览器,其运行方式与Chrome类似。今年9月,谷歌已将其Gemini AI模型整合至Chrome浏览器中。用户可通过该AI完成多项任务,包括解释所访问网页的内容、跨多个标签页提炼信息,甚至还可恢复此前关闭的网站,并计划在未来几个月内让Gemini能够代替用户处理“繁琐任务”,例如网上购物、预约或订餐等。不过,谷歌尚未公布确切的上线时间。谷歌的这一举动发生在美国一名法官驳回政府强制其出售Chrome的提议两周之后。在那场法庭听证会上,来自Perplexity和OpenAI的高管曾表示,如果谷歌被迫剥离Chrome,他们有意出手收购。 -
美国数据中心的“淘金时代” AI浪潮正将美国数据中心行业推向一场资本狂欢。资金、新玩家大量涌入,创新融资结构层出不穷,但繁荣表象下,利润预期与现实的巨大鸿沟、循环依赖的脆弱性以及新入局者的经验不足,正让这场淘金热积累系统性风险。10月20日,据科技媒体The Information报道,上周在拉斯维加斯举行的数据中心行业大会上,气氛与一年前截然不同。OpenAI、xAI和Meta承诺在未来十年投入数千亿美元,讨论焦点从"找地难、找电难"转向"谁能建成最多千兆瓦容量"的数据中心。BlackRock和MGX领衔的投资团体以创纪录的400亿美元收购了仅有12年历史的数据中心运营商Aligned Data Centers。报道称,但乐观情绪背后隐藏着现实挑战。以Oracle为例,其AI云业务过去五个季度的实际财务数据显示,当前租赁英伟达芯片的利润率与目标值相差15-20个百分点。业内人士私下表达谨慎,警惕"资金流过于循环"或"过度依赖单一公司"的交易结构。创新融资结构成为新常态 为支撑天文数字般的投资,行业正在发明各种创意融资方式。回租交易(Leaseback)成为新宠,xAI向其主要投资者Valor Equity Partners购买英伟达芯片后再租回使用。OpenAI也在与英伟达讨论类似结构——自己开发和监管数据中心,但通过回租降低成本,避免向Oracle和微软支付溢价。报道指出,这些交易的本质是风险分摊机制,在客户、供应商和融资方之间模糊界限,让资金持续流入数据中心建设。Aligned Data Centers的收购交易如同一针兴奋剂,激励着更多运营商寻找买家。同时,英伟达不仅是芯片供应商,还在深度介入融资环节——为芯片客户和数据中心项目提供融资,资金最终以芯片采购形式回流。业内人士担忧这种循环资金流是否在扭曲真实需求,英伟达既当裁判又当球员的角色是否会造成市场泡沫。不过OpenAI最近承诺使用AMD芯片和与Broadcom联合设计的芯片,显示出打破英伟达垄断的意图。AI公司跨界挑战行业规则 在这场数据中心的“淘金热”中,最令人瞩目的是角色错位现象。报道称,原本是AI编程创业公司的Poolside,现在宣称正在建造2千兆瓦数据中心,计划部分租赁给AI云服务商CoreWeave,并声称已破解行业最紧迫的瓶颈。Fermi等初创企业直接跳入多千兆瓦级项目,押注能在速度和性能上击败谷歌、微软等云计算巨头。这些缺乏传统数据中心开发经验的新入局者正在挑战行业既有规则。传统数据中心开发商对新玩家的能力越来越怀疑。微软高管曾对OpenAI表示,不认为Oracle能兑现其承诺的数千兆瓦容量。多位业内人士被新入局者招聘去"解决紧迫运营挑战"。许多人预测即将出现洗牌时刻,过于激进的项目将因延误、电力短缺或不切实际的时间表而崩溃。然而利润现实考验商业模式 不过,乐观情绪背后隐藏着现实挑战。Oracle在年度云大会上给出了乐观的收入和利润率预测,但过去五个季度的实际财务数据揭示了残酷真相——当前租赁英伟达芯片的利润率与目标值相差15-20个百分点。AI云服务商面临时间赛跑:必须提前购买昂贵的英伟达芯片,但客户只在项目完成并达到性能标准后才开始付费。电力供应、设备延误等不可控因素随时可能打乱计划。当供应商、客户、融资方的身份相互重叠,系统性风险便在积累。行业领袖私下警惕这种循环依赖的脆弱性。当微软选择让Oracle承担OpenAI的部分服务器需求时,这个行业最精明的玩家已经在用行动说话:要么是看淡长期需求,要么是不愿承担过高风险。分析指出,在这场淘金热中,英伟达稳坐"卖铲子"位置,传统云巨头有技术积累和风险承受能力,而新入局者面临最大不确定性。那些拥有真正技术能力、充足资金储备和风险管理经验的玩家,才能在退潮时依然屹立。 -
Claude生命科学版启动:AI性能媲美人类专家,获多家顶级药企背书 IT之家 10 月 21 日消息,科技媒体 NeoWin 昨日(10 月 20 日)发布博文,报道称 Anthropic 公司启动“Claude 生命科学版”(Claude for Life Sciences)计划,目标让其前言 AI 技术更深入地推向生物医学领域。IT之家援引博文介绍,该计划的核心是基于 Claude Sonnet 4.5 模型进一步改进,Anthropic 表示,新模型在生命科学领域的性能表现远超旧版,在一些关键基准测试中的表现甚至能媲美人类专家。此外,Claude 的一大特色是深度集成了生命科学领域广泛使用的关键研究工具,包括用于实验室数据管理的 Benchling、提供数百万篇生物医学文献访问的 PubMed、用于绘制科学图表的 BioRender 以及用于单细胞分析的 10x Genomics。为进一步展示实用性,Anthropic 还演示了其“Claude 技能”(Claude Skills)功能如何将可重复的科学流程转化为 AI 工作流。 例如,该公司创建了一项名为“single-cell-rna-qc”的新技能,可自动执行单细胞 RNA 测序数据的质量控制与筛选工作,从而提升研究效率。 为了帮助用户快速上手,Anthropic 还提供了一个生命科学专用的提示词库,覆盖文献综述、假说生成、实验方案起草、基因组数据分析和监管文件编写等常见用例。这项计划目前已获得多家大型制药和生物技术公司的积极响应。赛诺菲(Sanofi)、艾伯维(AbbVie)、10x Genomics 以及诺和诺德(Novo Nordisk)等合作伙伴已开始使用 Claude。 根据反馈,新工具不仅极大地缩短了临床文档处理时间,还让不具备专业背景的员工也能进行复杂的数据分析,降低了技术门槛。Claude 生命科学版现已通过 Claude.com 官网和 AWS Marketplace 提供服务,并计划很快登陆 Google Cloud Marketplace。同时,作为其“AI for Science”计划的一部分,Anthropic 还将为从事高影响力项目的研究人员提供免费的 API 积分,以支持前沿科学探索。 -
宇树发布 H2 仿生人形机器人;DeepSeek 开源新模型;微博 CEO 回应多名 KOL 被禁言|极客早知道 极客早知道10min read 宇树发布 H2 仿生人形机器人;DeepSeek 开源新模型;微博 CEO 回应多名 KOL 被禁言|极客早知道 张勇毅2025/10/21 摘要 宇树科技正式发布了其新一代仿生人形机器人 Unitree H2;DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为 3B。 宇树科技发布 H2 仿生人形机器人:身高 180cm、重 70kg,首次拥有拟人仿生脸 10 月 20 日消息,今日,宇树科技正式发布了其新一代仿生人形机器人 Unitree H2。 据官方介绍,Unitree H2 身高 180 厘米,体重 70 公斤,其整体外形设计更加贴近人类的真实形态,从外观上给人以更接近真人的视觉感受。IT 之家注意到,在官方发布的视频中,Unitree H2 还被穿上了衣服,进一步增强了其拟人化的外观效果。 这款机器人配备了 31 个关节,具体分布为肩部 6×2(双臂各 6 个)、躯干 3 个、腿部 7×2(双腿各 7 个),另含 2 个未知功能关节。相比宇树科技此前发布的 R1 机型的 26 个关节,关节数量提升 19%,灵活性显著增强。尽管官方尚未公布 Unitree H2 的具体配置细节,但从视频演示中可以明显看出,与前一代产品相比,Unitree H2 在灵活性和稳定性方面有了显著提升,能够轻松地完成舞蹈和武术展示,动作流畅自然,各个关节的活动也显得十分丝滑,展现出较高的运动性能和协调性。此外,Unitree H2 在 Unitree H1 的基础上增加了仿生人脸,这一改进使其在外观和功能上都更接近科幻电影中描绘的机器人形象。(来源:IT 之家)DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩 10 月 20 日消息,今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为 3B。 根据介绍,此次开源的 DeepSeek-OCR 由两个部分组成:核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M。DeepEncoder 专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉 token 数量在可管理的范围内。实验显示,当文本 token 数量不超过视觉 token 的 10 倍(压缩比低于 10×)时,模型的 OCR 精度可达 97%;即便压缩比提高到 20×,准确率仍保持约 60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR 同时具备较高的实际应用价值。在 OmniDocBench 测试中,DeepSeek-OCR 使用 100 个视觉 token 就超过了 GOT-OCR2.0(每页 256 个 token),而使用不到 800 个视觉 token 便优于 MinerU2.0(平均每页超过 6000 个 token)。在实际生产中,DeepSeek-OCR 可在单块 A100-40G 显卡上每天生成超过 20 万页的大语言模型 / 视觉语言模型训练数据。 微博 CEO 王高飞回应多名 KOL 用户被禁言,称应该是经历多个流程环节才禁言的 90 天 10 月 20 日消息,新浪微博社区管理官方微博今日发布公告,称近期专项行动针对恶意抹黑诋毁企业、散布涉企虚假信息、集纳企业负面、引导并煽动用户攻击企业等行为进行重点打击,并责令对存在相关违规行为的多名汽车领域 KOL 用户予以禁言 90 天、禁止广告收益 180 天处置。微博 CEO 王高飞今日转发了新浪微博社区管理官方微博的公告,并回应称发出来也是希望大家知道,发这些尺度的跟酒驾一样,可能你酒驾好几次都没被查,但是有一天碰上就是行拘。 (来源:IT 之家)Anthropic 推出面向生命科学领域的 Claude≈人工智能系统 Anthropic 公司近日发布了「Claude 生命科学版」,旨在推动人工智能在生物技术领域中的应用。近期,包括 OpenAI 和 xAI 在内的一些 AI 公司因扩展业务到包括情感陪伴和成人内容等领域而陷入争议,而 Google 和 Anthropic 则展示了人工智能在科学研究和医疗健康方向上的更集中的努力。此前,Google 利用 AI 模型帮助科学家发现了癌症治疗的创新方法。据 Anthropic 介绍,最新的 Claude Sonnet 4.5 模型在生命科学领域的表现远胜以往版本,并且在关键测试标准上已能媲美人类专家。Claude 还深度集成了多种生命科学研究常用工具,包括 Benchling 实验室数据管理、PubMed 生物医学文献检索、BioRender 科学图表绘制和 10x Genomics 单细胞分析系统。Anthropic 还展示了其新发布的 Claude Skills 功能如何将可重复的科学流程转化为 AI 自动化工作流。比如,公司开发了一个用于单细胞 RNA 测序数据自动质量控制的新技能,可显著提升数据处理效率。 为帮助用户快速上手,Anthropic 还推出了针对生命科学领域的提示库,覆盖文献综述、假设生成、实验流程起草、基因组数据分析和法规文件准备等常见场景。此外,Anthropic 已与多家大型制药及生物技术公司如 Sanofi、AbbVie、10x Genomics 和 Novo Nordisk 开展合作,这些公司反馈使用 Claude 后,临床文档编制时间大幅缩短,且普通研究人员也能更容易访问复杂数据分析结果。目前,Claude 生命科学版已可通过 Claude 和 AWS Marketplace 获得,未来还将支持 Google Cloud Marketplace。作为「AI 助力科学」计划的一部分,Anthropic 还为高影响力项目的研究人员提供免费 API 使用额度。来源:(CnBeta) 苹果确认未来将在中国大陆推出 eSIM 快速转换功能,国行 iPhone Air 换机无须再跑营业厅 10 月 20 日消息,苹果无线软件技术与生态系统副总裁 Arun Mathias 及无线技术团队的 Anjali Jotwani 在接受「爱范儿」采访时,透露未来苹果将会在中国大陆推出 eSIM 快速转换功能(eSIM Quick Transfer),国行 iPhone Air 用户在设备端激活 eSIM 后,后续切换设备可以通过该功能把 eSIM 换到新设备上,无需再跑一趟营业厅。 IT 之家注意到,此前消息显示国行 iPhone Air 在海外开通 eSIM 后「回国之后也能够正常使用」,不过相应版本机型仅提供双 eSIM 卡(包括内地和海外运营商),因此对于手持多张 SIM 卡的用户来说不算友好,作为比较,海外机型可开通 8 张以上 eSIM 卡。(来源:IT 之家)国航公布「机舱锂电池自燃」事件赔偿方案:经济舱各旅客 200 元、公务舱 300 元 10 月 20 日消息,中国国际航空 10 月 18 日由杭州飞往仁川的 CA139 航班行李架突发起火,致客舱行李架起火并冒出浓烟,该航班随后紧急备降上海浦东,该公司回应称是一名旅客存放在行李架上手提行李内锂电池自燃,未出现人员受伤。 据新京报 10 月 19 日消息,中国国际航空公司将分别补偿经济舱和公务舱旅客现金 200 元和 300 元。根据民航局 2025 年 6 月 26 日发布的公告,自 6 月 28 日起禁止旅客携带没有 3C 标识、3C 标识不清晰、被召回型号或批次的充电宝乘坐境内航班。今年以来,旅客携带的充电宝等锂电池产品机上起火冒烟事件多发。近期多个头部品牌充电宝厂家因电芯存在安全风险对多批次产品实施召回,国家市场监管总局撤销或暂停了多个充电宝及电池芯厂家 3C 认证。民航局通知要求各航空公司、机场加强旅客服务人员培训管理,确保员工熟悉掌握充电宝安全风险及政策,以便能够准确、有效地回应旅客问询。同时,各单位要按要求进一步完善锂电池起火、冒烟等紧急情况下的应急处置预案,增强员工情景意识、应急反应能力和协同配合能力,确保在发生紧急情况时能够及时、妥善处置。来源:CnBeta) 华为 Mate 80 系列标准版?爆料称新机备案 11 月,还有二合一平板电脑 10 月 20 日消息,博主 @ 数码闲聊站 今日爆料了一款代号 Voyager 的新机,目前看有黑 / 白 / 青绿,M80 全系备案 11 月,并猜测可能是华为 Mate 80 系列标准版。爆料还称,同期备案有一个「二合一平板电脑」,代号 Qianxuesen,目前有皓月银 / 深空灰,打通鸿蒙多端生态融合的新设备,目前也备案 11 月。 该博主还在上周末爆料了华为 Mate 80 Pro 系列样机备案颜色:AL00 系列包含黑、白、金、青四种配色,AL10 系列则是黑、白、金、紫、青、银六种配色。此外,该机型还提供素皮保护壳 + 磁吸支架保护壳,将支持磁吸生态。 该博主还曾爆料称,新机预计 11 月前后正式发布。据爆料,华为 Mate 80 系列将包括两个主要版本,分别为代号 Voyager 和 Sagittarius 的标准版和 Pro 版,这两个版本在充电配置上有所区别:标准版将配备 66W 有线充电技术,Pro 系列将采用 100W 有线充电技术。(来源:IT 之家)iOS 26.1 Beta 4 发布 允许用户使用新开关控制液体玻璃透明度 苹果在最新推送的 iOS 26.1、iPadOS 26.1 及 macOS 26.1 第四测试版中,针对系统个性化体验带来了多项备受关注的新功能。首先,系统设置中新增了「Liquid Glass 透明度调节」开关。用户可在 iPhone 或 iPad 的「设置-显示与亮度」以及 Mac 的「系统设置-外观」中找到并自定义 Liquid Glass 的效果。该开关允许选择更透明的「清晰」风格,体验原有设计,或启用更高对比度、更明显遮挡的「加深」风格,让按钮、菜单等系统元素更加突出。调节内容覆盖操作系统各处,包含 App 内及锁屏通知,进一步完善视觉一致性,对强调易读性及美观有直接帮助。 此外,苹果还响应广大用户呼声,首次允许关闭「锁屏左滑唤起相机」功能。在 iOS 26.1 Beta 4 的「设置-相机」分区,新增了「锁屏滑动打开相机」开关。关闭后,即可彻底禁用锁屏左滑唤出的相机,避免因误操作或手机被他人拿到时随意拍照,兼顾个人隐私与安全。这一功能此前无法单独关闭,只能通过彻底禁用相机应用实现,现更易用且人性化。除上述亮点外,本次测试版还加入了多语言 Apple Intelligence 助手、新的闹钟与计时器「滑动停止」机制、新的 Apple TV 应用图标,以及 Settings 应用界面优化等众多细节变化。消息称小度 AI 眼镜将在 11 月百度世界 2025 大会正式推出,计划年内开售 10 月 20 日消息,据《科创板日报》报道,百度旗下的小度 AI 眼镜将在 11 月举行百度世界 2025 大会上正式推出,计划于今年年内开售。 IT 之家注意到,在去年 11 月举行的 2024 百度世界大会上,百度发布了小度 AI 眼镜,称该产品为「全球首款搭载中文大模型的原生 AI 眼镜」。据介绍,小度 AI 眼镜具备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。消息称小度 AI 眼镜将在 11 月百度世界 2025 大会正式推出,计划年内开售具体配置方面,该眼镜:重量 45 克,搭载 16MP 超广角摄像头,支持 AI 防抖算法;标称待机续航 56 小时,支持超 5 小时连续聆听,可 30 分钟充满电;搭载四麦克风阵列识别声音,采用开放式防漏音扬声器设计。(来源:IT 之家) 6 个主流 AI 大模型进行加密交易竞赛,DeepSeek 和 Grok 收益率稳居前两位 10 月 20 日,专注于金融市场的人工智能研究实验室 nof1 于 18 日开始一项大模型交易测试 Alpha Arena。该测试使用 6 个主流 AI 大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在 Hyperliquid 上获得 10,000 美元的真实资金,并具有相同的提示和输入数据。 截止发稿,DeepSeek 和 Grok 收益率均超 14%,排名前二,Gemini 2.5 Pro 则已亏损 42.57%。(来源:Blockbeats)宇树机器人微博编辑eSIM -
OpenAI打击Sora 2深度伪造视频,与演员工会合作加强监管 据CNBC,OpenAI宣布将与演员布莱恩·克兰斯顿、美国演员工会(SAG-AFTRA)及其他演员工会合作,防止其人工智能视频创作应用程序Sora出现深度伪造现象。9月底Sora 2发布后,出现了未经授权的人工智能生成的使用布莱恩·克兰斯顿声音和肖像的剪辑,克兰斯顿对此表示担忧。他希望OpenAI尊重演员管理声音和肖像复制的个人和职业权利。OpenAI将与美国演员工会、广播电视艺人联合工会(SAG-AFTRA)以及代表克兰斯顿的联合人才经纪公司(United Talent Agency)等合作,加强对未经批准的人工智能生成内容的监管。此前,应马丁·路德·金遗产管理委员会的要求,OpenAI曾在Sora上屏蔽马丁·路德·金的视频,因为用户制作了对他的“不敬描述”。自9月30日Sora 2发布以来,OpenAI对版权限制和其他与肖像权相关问题的处理方式已发生变化。10月3日,首席执行官Sam Altman更新了Sora的退出政策,允许版权所有者对角色的生成进行更精细的控制。OpenAI重申了对《禁止假冒法案》的支持,该法案旨在防止未经授权的人工智能生成的人类声音或视觉肖像的复制品。 -
百度、阿里即将入局 AI眼镜“大战”升级 《科创板日报》10月21日讯(记者 黄心怡)多家AI眼镜厂商将于近期发布新品。雷鸟眼镜将在10月23日发布全球首款支持HDR的智能观影眼镜产品。10月16日,影目科技发布了新一代AI智能眼镜INMO GO3,并宣布与腾讯、蚂蚁集团、智谱AI等共建AI+AR原生内容生态。定于在年内发布的阿里夸克AI 眼镜,则流传出了电商预售界面的截图。《科创板日报》独家获悉,目前夸克AI眼镜正在加快量产爬坡中,但具体发售时间未定。《科创板日报》还独家获悉,百度旗下的小度AI眼镜计划于今年年内开售。在2024百度世界大会上,小度AI眼镜曾首度亮相。IDC数据显示,2025上半年,中国智能眼镜厂商出货量突破100万台,同比增长64.2%,占据全球26.6%的市场份额。在AI技术驱动与行业需求双重加持下,下半年开始国内厂商格局将迎来重大变化。以字节、阿里、百度、魅族为代表的多家厂商,将陆续推出以AI功能为主打的音频与音频拍摄眼镜产品,市场竞争进一步加剧。▍阿里、百度AI眼镜发布在即 Meta 和雷朋联合推出的 Ray-Ban Meta ,让众多厂商看到 AI眼镜市场的巨大潜力。今年2月,该款眼镜的销量已经突破200万台。据媒体报道,雷朋还计划与Meta合作,到 2026 年底将年产能提升至一千万台。IDC中国分析师叶青清认为,Meta的案例明确了智能眼镜目前比较具有可行性的商业化落地路径,没有追求超前的技术堆叠而是减少功能和重量,聚焦用户实际痛点打造产品。其次Meta和雷朋、Oakly等传统眼睛品牌的合作也印证了轻量化和时尚化的重要性,不仅是打开大众市场、完成用户教育的关键步骤,也将智能眼镜从科技产品往日常穿戴品转型,从而释放出更大的市场增长空间。在这股AI眼镜浪潮的引领下,小米、阿里、百度、魅族等纷纷入局智能眼镜赛道。其中,阿里旗下的夸克AI 眼镜计划在年内正式发布,将重点整合阿里的AI能力与生态协同。比如,夸克AI眼镜将深度融合阿里及支付宝生态,具备通义千问大模型和夸克AI能力,还支持高德导航、支付宝看一下支付、淘宝比价、飞猪商旅提醒等。以导航场景为例,研发团队联合高德地图开发了适配AI眼镜的近眼显示导航系统,可在骑行、步行等移动场景下进行指引。此前,夸克AI眼镜曾流出了天猫预售界面截图。根据页面显示,阿里夸克AI智能眼镜将开启9.9元的预约活动,预约用户可以享受价值99元的可更换电池等权益。 《科创板日报》从知情人士处独家获悉,目前夸克AI眼镜抓紧量产爬坡中,具体发售时间还没有最终确定。10月初,夸克AI眼镜已进行了一波营销预热,包括邀请了何超莲成为夸克AI智能眼镜的产品内测官,佩戴夸克AI眼镜亮相巴黎时装周,用于秀场拍摄。夸克AI眼镜还亮相了澳门举行的NBA中国赛,球员在NBA赛前进行了体验。《科创板日报》还独家获悉,百度旗下的小度AI眼镜计划于今年年内开售。在2024百度世界大会上,小度AI眼镜曾首度亮相,据当时官方介绍,小度AI眼镜具备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。此外,字节跳动也在探索AI眼镜的研发。字节相关负责人今年8月曾回应称,AI眼镜相关产品处在早期探索阶段,目前暂无发布计划。▍核心元器件产能受限根据IDC最新数据,今年中国智能眼镜市场全年出货预计达到284.6万台,同比增长116.4%。叶青清认为,在AI技术赋能、供应链优化、光学方案发展以及巨头入局引领生态构建的共同驱动下,行业将进入快速发展阶段。预计随着下半年更多厂商加入竞争,行业竞争格局也将迎来新一轮重塑。作为新兴产品,AI眼镜的供应链与产能仍面临挑战。多家新兴AI眼镜厂商都曾面临交付困境。比如,Rokid Glasses Rokid Glasses 于去年底发布,但直到今年6月才开启首批交付。影目科技也在今年6月对发货的延迟发布道歉声明。据悉,Rokid Glasses在正式发售后,迄今已获得超过30万台全球预售订单。有知情人士向《科创板日报》记者表示,Rokid Glasses产能面临挺多瓶颈,有较大的生产和交付压力。叶青清表示,目前AI眼镜在供应链方面,一方面核心元器件产能受限无法满足市场需求,而组件无法规模化量产也导致了产品侧的供应不足。“另一方面是AI眼镜的生产工艺要求高,在轻量化结构中实现精密组装使得良率难以保证,显著推高了生产成本;同时在市场快速扩张的背景下,供应链需要同时应对技术迭代与规模爬升的双重压力,对供应链的调配和快速适应能力提出极高要求。” -
Waymo自动驾驶出租车绕行停靠校车,美国监管机构展开调查 IT之家 10 月 21 日消息,近日,一辆 Waymo 自动驾驶出租车(robotaxi)被发现从一辆正在停靠、红灯闪烁的校车前方驶过,对此美国联邦安全监管机构已展开调查。 美国国家公路交通安全管理局(NHTSA)于周一上午宣布,其缺陷调查办公室(ODI)已就此事件启动正式调查。起因是今年 10 月初在佐治亚州亚特兰大市拍摄到的一段视频显示,一辆 Waymo 无人驾驶车辆在一名校车司机正在接送学生时,绕过该辆已停靠并亮起红色警示灯的校车。根据 ODI 发布的一份文件,此次调查将重点评估 Waymo 自动驾驶系统在校车完全停靠情况下的响应表现,审查其软件设计是否符合与校车相关的交通法规要求,并进一步分析系统的决策逻辑。NHTSA 在声明中指出,基于目前与 Waymo 的沟通情况,“此前发生类似事件的可能性较高”。事发时,涉事的 Waymo 自动驾驶汽车从校车右侧横向穿越至其前方,随后向左绕过校车车头继续行驶。对此,Waymo 解释称,该辆校车当时部分占用了自动驾驶汽车所要驶出的车道入口,导致车辆无法看到校车上的闪烁红灯或伸出的停车标志牌。该公司未立即回应关于车辆传感器是否能探测到下车的学生或校车控制臂的问题。“安全始终是我们最高优先事项。我们在美国一些驾驶环境最复杂的城市每周完成数十万次全自动驾驶载客服务。”Waymo 在一份声明中表示,“数据显示,我们的车辆事故发生率低于人类驾驶车辆。NHTSA 在道路安全领域发挥着关键作用,我们将持续与其合作,致力于成为全球最值得信赖的驾驶员。”Waymo 还于周一表示,公司已向其车队推送了软件更新,以提升系统在类似场景中的识别和应对能力。2025 年是 Waymo 快速扩张的一年。该公司已在亚特兰大正式推出服务,进入奥斯汀市场,在整个硅谷地区扩大运营范围,并正在包括纽约市在内的多个都市区进行测试。此外,Waymo 还在圣何塞和旧金山机场开展试运行,并计划在未来几年内拓展至更多城市,目标覆盖范围预计将在 2026 年进一步扩大。据IT之家了解,这并非 NHTSA 首次对 Waymo 自动驾驶汽车发起调查。2023 年,NHTSA 曾就多起报告展开调查,指 Waymo 车辆在低速情况下难以应对道路上的栏杆、链条等障碍物,最终促使该公司在今年 5 月实施召回,并通过软件更新予以修复。去年,该机构还针对 Waymo 车辆误入逆行车道或擅自进入施工区域的多起案例启动专项调查。 -
狂奔20天,全网“追赶”Sora2 定焦One(dingjiaoone)原创作者 | 陈丹编辑 | 魏佳Sora2的发布,再次搅动了全球人工智能行业的神经。9月30日,OpenAI正式推出其视频生成模型的重大升级版本——Sora2,以及基于该模型的社交应用Sora App。与前一代相比,Sora2在物理模拟的精确度、画面逼真度和生成可控性上显著提升,并实现了音频与人物对话的同步生成。这不仅让AI视频更“像真的”,也让视频生产“像写字”一样简单。短短五天,Sora App下载量便突破百万次;应用分析机构App Figures数据显示,其首周iOS下载量达62.7万次,高于ChatGPT首周的60.6万次。尽管Sora App仍处“仅限邀请”阶段,但它的下载量增速超过了当年的ChatGPT。有观点称其为AI版的“TikTok”,被寄望成为下一个全球现象级应用。在国内,Sora2同样掀起热潮。国庆期间,OpenAI CEO萨姆·奥特曼成为社交媒体上流量担当。他开放了个人肖像权,点燃了网友们的创作热情,其数字分身从商店偷GPU被抓包、与李小龙对打。这些病毒式传播的短视频,也加速了Sora2的出圈。除了用户端,Sora2的发布也让行业按下了加速键。大厂加速产品迭代,10月15日,百度宣布旗下视频生成模型百度蒸汽机再次升级,支持AI长视频实时交互生成;次日,谷歌发布视频模型Veo3.1与Veo3.1Fast,主打更丰富的音频、更强的叙事控制和真实感。与此同时,创业团队也在全力冲刺。多位AI视频的创业者向「定焦One」透露,他们最近一直在加班,两位创业者甚至只有在深夜才有时间接通电话。如今,公众热度已趋平稳,但在AI行业内部,一场静悄悄的技术竞赛,正在全速展开。 追赶Sora2的人 仿佛一声发令枪,Sora2让AI视频领域进入“超级加速”阶段。国庆假期刚过,社交媒体上便传出消息:快手AI团队假期8天无休,全力追赶Sora2的技术进度。主攻AIGC创作的纪录片、广告片导演丁一向「定焦One」透露,据他了解到的情况,几乎所有国内AI视频创业团队都已进入“全员加班”状态。他预测,不出两个月,国产版Sora2类产品可能就会出现,“所有的大厂、模型厂商都卷起来了”。好耶科技创始人吴杰茜也证实了这种紧迫氛围,其团队同样连轴工作,对Sora2进行测试、拆解。她的创业项目FilmAction是一个AI电影生成平台,与Sora2在功能上有不少重叠。Sora2的横空出世,让她既兴奋又有压力——兴奋于技术的天花板被再次抬高,焦虑于行业的迭代速度超出了所有人的想象。Sora2发布仅半个月后,谷歌于10月16日推出Veo3.1与Veo3.1Fast,被普遍解读为正面迎战OpenAI的举措。同一天,OpenAI也宣布Sora2两项升级:Pro用户现可通过网页端使用“故事板”功能,同时全平台视频生成时长获得提升。普通用户可在App及网页生成15秒视频,Pro用户网页端更支持生成25秒内容,较此前标准版10秒、Pro版15秒的设定显著延长。 图源 / pexels “这像极了ChatGPT刚出现时的那一刻,”吴杰茜说,“所有人都在拼命追赶。”综合多位从业者的说法,Sora2的震撼来自于三个层面的技术突破:首先,是物理世界的拟真突破。Sora2能精准模拟水流、光影、重力与碰撞效果,甚至处理浮力与重心转移等复杂物理场景,极大提升了人物动作的连贯性与主体稳定性。其次,是多模态融合。Sora2可直接生成同步音频,自动匹配环境声、动作音效与多语言对白。在此之前,只有少数几个软件有此功能,但音质差不说,人物的语音和口型往往也不匹配。丁一团队还试着用不同的方言对Sora2进行测试,口音自然,口型精准,足见其技术成熟度。Sora2真正的颠覆,并非仅是生成视频的“以假乱真”,而在于它理解了“镜头语言”。吴杰茜的测试印证了这一点:她将小说或剧本原文直接输入Sora2,生成的视频不仅画面与文本高度契合,其镜头运用、节奏把控等视听语言,更是达到了专业创作者的水准。要知道,在Sora2出现之前,AI视频创作始终受制于“镜头思维缺失”。过去,创作者需先手动拆解剧本,反复琢磨镜头衔接逻辑、人物视角选择、场景转换方式,耗费大量时间。市面上多数AI工具也只能生成单个简单镜头,若想串联成连续叙事,还需用户具备专业的视听语言知识与分镜设计能力,门槛并不低。Sora2打破了这一局限:用户只需一句话的文本指令,它便能自动生成包含多镜头切换、剧情连贯推进的完整视频。换句话说,Sora2不再是单纯的“画面生成工具”,而是初步具备了导演的叙事逻辑与剪辑师的镜头调度能力。“如果把Sora2比作一位剪辑师,那么他的能力已经超越了市场上95%的人。”在丁一看来,其他AI视频软件目前还只是辅助工具,但Sora2一定程度上已经具备“智能体”的雏形。 创作门槛坍塌:AI正在重写“专业” 但技术狂奔的另一面,是行业秩序的松动。当AI视频进入“后Sora时代”,最先感到震动的,往往是那些曾依靠专业壁垒生存的人。“既兴奋又焦虑。”丁一如此总结Sora2发布二十天来的心情。他的团队是首批测试用户,结果Sora2几乎立刻改变了他们的工作方式。在现在丁一团队的工作流程中,Sora2已经深度嵌入,承担了很多前期的筹备工作,比如说分镜头的设计。注册四五个账号,可以快速的生成大量方案,并从中抽取最满意者。效率比人工快太多,而且质量也不差,包括视频概念、气氛、镜头运动方式这些因素都在其中。Sora2一句话便能生成15秒成片,这意味着他们团队平时接的一些便宜的商单,基本上没有了技术门槛。他告诉「定焦One」,目前Youtube上的一些小推流广告,已经在使用Sora2生成。另一位创作者等登等噔(以下简称“等登”)也受到了震动。 图源 / pexels 在最新的一支短片中,他用Sora2完成几个分镜头的构思:先上传参考图片,再用文字描述故事背景与情节,Sora2便能自动生成包含3-4个分镜头的视频,完整呈现剧情。而且据他测算,平均操作3次就能得到符合预期的版本,“抽卡率”远高于其他软件。技术进步带来的创作便捷性让他感叹不已,但兴奋过后,等登心中也有一丝不安:分镜设计曾是专业创作者与普通用户的分水岭,但Sora2正在抹平这个门槛。等登告诉「定焦One」,在Sora2出现之前,还没有哪个软件是支持分镜头自动生成,部分软件可以做到一些简单的分镜头,但还是需要使用者明确的提示词,比如第一个镜头是什么、第二个镜头是什么,然后它会在十秒内给出一个分镜头的组合。Sora2可以直接生成一个动态视频。比如有网友将归有光的《项脊轩志》最后一句输给Sora2,生成的视频第一个镜头是归有光和枇杷树的特写,第二个镜头是归有光与妻子种植枇杷树的回忆,回忆镜头与归有光睹树思人的镜头来回切换。在这个视频里机位、角度以及镜头的切换AI都已经设计好了。在AI时代,由于技术进步,带来的专业壁垒的消解,可能是很多人都需要面对的课题。AI导演、AI分镜师等新职业原本是AIGC带来的新红利,但随着Sora2具备“理解剧本”的能力,这些岗位或许也会被再次淘汰。丁一对此感触尤深。他入行时也是一名分镜师,后来进入导演组、成为执行导演,最终一步步做到导演。过去只要精通一项工具——哪怕是Photoshop,就能找到工作。而现在,纯技术岗位的空间越来越小。今年早些时候,他拍的一个实验性质短片试图找过一些分镜师,但最后只能不了了之,因为“效率太慢了、沟通成本也很高”。焦虑之后,他也开始调整心态。最起码从现阶段来看,AI生成的内容最终成果还是需要人的把关,个人的经验、审美、判断都会对最终的结果产生影响。丁一相信,未来人类的工具就是交互式的AI,就像现在的笔和键盘一样,但最终比拼的仍旧是内容和创意。英伟达CEO黄仁勋曾对媒体说:“如果世界没有新的创意,AI的生产力提升终将转化为失业。”在Sora2带来的剧烈震荡中,这句话显得格外应景。 从“技术奇观”到现实考题 在AI应用层出不穷的时代,爆红与冷却往往只隔几天。很多人也在观望,Sora2是否只是“昙花一现”。从热度来看,Sora2的确已经降温。微信指数和百度指数显示,Sora2在国内热度高峰仅维持数日后迅速回落。等登认为,一方面国内用户无法直接访问Sora2,另一方面清晰度与水印限制也让创作者难以商用,从而削弱了话题度。 Sora2近30天微信指数走势截图 吴杰茜则指出,作为新闻事件,它注定会降温;但作为新的创作工具,它的普及才刚开始。从前景上看,东莞证券的研报也佐证了这一观点,认为Sora2及其配套社交应用的发布,标志着AI视频生成与社交互动进入融合阶段,“有望重塑内容创作和分发生态,或迎来AI视频生成的ChatGPT时刻。”回顾语言模型的发展史,ChatGPT的出现是AI从实验室走向大众的决定性转折点。从这个意义上讲,Sora2也标志着视频生成领域的一个关键拐点——即从技术尝鲜迈向普遍应用。但类似Sora2这样的产品要想成为全民表达的工具,需要克服的不仅仅是技术难题。首先是版权的迷雾。Sora2初期采取的“选择退出(Opt-out)”机制,默认可以使用互联网公开内容训练模型,将维权举证责任推给版权方。这种做法迅速招致了好莱坞经纪公司、美国电影协会乃至日本政府的强烈抵制和法律威胁。面对集体施压,OpenAI迅速调整了策略,奥特曼宣布放弃Opt-out,转而采用更审慎的“主动同意(Opt-in)”模式,即需版权方签署明确授权协议才能使用其IP。奥特曼还建议引入IP分成收益机制,与授权方共享平台收入。有律师认为,OpenAI的这一机制将矛盾从法律博弈转向商业合作。尽管仍有局限,但它预示AI行业正迈向付费许可与生态共建的新阶段。一位好莱坞制片人的评论颇具代表性:“未来的影视公司,其运营模式可能更趋近于版权管理机构,而非传统的内容制造者——这一趋势几乎无可避免。”其次是变现模式的拷问。目前Sora2的主要使用场景仍以娱乐为主,如生成趣味视频或表情包。这类低价值、高频交互难以支撑庞大的模型训练与运维成本。未来,专业用户或高质量内容创作者的“付费模式”或将成为主流。如何在广告变现与用户体验之间取得平衡,仍是所有AI视频厂商的共同考题。这些现实的疑问和战略调整,勾勒出AI视频行业从“野蛮生长”转向“理性发展”的轨迹。用丁一的话说,随着Sora2的出现,全球AI视频赛道正迈向更高维的竞争阶段。各家模型厂商“卷”得更深,训练数据涵盖影视、动漫、广告、纪录片等多种素材,“AI正在学习全人类的影像史”,而当技术卷到极致,拼的将不再是算法,而是创意与落地能力。”Sora2发布二十天后,世界或许并未立刻改变。但在每个AI视频创作者的电脑上,故事的生成方式,已经悄然不同。*题图来源于pexels。 -
速腾聚创创始人邱纯鑫:多传感器融合方案是自动驾驶更优路径 IT之家 10 月 20 日消息,据 BusinessInsider 报道,中国激光雷达制造商速腾聚创(RoboSense)创始人邱纯鑫表示,相较于特斯拉首席执行官埃隆・马斯克所推崇的纯视觉自动驾驶系统,多传感器融合方案是更优且更安全的自动驾驶车辆技术路径。 据IT之家了解,激光雷达(LiDAR,即“光探测与测距”)是一种通过发射激光束并测量其反射信号返回时间来扫描周围环境的传感器。目前,Waymo 的无人驾驶出租车、扫地机器人乃至智能手机摄像头等消费类产品中均可见到激光雷达的应用。邱纯鑫在 9 月于新加坡举行的“未来中国全球论坛”(FutureChina Global Forum)期间接受 Business Insider 采访时表示:“在过去大约十年里,关于自动驾驶汽车应采用纯视觉系统还是多传感器融合系统,业界一直存在激烈争论。”“但时至今日,大家已经达成共识:纯视觉方案的安全性不足。许多极端场景(corner cases)是纯视觉系统无法有效应对的。”他补充道。邱纯鑫指出,仅依靠纯视觉系统,车辆无法实现 L3 或 L4 级别的自动驾驶能力。要达到这些高阶自动驾驶水平,必须引入包括激光雷达在内的其他传感器进行协同感知。国际汽车工程师学会(SAE International)将自动驾驶系统划分为 1 至 5 级。其中,1 级系统仅能提供基本辅助功能,如自动刹车和车道保持;而 5 级则可在所有条件下实现完全自动驾驶。目前,特斯拉的“全自动驾驶”(Full Self-Driving)软件仍需驾驶员全程监督,属于 2 级系统。“假设你在高速公路上行驶,前方突然停着一辆白色汽车。对纯视觉系统而言,很难判断那是一辆车还是一片天空中的白云。”邱纯鑫举例说明。“同样地,当你驶向隧道入口时,系统可能无法准确识别前方是否有一辆黑色车辆正在行驶。”他进一步解释道。市场研究机构 Yole Group 在今年 3 月发布的一份报告中指出,成立于 2014 年的速腾聚创,在 2024 年已占据全球乘用车激光雷达系统最大的市场份额。马斯克长期以来一直对激光雷达技术持批评态度,最近一次表态出现在今年 8 月。早在 2019 年 4 月特斯拉举办的“自动驾驶日”(Autonomy Day)活动上,他就曾断言,汽车制造商最终将放弃在其自动驾驶车辆上使用激光雷达。“我想强调的是,我并非真的那么讨厌激光雷达 —— 尽管听起来好像是这样,”马斯克说,并透露 SpaceX 的“龙”飞船正是依靠激光雷达实现国际空间站的导航与对接。“但在汽车领域,它简直是愚蠢透顶。又贵又没必要,”他继续说道,“一旦你把视觉问题解决了,激光雷达就毫无价值。这意味着你在车上装了一套昂贵却无用的硬件。”对此,邱纯鑫回应称,近年来激光雷达的成本已大幅下降,从每辆车约 7 万美元降至如今的几百美元左右。与此同时,随着成本降低,激光雷达的性能也在持续提升。值得注意的是,马斯克的观点在汽车行业高管中似乎属于少数派。福特公司 CEO 吉姆・法利(Jim Farley)在今年 6 月的阿斯彭思想节(Aspen Ideas Festival)上表示,福特公司认为激光雷达“至关重要”。“例如,当阳光直射摄像头造成眩光,或者卡车尾部产生反光导致摄像头完全失灵时,激光雷达系统依然能够清晰成像。”法利说。中国造车新势力理想汽车 CEO 李想去年在其公司举办的“AI Talk”活动中也表示,马斯克之所以看不到激光雷达的价值,是因为中美两国交通环境存在巨大差异。“如果你在中国夜间驾车,经常会看到尾灯损坏甚至完全没有尾灯的货车直接停在路上,”他说,“现有的摄像头系统很难在远距离发现这类车辆。”“我相信,如果马斯克亲自在中国深夜行驶于各条高速公路上,他也会选择配备激光雷达。”李想补充道。 -
上海构建AI“创新雨林”,一杯咖啡的偶遇引发“核爆点” 上海西岸,意在“培育雨林” 90后曾书霖,AI(人工智能)大模型民企无问芯穹的创始团队成员,兼任上海创智学院产业导师。近来他频繁往返于徐汇西岸模速空间与华泾北杨人工智能创新小镇,率队攻坚“智能终端”前沿领域。西岸,上海最早集聚人工智能企业与产业的区域之一。2020年9月,图灵奖获得者、清华大学交叉信息研究院院长姚期智团队入驻西岸智塔,产生强大虹吸效应。五年间,依据“上下楼即上下游”的产业导向,徐汇区汇聚起1500余家人工智能企业、755家大模型企业和62个备案大模型,备案大模型数量占全市61%,总产出达千亿元规模。智塔“塑造高峰”,打造制高点,为产业高度与可能打开空间;2023年模速空间建成,意在“培育雨林”,构建开放平台,面向更广大的初创团队和应用型企业,扩展了人工智能产业的广度和参与度。从智塔地标到模速生态的演进,这正透视着上海“十四五”以来的人工智能产业生态革新。今年9月,黄浦江两岸,浦东张江与徐汇北杨两座人工智能创新小镇先后揭牌,展现上海培育新质生产力的决心和效率。模速空间效应辐射全市,这些载体通过生态能量的扩散和闭环,深化了产业扎根的深度和可持续性。全要素集聚、全过程创新、全链条协同,构建起一个要素相互依存、能量自然流动的“创新雨林”,激发创新能量“核爆点”,持续释放推动产业前进的澎湃动力。 “创新特种部队”“窗口期稍纵即逝,要快。”在模速空间推动下,上海创智学院与无问芯穹近期宣布共建“创智无穹·智能终端联合实验室”,实现校企深度协同——以需求牵引研发、以研发验证理论,以此实现快速迭代。智能终端,是技术、制造与市场深度融合的“最佳反应界面”。然而,当拥有“百亿参数”的大模型试图装入终端有限的“小身板”时,常面临水土不服:算力捉襟见肘、响应迟滞、功耗飙升……这些技术瓶颈,制约了大模型在自动驾驶、具身智能等实时交互场景中的落地体验。而无问芯穹和上海创智学院间构建起的协同,正努力打破掣肘。曾书霖说,来自学院和企业的人才汇聚在一起,既懂硬件又懂应用,在充分讨论中打磨架构,利用企业平台做快速的市场验证。在模速空间,这种协同已渗透到创新的每一个毛细血管。2025世界人工智能大会上,AI交互已经从“千人一面”走向“千人千面”,实现从回答问题到理解身份、预判意图的质变。支撑这一能力的,是模速空间企业——东浩兰生元数科技“元数FuturX共创实验室”打造的大模型。在算力推理上与智谱合作,在语料构建上与库帕思携手——“开发‘思维再生’技术时,联动了园区里好几家‘邻居’企业。”东浩兰生元数科技总经理郑翔这样比喻,模速空间内的企业犹如一支“创新特种部队”,基座模型、算力支持、应用开发等各环节高度集聚,一旦有重大项目,能迅速组建攻坚组,为共同目标各展所长。他打趣,甚至茶水间的偶遇,端着咖啡的即兴交谈,都能碰撞出灵感。各类创新要素相互依存、彼此滋养,形成了有机演进的共创闭环。 工业、医疗、法律,AI的落地是将智能技术无缝嵌入现有业态,实现倍乘效应。产业链上下游企业保持着高度的相互关注。“不仅关心自己的进展,也时刻关注同行的突破。”一位开发端从业者说,“其他垂直领域的成果,很可能就是我们所需要的解决方案。”“身处模速空间就像在一所永不毕业的大学里,总有人在关键时刻‘推’你一把,让你紧跟上大趋势。”这种被创业者津津乐道的体验,就是创新生态的价值——提供资源,更牵引方向。从技术高地到价值高地北杨人工智能创新小镇,一条华发路横贯东西,串联起历史和未来。路东,黄道婆纪念公园静立,见证着700多年前纺织技术革新者推动棉纺织业发展,影响后世;这一头,人工智能产业集群兴起,科技企业与人才聚集,延续着这片土地敢为人先、勇于突破的精神。 在徐汇区副区长陈勇看来:“政府提供空间与政策支持,市场资本负责资金注入与商业化路径开拓,双轮驱动,共同为科技创新保驾护航。科技本身则不断抛出新的挑战和机遇,持续拉动整个系统向前演进。”坐落于小镇核心的上海创智学院,就是机制革新的样本。楼内一个个实验室,承接着一个个被孵化的项目。在国家相关部委和上海市支持下,学院已建成万P级算力平台与10PB级数据中台;徐汇区也推出包括首年免租办公场地与人才公寓等在内的一揽子政策,降低创新门槛。 王宛艺 摄 各方力量,确保这些前沿技术能第一时间转化,沿着清晰的路径化作产业价值。一年来,上海创智学院已签约50余家行业龙头及独角兽企业,累计获企业捐赠与资助达5亿元;孵化师生创业企业10家,吸引社会资本近5亿元;举办创业活动20场,促成50场与大企业对接合作。2024级博士生叶宇翔所创办的“万物灵犀”,就是政策获益者之一。出于兴趣,他和团队打造了“有灵魂”的机器人智能体,希望搭载各类IP角色,满足人们深层次的情感陪伴需求。短短一年间,他与导师共同孵化了3家AI创业公司,第4家即将落地。应用层面,企业也得以迅速对接真实场景与需求。如,专注能源大模型的达卯智能,在模速空间牵线下与西岸集团合作,参与建设区域能源大模型示范应用场景,将其技术落地于虚拟电厂等项目。又如,上海人工智能实验室发布“风乌”气象大模型后,创业者张伟捕捉商机,成立相风科技并入驻模速空间,企业不仅获得算力支持与补贴申请指导,降低研发成本,也对接核电等潜在场景,获得市、区级路演机会,极大加速了产品与市场的连接。诸如此类“低成本、高密度”的创新环境让初创企业敢于试错、专于突破。“对微小创新的珍视和有效整合,把点滴水珠汇聚成有动能、有能量的水流。”陈勇这样作比,最终把技术高地进一步塑造为价值高地。 -
一周AI大事:黄仁勋亲自给马斯克送货,OpenAI被曝将对成人内容“开绿灯” 一、重磅工具:Claude获“技能”加持,“瑞士军刀”已上膛 新闻:Anthropic公司为其AI模型Claude推出了名为“技能”(Skills)的新功能。这是一种可按需加载的自定义指令与工作流打包机制。Claude可以在相关场景中动态调用“技能”,无需冗长的上下文即可处理专业化任务。“技能”新功能支持将代码规范、报告格式或分析等团队特定工作流程进行编码并存储,并通过设置界面和SDK统一管理。“技能”具备可组合性与可移植性,开发者可将多个“技能”整合成定制化工作流,通过Claude应用、Claude Code及其API无缝调用。 Anthropic同步发布了实施指南与资源库,其中包含创建自定义“技能”的说明,并在相关资源库中提供可处理Excel和PPT等任务的预置“技能”。这种新功能与MCP(组件化模块协议)相辅相成,有效扩展了AI模型的智能体能力。由于“技能”的资源库是开源的,有望像MCP一样获得广泛采用。 “技能”功能现已作为功能预览版向Pro、Max、Team及Enterprise等订阅计划的用户开放。 锐评:等于给Claude配了把可随时换技能的瑞士军刀。 二、AI技术与产品发布:从会拍片的Sora到会打工的Haiku,软硬件多点爆发 1. 新闻:Anthropic正式发布Claude Haiku 4.5。这是一款面向大规模智能体系统与复杂思维链的高速低成本模型。在编码与智能体任务基准测试中,Haiku 4.5表现突出,其在SWE-bench的通过率为73.3%,Terminal-bench得分41%,综合表现直逼Claude Sonnet 4。其卓越的性能、高速率与合理的成本定位,使其成为智能体AI应用的理想选择。Anthropic强调:“Sonnet 4.5擅长将复杂问题解构为多阶段计划,并能协调多个Haiku 4.5实例并行执行子任务。” 锐评:Haiku 4.5貌似“物美价廉”的实习生,专门给“项目经理”Sonnet 4.5打下手。 2. 新闻:谷歌发布Veo 3.1及Veo 3.1 Fast,新增原生音频增强、精准叙事控制、参考图像引导及长视频场景扩展功能。Veo 3.1引入的首尾帧转场与“素材融合”特性支持将多张参考图像合成动态视频。业界评测认为,Veo 3.1在音频质量、图像转视频的契合度以及画面一致性方面均有所提升。目前用户可通过Gemini API体验付费预览版,该模型兼容AI Studio、Vertex AI、Gemini应用及Flow平台。 #endText .video-info a{text-decoration:none;color: #000;} #endText .video-info a:hover{color:#d34747;} #endText .video-list li{overflow:hidden;float: left; list-style:none; width: 132px;height: 118px; position: relative;margin:8px 3px 0px 0px;} #entText .video-list a,#endText .video-list a:visited{text-decoration:none;color:#fff;} #endText .video-list .overlay{text-align: left; padding: 0px 6px; background-color: #313131; font-size: 12px; width: 120px; position: absolute; bottom: 0px; left: 0px; height: 26px; line-height: 26px; overflow: hidden;color: #fff; } #endText .video-list .on{border-bottom: 8px solid #c4282b;} #endText .video-list .play{width: 20px; height: 20px; background:url(http://static.ws.126.net/video/img14/zhuzhan/play.png);position: absolute;right: 12px; top: 62px;opacity: 0.7; color:#fff;filter:alpha(opacity=70); _background: none; _filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png"); } #endText .video-list a:hover .play{opacity: 1;filter:alpha(opacity=100);_filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png");} <script> if (/mp4$/.test("https://flv0.bn.netease.com/9da7c13bfd7e032cc20ba619c6a4c55485bc6b42bffcd9f3f49be6cc6f323fdbf2b725589987e7735d217926ef3f056d796bf7e3c05e8ba190fb37cd735fc0bddcbdd65a85644e16e427b6469a18ca0dbf03d24133314a3b2f0e2f66f49d08fc7607d131525349936f6f372f0fa3b403bef2591eae7b27f6.m3u8")) { document.getElementById("VKB2AAU6O").src = "https://flv0.bn.netease.com/9da7c13bfd7e032cc20ba619c6a4c55485bc6b42bffcd9f3f49be6cc6f323fdbf2b725589987e7735d217926ef3f056d796bf7e3c05e8ba190fb37cd735fc0bddcbdd65a85644e16e427b6469a18ca0dbf03d24133314a3b2f0e2f66f49d08fc7607d131525349936f6f372f0fa3b403bef2591eae7b27f6.m3u8" } else if(Hls && Hls.isSupported()) { var hls = new Hls(); hls.loadSource("https://flv0.bn.netease.com/9da7c13bfd7e032cc20ba619c6a4c55485bc6b42bffcd9f3f49be6cc6f323fdbf2b725589987e7735d217926ef3f056d796bf7e3c05e8ba190fb37cd735fc0bddcbdd65a85644e16e427b6469a18ca0dbf03d24133314a3b2f0e2f66f49d08fc7607d131525349936f6f372f0fa3b403bef2591eae7b27f6.m3u8") hls.attachMedia(document.getElementById("VKB2AAU6O")) } </script> <div class="video-info clearfix" style="margin: 16px 0 0px 0px;height:20px;line-height:20px;"> <p class="fn-right" style="height: 22px;line-height: 22px;overflow: hidden;font-size:12px;float: right; margin:0;padding:0;text-indent:0;"> <a style="text-align: right;float: left;width: 300px;" href="https://www.163.com/v/video/VKB2AAU6O.html" target="_blank" class="video-title">veo3.1官方宣传片</a> <span class="video-from" style="color: #a7a7a7;margin-left:10px">(来源:网易科技报道)</span> </p> </div> <div class="video-list"> <ul class="clearfix" style="margin:0;padding:0;list-style:none;width:540px;"> </ul> </div> </div>锐评:谷歌这是铁了心要当AI界的“全能导演”。 3. 新闻:OpenAI发布Sora 2更新,默认视频时长延长至15秒,最长可生成25秒视频。Pro订阅用户新增“故事板”功能,支持逐秒规划视频,实现更精细的生成过程控制。不过,Sora 2近期因生成涉及公众人物的视频引发版权与伦理争议。OpenAI强调公众人物及其家属应有权控制AI生成内容中的自身形象。 锐评:AI造戏越来越溜,但千万不能随便把名人当角色。 4. 新闻:百度MuseStreamer现可生成20秒以上视频。该模型支持实时交互式长视频生成,用户可动态改写剧情或延长过渡。 锐评:时间加长还能随时改戏,国内视频AI也是卷起来了。 5. 新闻:World Labs发布实时生成型世界模型RTFM,可交互式渲染3D一致性场景。官方技术博客阐明该模型聚焦效率、可扩展性与时间一致性三大目标,并演示了如何用单张H100显卡部署密集型世界模型。公开演示版支持用户实时探索生成的世界。虽然RTFM现阶段仍属概念验证,但已趋近实用化。 锐评:RTFM是想用一块H100“装下全世界”。 6. 新闻:OpenAI优化ChatGPT记忆管理机制,通过自动内存管理解决"存储已满"问题,旨在提升系统可靠性并降低用户侧的存储限制。 锐评:系统不再老是因为记忆满格而卡壳,用户体验要轻快不少。 7. 新闻:微软以“让每台Win11电脑变身AI PC”为目标,推出操作系统级Copilot语音智能体。这项集成至系统底层的安全沙箱技术,支持后台语音驱动的任务执行,专为多任务并行场景下的智能工作流设计。该公司表示“Copilot语音与视觉功能的突破性价值在于交互的便捷性。用户通过唤醒词‘Hey Copilot’即可用自然语言下达指令,视觉模块则可在获得授权后实时分析屏幕内容,提供应用教学、项目建议或操作指导。” 锐评:微软是铁了心推Copilot语音助手。 8. 新闻:Cognition推出SWE-grep和SWE-grep-mini两款经强化学习训练的多轮上下文检索智能体,专精AI代码搜索。这些模型能快速呈现关联代码段,为Windsurf Fast Context子智能体提供核心动力,并通过高并行架构显著降低搜索延迟。 锐评:这次是给AI配了个“代码搜索引擎”,程序员的“工具箱”快被“一锅端”了。 9. 新闻:Facebook推出AI自动选片功能,帮助用户从相册中挑选最佳照片或视频以生成动态或帖子,有效简化了内容创作流程。 锐评:专治“选择困难症”,以后发圈终于不用纠结。 10. 新闻:针对AI内容泛滥的舆论反馈,Pinterest新增内容管控工具,允许用户在美容、艺术等特定板块限制生成式AI内容的显示,并强化了内容标签功能。这种用户主导的AI接触管理机制,值得其他社交媒体平台学习借鉴。 锐评:主打眼不见为净。 11. 新闻:谷歌为Gemini API引入“谷歌地图数据关联”(Grounding with Google Maps)功能,使模型可依托最新地理数据生成更准确的本地化回答。这一功能可与搜索引擎关联组合使用,进一步保障信息真实性,相关演示案例已在AI Studio开放测试。 锐评:Gemini接上“谷歌地图”,精准回答“附近有啥好吃的”。 12. 新闻:谷歌升级AI Studio,优化了开发者与用户体验。新版本推出集成Gemini、生成式媒体模型、语音合成与实时模型的统一工作台Playground,简化了模型切换流程并优化了聊天界面的一致性。 锐评:开发者少了来回切换的烦恼。 13. 新闻:针对通过API构建Claude智能体的开发者,AWS已经在Amazon Bedrock上集成了最新的Claude模型Opus 4.1、Sonnet 4.5、Haiku 4.5。其中Haiku 4.5的API定价为每百万输入/输出token 1/5美元。 锐评:云巨头的AI资源库主打一个“我全都要”。 14. 新闻:英伟达开始出货DGX Spark。这款桌面级AI超级工作站专为本地推理与原型开发设计,上市即售罄。LMSYS的独立评测列出了其规格与性能亮点:GPU(GB10)峰值性能达1 PFLOP(FP4张量),整体算力介于RTX 5070与5070 Ti之间;其革命性突破在于采用了128GB的统一内存架构,实现CPU与GPU内存池的无缝共享。这种统一架构使DGX Spark能直接加载运行大模型,彻底规避了系统内存与显存间的数据传输开销,让DGX Spark可运行的AI模型规模远超传统台式机。据悉,英伟达首席执行官黄仁勋在星舰第11次试飞前后,亲自向马斯克交付了DGX Spark。 锐评:算得上AI PC中的爱马仕。 15. 新闻:OpenAI CEO萨姆·奥特曼(Sam Altman)称将于今年12月份起放宽ChatGPT内容限制,向通过认证的成人用户开放成人向内容。此举旨在打造类似GPT-4o风格的可定制个性化体系,在保障安全的前提下实现不同年龄段用户的差异化服务。 锐评:兜兜转转还是没绕开人类本能。 三、AI研究资讯:从“解码癌症”到“掌控核聚变”,谷歌“炼丹”不止 1. 新闻:谷歌推出开源癌症变异分类模型DeepSomatic。它能精准区分遗传变异与体细胞变异,在复杂样本测试中表现超越现有方案。 锐评:AI在医学界又当起了显微镜和第二只眼。 2. 新闻:谷歌与耶鲁大学合作发布基于Gemma架构的癌症研究模型Cell2Sentence-Scale 27B。该模型基于超10亿token的转录组与生物数据训练,能将RNA序列信息表示为文本式“细胞句子”。研究人员运用C2S-Scale进行单细胞分析,成功识别出经湿实验验证的潜在癌症治疗路径。该研究的论文预印本与模型已经同步公开。 锐评:科研人员的解码器又升级了。 3. 新闻:谷歌DeepMind与Commonwealth Fusion Systems达成合作,通过深度学习实现等离子体控制以加速聚变能源研发。这一AI系统结合深度强化学习与TORAX模拟器,优化了等离子体控制与托卡马克装置的性能,推动清洁且无限的聚变能源迈向现实。 锐评:AI不只能看天象,还想造星。 四、AI商业与政策:大厂芯片狂飙,高盛高喊“继续投” 1. 新闻:OpenAI宣布与博通合作开发定制AI芯片。OpenAI负责加速器与系统架构设计,博通将于2026年下半年启动量产部署。该项目目标是实现10GW算力规模,为下一代前沿模型与大规模推理提供基础支撑。此次合作标志着OpenAI向开放基础设施战略转型,通过博通以太网技术多元化其计算架构,也凸显出AI专用芯片在推理阶段的重要性。 锐评:算力界又要有新玩家和新规则。 2. 新闻:英伟达透露Meta与Oracle将在AI数据中心网络标准化中采用Spectrum-X以太网架构,训练效率与扩展性是选择这一开放加速方案的主因。 锐评:老黄不仅卖“算力”,还要插手“网线”生意。 3. 新闻:苹果发布M5芯片,宣称峰值AI性能较M4提升4倍,专为下一代设备端AI负载打造。M5将率先用在新款MacBook Pro、iPad及Vision Pro上,预计数周内上市。 锐评:如果Siri还是那个智障,这4倍性能大概也只能用来P图。 4. 新闻:英特尔公布一款搭载160GB内存、具备高能效的数据中心GPU,并将其加入该公司的AI加速器组合,旨在推动英特尔以开放系统与软件架构为核心的新AI战略。这款GPU代号为“Crescent Island(新月岛)”,根据英特尔介绍,它专为运行推理工作负载的风冷企业级服务器而设计,强调“功耗与成本优化”。Crescent Island采用Xe3P微架构,配备160GB LPDDR5X内存,并支持多种数据类型,为大语言模型提供充足运行空间。 锐评:英特尔想用“性价比推理”从英伟达“虎口夺食”。 5. 新闻:Spotify与主流唱片公司达成协议,共同开发“负责任”的AI产品体系,确保持续尊重版权、保障艺术家收益,并为音乐人保留自主选择是否授权AI工具使用自己作品的权利。该公司还同步设立AI研究实验室,集中精力研发以艺术家权益为核心的技术方案。 锐评:Spotify先下手为强,拉着唱片公司“拜山头”。 6. 新闻:谷歌母公司Alphabet计划在印度南部投资超100亿美元,两年内于安得拉邦港口城市维沙卡帕特南建设一座1吉瓦级数据中心。这标志着谷歌在全球扩张战略中押注印度市场。 锐评:“三哥”的电网扛得住吗? 7. 新闻:中国工程院院刊《Engineering》评选的“2025全球十大工程成就”在“2025年世界工程组织联合会全体大会暨全球工程大会”上正式发布。其中英伟达Blackwell GPU架构和DeepSeek开源大语言模型上榜。 锐评:大厂技术上榜,当之无愧。 8. 新闻:苹果公司正进行重大战略调整:暂停开发更轻便、低价的Vision头显(内部代号或为“Vision Air”),将资源集中于智能眼镜的研发。据长期跟踪苹果动态的资深分析师马克·古尔曼(Mark Gurman)透露,在亲身体验了竞争对手Meta新推出的内置显示屏智能眼镜后,他确信苹果的这一转向是明智之举。 锐评:库克明白过来,没人想顶着个“滑雪镜”出门。 9. 新闻:近期AI领域的巨额资本开支引发了市场对其可持续性的担忧。高盛最新研报明确揭示,当前AI投资规模远未过热,这一投资水平具备可持续性,这意味着AI基础设施建设的宏观叙事依然稳健。该研究表示,AI相关投资占美国GDP的比例目前远低于历史上其他技术周期。 锐评:哪有泡沫?高盛说不存在的。 10. 新闻:中国互联网络信息中心(CNNIC)正式发布《生成式人工智能应用发展报告(2025)》。《报告》显示,截至2025年6月,我国生成式人工智能用户规模达5.15亿人,较2024年12月增长2.66亿人,用户规模半年翻番;普及率为36.5%。主要应用场景包括回答问题、日常办公、休闲娱乐、创作内容等。其中,利用生成式人工智能产品回答问题的用户最为广泛,达80.9%。 锐评:我国人工智能正在从“可用”走向“好用”、从“试用”走向“常用”。 11. 新闻:加州颁布AI在线安全法规,强制要求聊天机器人在与未成年人互动时明确披露AI身份。加州州长纽森签署了SB243法案,该法案规定,在用户可能误以为与人类对话的场景中,AI必须主动说明身份。此外,加州的《AI透明度法案》也将生效,主要规定了企业层面的合规义务。 锐评:加州要求“AI陪聊”也得“持证上岗”。 五、AI观点与文章:微软定义“人机协作”,你的同事可能不是人 新闻:微软AI业务首席营销官贾里德·斯帕塔罗(Jared Spataro)在《AI正在重塑商业》一文中,阐释了领先企业正迈向“人主导、AI驱动”的新组织形态。 他总结了三大趋势: 获取专业知识的成本骤降:“企业可快速部署基于产品、市场或专有知识的智能体,直接嵌入组织数据、系统与安全防护体系。” 人机协作带来的工作重构:“当数字员工融入各业务环节,组织从‘为人设计信息流程’转向‘为智能体优化执行效率’。” 知识复利效应:“智能体以人类系统无法企及的速度创造新型知识循环。” 斯帕塔罗早前发表的文章《CEO前沿企业建设指南》进一步阐释了AI为先的含义。这些论述共同勾勒出企业级AI应用引发的根本性组织变革图景,其预见性值得肯定。 锐评:说白了就是你的同事可能不是人,但老板一定还是人。(辰辰) <div style="height: 0px;overflow:hidden;"><img src="https://static.ws.126.net/163/f2e/product/post_nodejs/static/logo.png"></div> </div> -
荣耀钱包开启“先乘后付”手机交通卡“耀行卡”众测 IT之家 10 月 20 日消息,综合IT之家读者投稿及各大平台用户反馈,荣耀近期悄悄为荣耀钱包新增一项“耀行卡”交通卡众测,该交通卡主打“先乘后付”,需前往“我的荣耀 App-俱乐部-众测”启用,提供 50 元额度,整体类似此前鸿蒙版华为钱包 App 上线的“畅行无忧卡”交通卡。综合用户反馈,该“耀行卡”号称拥有“0 元开卡,支持先乘后付,适用于全国 330 + 城市”等特点,本身基于长沙“潇湘卡”公交卡打造,支持长沙市内公交 7 折、地铁 / 磁悬浮 9 折优惠。用户每次乘车时利用 HONOR Pay 扣除钱包内置的“乘车额度”钱,相应“乘车额度”使用钱包绑定的银行卡结算。 -
OpenAI联合创始人:AI智能体真正有用还需10年 IT之家 10 月 20 日消息,OpenAI 创始人、“氛围编程”引领者 Andrej Karpathy 认为,即便 AI 发展日新月异,耐心仍是一种值得坚持的品质。据《商业内幕》今日报道,Karpathy 最新的观点指出,AI 智能体距离真正达到“功能完善”的目标,还有很长的路要走。“现在的智能体根本不好用。它们的智能不够高,也不够多模态,没法真正操作电脑,更谈不上持续学习。你告诉它们的东西,它们记不住,认知能力还远远不够,就是不好用。” 他估计,解决所有这些问题大约需要十年时间。投资者纷纷称 2025 年将是“智能体之年”。广义上讲,智能体是一种能自主完成任务的虚拟助手,可以拆解问题、规划方案,并在不需要用户指令的情况下自行执行。Karpathy 进一步表示:“我对行业的批评在于,大家造工具的速度远远超过了 AI 本身的能力。”他指出,如今的 AI 行业仿佛已经身处未来:全自动化的系统并行协作完成所有代码编写,而人类被排除在外。“我并不希望那样的未来到来。”在他理想的 AI 世界里,人类可以与 AI 共同编程、协作完成任务。“我希望 AI 能自动调出 API 文档,向我展示它是否正确调用了接口;希望它别乱猜,在拿不准的时候能主动询问或协作;我希望在合作中学习、成长为更好的程序员,而不是被动地接收一堆所谓可运行的代码。”他指出,若一味追求能完全取代人类的智能体,结果只会让人类失去价值,而 AI 生成的低质量内容(“AI slop”)则会充斥网络。IT之家从报道中获悉,Karpathy 仍强调自己并非 AI 悲观主义者。“相比旧金山 AI 圈的乐观氛围,我的时间预期要悲观 5 到 10 倍,但和那些完全否定 AI 的人相比,我仍算相当乐观。” -
「死亡互联网理论」刷屏硅谷!Reddit创始人预警,奥特曼公开发声 新智元报道编辑:元宇【新智元导读】近段时间,「死亡互联网理论」刷屏硅谷,OpenAI创始人兼CEO Sam Altman、Reddit联合创始人Ohanian等纷纷对其发表评论。失去真实性的网络等同于死亡。AI生成内容正席卷社交平台,从图片、视频到自动化评论。互联网的未来不在真假之争,而在重拾「真实」的信任与温度。当互联网被AI内容淹没,真正由人类创作的内容正在日益缩减。「如今的互联网,大部分已经死了」,近日Reddit联合创始人Alexis Ohanian一语惊人。 Reddit联合创始人Alexis Ohanian他口中的「互联网死亡」并不是指互联网被关闭了,而是被铺天盖地的AI生成内容所淹没,失去了真实的生命力。Ohanian所言非虚。曾经汇聚人类真实思想和交流的网络,如今正被大量AI生成的内容所占据:你看到的热帖、阅读的文章、甚至与你争论的「网友」,都可能根本不是人类,背后或许早已是算法与AI的「回声」。AI生成内容的无序扩张,正在蚕食互联网的真实性。 旅行类大V Chris Broad在X平台上表示,「死亡互联网理论」现在已经成为「死亡互联网现实」:每天都有普通人给我发消息,让我去一些根本不存在的地方,这些地方都是人们在Facebook、Instagram和Twitter相关主题账号或页面中提到的……这些帖子通常包含完全虚假的AI照片,下面还有机器人账号在评论区盲目地称赞照片。Chris Broad提醒人们要小心自己关注和点击的内容。「要知道,大多数页面、内容以及粉丝数量,都是被严重人为夸大的。」 网友Swarn也提到经常会刷到疑似AI生成的推文,他会通过内容中夹杂的「突然转折、刻意堆砌的词汇、借用的隐喻」来识别「AI味」。Goddess预测到下一年「死亡互联网理论」会越来越受到关注,所有社交媒体账号并非都是真实的人。 这股热潮,甚至把OpenAI创始人兼CEO Sam Altman也惊动了。 Sam Altman认为「死亡互联网理论」可能有一定的道理。他提到「现在的确存在很多由大模型驱动的Twitter账号」。这些AI生成内容的泛滥,让Altman再度担心「死亡互联网」理论的影响。不真实,毋宁死「死亡互联网」理论的起源「死亡互联网理论」(DIT,Dead Internet Theory),传递出这样一种核心态度:不真实,毋宁死。它认为只有真实才是互联网的生命——失去真实性,就等于是宣告了互联网的「死亡」。2021年,用户IlluminatiPirate在Agora Road论坛发帖提到了「死亡互联网理论」,这位网友对其的定义就是「大多数互联网变得虚假」。 伴随着互联网社会的发展,「死亡互联网理论」思潮在网络论坛和社区中开始逐渐流行,背后的驱动因素正是「真实感」的逐渐丧失:现代互联网带来了花样百出的玩法,但真实感也被玩丢了。早期互联网那种有机的、用户驱动的特性一点点消失,取而代之的是越来越依赖计算机生成的内容(数据)以维持活动和参与度。随着生成式AI的出现,让「死亡互联网理论」获得了更多的「现实支撑」。因为生成式AI更像人类,它们在社交媒体上被广泛应用于放大点赞、评论和分享数据等。就连Sam Altman,这位亲手让ChatGPT风靡全球的「AI之父」,也被铺天盖地的「程序味儿」搞破防,他忍不住吐槽Reddit上的AI腔调(LLM-speak),认为这让人际互动「感觉很假」。从早期互联网,到社交媒体时代,再到生成式AI浪潮,原来那个真实的互联网已逐渐被一个由AI主导的互联网所取代,「技术登月」越来越多,但真实感却越来越少了。换句话说,「死亡互联网」理论的市场越来越大了。「死亡互联网」的升级版如今,如火如荼的AI浪潮,正按下「互联网死亡」的加速键,并且还带了它的升级版本。据Cloudflare的长期监测显示,机器人流量约占整体应用流量的31%左右,并在部分地区和时段阶段性超越人类访问。Imperva在2025年版的《Bad Bot Report》中则指出:自动化流量在2024年已达51%,其中从事恶意活动的「坏机器人」占比升至37%。这里的「坏机器人」在生成式AI时代更为突出,因为它们更善于伪装成人类行为。它们有时只是在社交媒体上生成一些空洞或胡言乱语的评论,但也可能被恶意使用,比如制造虚假的页面浏览量、用户互动和使用时长,从而造成公司业绩数据的扭曲。不止活跃于社交媒体,生成式AI还在逐步接管人类表达领域。Graphite的一项数据记录了这一里程碑时刻:2024年11月,网络上发表的AI生成文章数量超过了人类撰写的文章数量。 据Graphite观察,自2022年11月ChatGPT推出以来,AI生成文章数量显著增长,但在过去一年中AI生成文章的比例保持相对稳定,这可能是因为早期AI生成文章质量不佳导致的。但随着AI生成文章质量的提高,再加上AI生成文章的速度之高、成本之低也远非人类可比,可以预见未来AI文章的数量还会稳定增长。这意味着,AI生成内容的数量增长不仅改变了信息来源的结构,也正在重塑网络生态真实感的「基线」,也可能带来AI时代「互联网死亡」的升级版——模型崩溃。 https://arxiv.org/pdf/2305.17493这一点在牛津大学等研究机构发表的《递归的诅咒(Curse of Recursion):在AI生成数据上再训练会导致模型遗忘》论文中已经得到了理论上的证实。AI时代真正的危机是模型崩溃。在大模型使用生成数据继续训练(continue training)的递归过程中,模型会慢慢「忘记」或偏离原始人类语言分布的某些细节,尤其是那些少见或者边缘的模式。这样模型会逐渐丢失多样性沦为一切趋于平庸的同质化,最终出现模型崩溃(Model Collapse)。这就好像把一张照片在上一代复印件的基础上不断复印,其清晰度会逐渐下降,最终变成一张模糊的、缺乏细节的照片。当越来越多的AI内容成为模型的训练数据,就可能带来模型能力的下降,由此产生更多劣质的AI内容,这些内容再训练出更差的AI模型,最终就是更严重的危机——模型崩溃。从互联网的「死亡」,到模型的「崩溃」,与技术发展同步的,是「失真」的演进。让互联网更「人」一点,更「真」一点Google CEO Sundar Pichai认为搜索引擎会被AIGC 「深刻改造」,因此AI回答与人类内容的协同将成为主流交互范式。 Google CEO Sundar Pichai英伟达CEO黄仁勋,提出应当把AIGC视作时代性通用技术,将无处不在地嵌入创作、工程与组织工作流。随着AI对于互联网和人类社会的渗透,AI生成的内容将会像Sam Altman预言的那样,会不可避免地越来越多。这就带来一个难题:如何区分AI和人类生成的内容。随着人类正越来越多地与AI合作,让这一点变得更加困难。的确,一个人在工作中利用AI的方式有很多种,比如用它来搜索,整理材料等,因此很难明确地说某项内容是AI生成的还是人类生成的。实际上很多AI生成的内容,背后是人类在引导、编辑、校正。用加州大学洛杉矶分校计算机科学教授、亚马逊网络服务副总裁Stefano Soatto的话来说,「二者之间更像是一种共生关系,而不是非此即彼。并非所有AI生成的内容都是垃圾内容。」在这种共生的关系下,用不用区分AI和人类生成的内容?Sam Altman认为,「好不好比是不是AI产出更重要」,但他也提出要有「可验证的来源」与治理工具,以识别哪些是AI生成的并提升信任。Altman认为识别AI生成内容是为了提升对内容的信任度,他曾多次提醒不要过度信任模型,因为AI也会「自信地编造」。同样,Anthropic CEO Dario Amodei也认为,需要科学的方法和评估体系为此来兜底,他认为虽然模型「胡说」频率可能低于人类,但出错方式更「出其不意」。Elon Musk也强调要用AI去检测/溯源合成视频与深伪,在平台层面构建「内容鉴别器」。这点随着AI技术的发展变得尤为重要。近日,Sora 2上线后短时间内就有大量「以假乱真」的视频在社媒流通,YouTube、Meta正通过出台「贴标」「降权/限变现」等方式,试图限制「AI灌水内容」的扩散。对于AI生成内容的监管也在多地加码。比如,美国政府在2025年5月19日正式出台《TAKE IT DOWN 法案》,将故意发布或威胁发布非同意的亲密图像(包括 AI 生成的深度伪造)定为犯罪行为。 欧盟首部关于人工智能的法规《AI法案》明确合成内容必须标识、与用户交互需透明提示。识别AI内容是为了安全,避免AI噪声,但即便是AI生成的内容优于人类,这种区别仍然是必须的。因为相比较好坏,真实性永远更为重要。不仅是互联网,即使是AI时代的数字生命,本质仍然在于「真实」。在人机共生的时代,我们需要关注的重点不在于人类与AI的区别或者优劣,而是如何让AI服务于人类的真实。无论未来技术如何演进,人类仍需守住那份「真实」的火种。参考资料: https://graphite.io/five-percent/more-articles-are-now-created-by-ai-than-humans%20%20https://arxiv.org/pdf/2502.00007%20https://x.com/AskPerplexity/status/1978587411803156942 -
万亿美元豪赌,Open AI创始人:泡沫化的故事很诱人 记者丨彭新编辑丨朱益民2026财年第一财季(截至2025年8月31日),甲骨文营收增长12%至149亿美元,其中云计算收入增长28%至72亿美元,云应用(SaaS)收入38亿美元、增长11%,但软件收入下降1%至57亿美元,整体表现喜忧参半。但是,在全面参与AI竞赛的前提下,甲骨文高达数千亿美元的已签约项目令市场为之疯狂。甲骨文高管称,在第一财季与三家客户签署了四份价值数十亿美元的合同;在接下来的几个月里,甲骨文预计还会签下几笔数十亿美元的合同,RPO(剩余履约义务)可能会超过5000亿美元。市场对甲骨文财报的反馈堪称疯狂。财报公布后,股价盘中一度暴涨41%,收盘涨近36%,创有史以来最大单日涨幅,公司市值因此增加2440亿美元至9220亿美元。市场正押注加大AI投资、重金建设数据中心的企业。除甲骨文外,英伟达与OpenAI走在最前:前者市值约4.4万亿美元,后者估值提升至超过8000亿美元。英伟达凭借较低的融资成本,一边向英特尔投入约50亿美元,一边还计划在OpenAI的合作项目追加约1000亿美元资金。随着收入预期抬升,OpenAI估值同步上行。近三个月,二级市场AI半导体与基础设施整体走强。 图源:视觉中国资本狂欢之下,不安情绪正在投资人、创业者和一线从业者间悄然蔓延。人工智能热潮会不会泡沫化?越来越多人担心,一场迫在眉睫的AI泡沫,可能成为下一个全球经济风险的引爆点。 虚火还是刚需?10月6日,在旧金山举办的OpenAI年度开发者大会(DevDay)上,OpenAI首席执行官奥特曼(Sam Altman)就AI泡沫化给出了不同寻常的回应。“我知道写泡沫化的故事很诱人,”奥特曼表示,“事实上,我认为AI的许多领域现在确实有点泡沫化。”此番言论在当今美国科技领袖中颇为罕见,他们通常对此类问题讳莫如深。奥特曼进一步称,他预期投资人会做出一些错误的判断,而一些“愚蠢”的新创公司也可能轻易获得大笔资金。不过,奥特曼话锋一转,明确将OpenAI与行业内的泡沫现象区分开来。他强调,对OpenAI而言,“这里确实正在发生一些真实的事情”,意指其技术进步和业务发展具有实质性。对OpenAI本身,奥特曼给出的判断更为笃定:模型能力、产品矩阵和商业化“出现了可验证的进展”。尽管奥特曼试图将公司与市场的非理性繁荣剥离开来,但并非所有人都被说服。OpenAI正身处风暴中心。近一个月,随着OpenAI与英伟达、AMD、博通乃至甲骨文的合作计划持续推进,美国科技巨头之间交织出错综复杂的算力与资本合作关系。总的来看,OpenAI采购部署AMD芯片的同时,还能获得以特定价格入股AMD的权利;英伟达向OpenAI投资了高达1000亿美元,双方共建大规模数据中心,后者再以投资款采购英伟达芯片。微软既是OpenAI的主要股东,同时还是人工智能云计算公司CoreWeave的主要客户,而CoreWeave又是英伟达持股较多的公司;据估计,截至英伟达2025财年第四季度,微软贡献了英伟达近20%的年化收入。这些股权与采购的“纠缠”让产业链更像一张彼此勾连的网。互为客户的关系在短期内推高了多家公司的预期新增收入,有些增量甚至达到公司现有收入的数倍。随着AI领域日益复杂的融资安排愈发普遍,其对行业真实需求的潜在扭曲引发硅谷专家警觉。质疑者认为,AI科技公司市值的快速飙升,部分源于“财务工程”而非内在价值。他们把这类交易称为“循环融资”(round-tripping)甚至“供应商融资”(vendor financing)——通过投资或借贷给客户,促使其持续购买自身产品,从而人为制造需求并推高营收与估值。面对质疑,奥特曼回应称:“没错,这些投资和贷款前所未见。”但他补充,市场的另一面是,“企业营收的增长速度也前所未有。”不过,尽管OpenAI的营收增长迅速,该公司迄今仍未实现盈利。被视作AI算力需求晴雨表的台积电,10月16日交出超预期业绩,并把2025年全年营收增速指引再次上调至近35%。这已是台积电年内第二次上调全年展望,市场普遍将其解读为给“AI需求疑虑”服下一剂“定心丸”。业务上,台积电既是英伟达、AMD等高端AI芯片的独家代工方,也承接多家互联网公司的ASIC及其他芯片订单;同时,台积电的先进封装能力对AI芯片量产与性能释放至关重要。对于外界关切的AI需求判断,台积电董事长兼总裁魏哲家在业绩电话会上称,当前AI客户拉货“全面强劲”,甚至比三个月前更强,相关长期复合增速略高于此前预期。“我们直接从客户那里收到强烈信号,要求我们具备支持其业务的能力,因此我们对AI大趋势的信心正在增强。”他提到,大型语言模型的令牌(token)处理量呈爆发式上升,反映AI的高频采用,带动算力需求抬升,从而验证了对先进制程与高端封装的持续需求。在产能扩充上,魏哲家强调将维持谨慎节奏:除逐条核对客户订单规划外,还会亲自查访“客户的客户”,并通过内部评估机制把关,力求更精准地推进产能布局与建设。 互联网泡沫镜鉴在科技产业的历史里,“泡沫”并非新课题。上世纪90年代末的互联网狂飙,在2000—2002年引发全球科技股大幅回撤与大量初创公司倒闭,也拖累电信行业爆出债务危机。在10月14日发布的《世界经济展望》中,IMF首席经济学家皮埃尔-奥利维耶·古兰沙称,如今人工智能投资激增,与90年代末互联网泡沫相呼应,但更可能不是系统性风险。互联网早期,大量资本涌入电信基础设施,押注需求将呈指数级增长,乐观情绪刺激科技投资,抬高股票估值。然而,当需求放缓时,破产潮随之而来。问题并不在于互联网缺乏潜力,而在于资本大规模投入的时点快于普及速度。AI投资亦然。麻省理工学院今年8月的一项研究显示,实施AI试点项目的公司中,高达95%并未取得任何投资回报。不过,互联网泡沫留下的光纤骨干网和数据中心,为随后移动互联网与云计算繁荣奠定了基础。类比之下,即便当下AI出现估值回调,电力与算力基础设施、模型与数据资产的沉淀,同样可能为下一阶段的繁盛奠定基础。尚不能断言人工智能浪潮究竟是机遇还是危机,但军备竞赛中的AI公司已然处于两难:扩产还是观望?自建数据中心还是外包云算力?这考验管理层和投资者的判断。对追逐AI红利的公司而言,继续加码意味着巨额资本支出与盈利压力;一旦需求兑现放缓、推理成本曲线降不下来,资产减值与期限错配将迅速放大。若踩刹车,不仅可能错过AI需求与生态窗口,还可能被市场解读为增长见顶、战略摇摆,引发估值下调与合作伙伴观望,进一步放大竞争压力。需要注意的是,当前推高AI增长的主要是盈利与现金流相对稳健的科技巨头,即便热潮退去,它们大概率仍能维持增长。但也有人提醒,最严重的人工智能泡沫风险可能出现在能源领域,市场正涌现一批尚无营收、寄望未来科技公司为其尚未建成的电力项目买单的开发商,一旦AI需求不及预期,这些没有收入的能源公司将跌得最惨,而且几乎没有缓冲。SFC出品丨21财经客户端 21世纪经济报道编辑丨曾静娇 见习编辑张嘉钰 实习生丁紫祎21君荐读 -
高盛:人工智能热潮并非泡沫,才刚刚起步 IT之家 10 月 19 日消息,尽管市场对人工智能(AI)泡沫的担忧日益加剧,但高盛(Goldman Sachs)认为,这场 AI 繁荣才刚刚拉开序幕。 这家华尔街巨头的分析师指出,当前的投资规模与 AI 所能带来的潜在经济回报相比仍然较小。高盛分析师在周三发布的一份报告中写道:“生成式 AI 所承诺的巨大经济价值,足以支撑当前对 AI 基础设施的投资。只要企业相信今天的投入将在长期内带来超额回报,目前整体 AI 投资水平就是可持续的。”高盛提出这一判断主要有两大理由:一是 AI 应用在已部署领域已开始显著提升生产效率;二是要释放这些效益,需要庞大的计算能力支持。高盛估算,AI 带来的长期生产力提升所产生的经济价值将远远超过其前期投入成本。该机构预测,若 AI 实现广泛普及,有望为美国经济增加约 20 万亿美元(IT之家注:现汇率约合 141.9 万亿元人民币),其中约 8 万亿美元将以资本收入的形式流入企业。分析师表示:“生成式 AI 仍有望迅速加速任务自动化进程,推动劳动力成本节约并大幅提升生产率。我们的基准预测显示,在全面采用 AI 后,美国整体劳动生产率将提升 15%,这一过程预计将在未来十年内逐步实现。”尽管芯片、服务器和数据中心的支出屡创新高,高盛仍认为,与以往的技术革命相比,当前 AI 领域的投资规模依然有限。该机构估计,美国与 AI 相关的投资尚不足国内生产总值(GDP)的 1%,而此前几次技术浪潮高峰期的投资占比则高达 2% 至 5%,包括铁路扩张时期、1920 年代电气化浪潮以及上世纪 90 年代末的互联网泡沫时期。高盛分析师表示,从宏观经济角度看,AI 投资的合理性依然充分,他们“并不太担心 AI 资本支出的具体金额”。他们指出,预计 2025 年全年 AI 相关支出约为 3000 亿美元(现汇率约合 2.13 万亿元人民币),考虑到该技术的长期回报潜力,这一投资规模是合理的。不过,高盛也承认,市场存在“合理担忧”:那些目前在 AI 领域投入最多的公司,是否真能最终收获最大回报?尤其考虑到硬件设备快速折旧的风险。分析师认为,如果投资者能够捕获 AI 长期经济价值中的较大份额,那么进入时机的重要性就会相对降低。然而历史经验表明,先发优势并不总能转化为最终胜势。他们指出,“先行者”在基础设施建设周期中往往表现不佳,并以铁路和电信行业为例说明:在许多情况下,后来者通过在早期过度建设后的低谷期低价收购资产,反而获得了更高的回报。报告写道:“当前 AI 市场的结构尚不清晰,无法确定今天处于领先地位的 AI 企业是否将成为长期赢家。”他们补充道:“当互补性资产(如半导体)稀缺且生产高度垂直整合时,先发优势更为明显 —— 这意味着当前领先者可能表现更优;但在技术变革迅猛的时期,这种优势则会减弱。”此外,分析师还指出,早期采用者正通过同时使用多个 AI 模型而非依赖单一生态系统来对冲风险,这进一步削弱了现有巨头的竞争优势。他们还强调,目前尚难判断企业持续投入 AI 的动力何时会减弱,因为早期已显现的生产率提升和模型性能的稳步改进仍在激励投资。“因此,尽管随着 AI 投资周期逐渐从建设阶段过渡到成熟阶段,且硬件成本持续下降,投资终将趋于平稳,但当前的技术背景仍有利于 AI 投资的持续推进。”分析师总结道。高盛的这一评估发布之际,市场正围绕 AI 是否催生了新一轮科技泡沫展开激烈辩论。上周,摩根士丹利(Morgan Stanley)和高盛的战略分析师均指出,若综合考虑盈利增长、现金流和利润率等因素,当前 AI 相关股票的估值并未像批评者所声称的那样被严重高估。 -
助贷新规落地调查:单利最低达7.56%,有网贷平台主动降2个点利率“拉客” 本文来源:时代周报 作者:谢怡雯随着《关于加强商业银行互联网助贷业务管理提升金融服务质效的通知》(下称“助贷新规”)正式实施,互联网贷款平台的跟进进度也备受关注。此次助贷新规要求商业银行对平台运营机构、增信服务机构实行名单制管理,通过官方网站、移动互联网应用程序等渠道披露名单,及时对名单进行更新调整。商业银行不得与名单外的机构开展互联网助贷业务合作,即对助贷合作机构实行“白名单管理”。与此同时,助贷新规要求贷款的综合融资成本不超过24%。在本次新规实施之前,年化利率在24%~36%的部分普遍被视为民间借贷的自然债务区间,超过36%的部分才可以起诉返还。时代周报记者查询发现,目前包括蚂蚁、美团、京东、百度等旗下的多家互联网贷款平台标注的贷款利率上限均已降至24%及以下。不过,时代周报记者通过采访多名借款人及平台发现,部分平台除了标注的借款利率以外,还存在担保费用、提前还款违约金等额外费用,累计后的综合年化成本仍有可能超出24%。上海金融与发展实验室副主任、招联首席研究员董希淼向时代周报记者表示,“助贷新规”实施意味着商业银行、消费金融公司等金融机构互联网助贷业务进入“合规为王”和“风控为本”的新阶段。从短期看,“助贷新规”给金融机构尤其是过度依赖助贷业务的中小金融机构带来巨大的业务调整压力。“这既是挑战,也是倒逼金融机构回归主业、苦练内功、实现高质量发展的契机。未来助贷市场竞争,将不再是简单的‘流量’和‘规模’之争,而是风险管理能力、金融科技实力、客户精细化运营能力的综合较量。”董希淼表示。 来源:图虫创意 多数平台利率均降至24%以下,不乏主动降利率拉客时代周报记者查询了蚂蚁消金、美团、京东、度小满、奇富科技、拍拍贷、马上消费金融、乐信等旗下多家互联网贷款平台APP或官网,发现目前各家平台标注的贷款利率上限均已降至24%及以下,其中多家平台为了获客,还推出了新客30天免息等优惠活动。 来源:美团借钱 在时代周报记者体验过程中,多家平台要求输入身份证信息以及进行人脸识别。其中京东借钱还额外要求输入学历、职业、工作单位、纳税地区、地址等详细信息。信息输入几分钟之后,多家平台显示已通过资质审核,时代周报记者随即收到了短信提醒,获批额度在6.07万元~20万元不等,单利最低7.56%,年化利率均低于24%的上限。 来源:京东借钱 不过,在平台上只能看到贷款利率,并未显示是否需要额外支付担保费用。马上消费金融和度小满的电话销售人员均向时代周报记者表示,该平台不存在担保费用,仅需要支付APP上显示的借款利率。在时代周报记者测试上述平台后,随后几日均收到了大量来自各家平台的电话和短信。内容主要是告知已通过资质审核,并询问在贷款过程中是否碰到了问题,平台可以帮助上调额度及减免利率等。度小满的工作人员向时代周报记者展示了两份借款本金为8万元的还款计划,其中第一份是随借随还,不限定还款日期,年利率13.032%;另一份是按期归还,年利率为11.952%,利率低于前者,但需要在合同中约定3/6/12个月的还款期,并严格按照日期归还,如果提前归还,需要额外支付4%*未还本金的违约金。三天后,上述工作人员又主动联系时代周报记者,称可将借款总额提升至10万元,并且随借随还、按期还两种方式的年利率可分别下降至11.052%、9.972%,假设均贷款12个月,两种借款方式分别相当于每1000元借1天的利息为0.3元、0.27元。 来源:度小满 时代周报记者注意到,助贷新规出台后,不少借款人在互联网投诉贷款平台,表示其近期在平台借款的综合年化利率仍高于24%,希望联系平台或者通过投诉的方式将存续合同的贷款利率降至24%及以下。多名借款人告诉时代周报记者,其在联系平台后并未得到有效回复。今年8月,来自海南的王宇(化名)通过分期乐APP贷款了4000余元用于日常消费,贷款期限为6个月,从2025年8月6日至2026年2月15日,按月分期归还。其合同显示,借款年利率为6.8%,资金方为亿联银行,年化综合成本为36%,其中担保费用400余元,担保方为深圳某融资担保公司。据王宇介绍,其还是学生的时候,就接触到了分期乐,之前也有从该平台贷款。在看到新出台的“助贷新规”对于利率上限24%的相关规定后,王宇多次联系分期乐客服,希望将存续贷款合同中24%~36%的区间利息减免。不过,他的诉求同样未得到回应。针对存续贷款合同利率超过24%的利息部分,是否可以在助贷新规后减免等问题,时代周报记者咨询了某消费金融公司,其工作人员表示,目前所在平台的利息都已降至24%以下,并不了解新规之后利率能否调整。恒都律师事务所律师刘琪晴向时代周报记者表示,最高法院司法解释明确规定,金融借款合同的借款人以贷款人同时主张的利息、复利、罚息、违约金和其他费用过高,显著背离实际损失为由,请求对总计超过年化利率24%的部分予以调减的,应当支持。但在实际案件中,不能理解为全部融资费用均为不合理费用。法院会从司法口径认定总体年化利率,区别融资合理费用和应当调减的不合理费用。微众银行合作机构超380家,多家国有大行尚未披露名单时代周报记者注意到,目前仍有多家银行尚未公布助贷“白名单”。某国有大行相关人士向时代周报记者表示,目前“白名单”暂未披露。时代周报记者查询多家国有大行官网,尚未发现公示“白名单”。从银行已公布的白名单来看,头部互联网公司和持牌消金公司出现频率较高,如蚂蚁、抖音、美团、京东、度小满等,部分民营银行如微众银行、网商银行、新网银行,财险公司如大地财险、阳光财险、众安在线、平安财险也多次出现,另外还包括数量众多的担保公司。据时代周报记者不完全统计,目前已有至少6家股份行、6家城商行、4家农商行、13家民营银行、5家外资行公布了“白名单”。其中,民营银行中,微众银行的助贷合作机构数量最多,达到382家,包括18家营销获客机构、44家担保增信机构及320家催收机构。不过,微众银行的合作机构并不包括互联网大厂,而是纳入了太平金融、华为、金蝶等机构。值得注意的是,外资行富邦华一银行的助贷合作机构达到52家,除了大型互联网助贷平台以外,其还合作了多家不常见的助贷机构,如哈啰普惠、微博、得物、唯品会等旗下的平台。据艾瑞咨询发布的《2025年中国网络助贷行业研究报告》,2024年互金助贷行业5家头部平台(蚂蚁、字节、京东、度小满、美团)的助贷余额市占率达到76%。按照信贷余额规模分级,其中超过3000亿元的综合型互联网平台为第一梯队,包括蚂蚁、字节、京东;第二梯队信贷余额在1500亿~3000亿元之间,为有金融场景的流量平台,包括度小满、美团金融、乐信等;第三梯队为头部独立金融科技平台,信贷余额在500亿~1500亿之间,包括奇富科技、信也科技、嘉银科技、小赢科技等。在网络助贷产业链中,互联网平台主要是作为获客和风控的助贷平台,而银行、信托以及消金公司为资金放款方,众多的担保公司以及财险公司则是作为增信机构,为贷款提供融资担保或者保证保险。另外还有征信机构、数据服务商、技术服务商、催收机构等为助贷行业提供支撑。博通咨询首席分析师王蓬博对时代周报记者表示,从目前披露的名单来看,合作明显往蚂蚁、京东、微众、美团这些大平台集中,说明整个助贷行业已经过了野蛮生长阶段,进入强者恒强的生态竞争时代,流量、数据、场景都掌握在头部手里,未来格局就是几个大平台对接众多的银行资金,形成平台主导、银行出钱、共担风险的稳定格局。董希淼向时代周报记者表示,金融机构需要真正树立“风险定价能力”为核心竞争力,抓紧完善制度与协议,修订内部管理制度和与合作机构的所有协议,确保完全符合新规要求,特别是总行(总公司)集中管理、名单制、费用透明、自主风控等。 -
HuggingChat Omni 集成式 AI 平台发布 IT之家 10 月 18 日消息,Hugging Face 现已推出 HuggingChat Omni 集成式 AI 平台,号称可从超过 100 个开源模型中为每条用户指令自动选择最合适的模型,系统会根据任务需求,智能挑选最快、最经济或最匹配的模型,目前模型库中已收录 GPT-OSS、Qwen、Deepseek、Kimi、SmolLM 等产品。据介绍,HuggingChat Omni 的模型分类系统基于 Katanemo 的 Arch-Router-1.5B 构建而成,可根据用户语义,智能调用不同主题和操作类型模型。Arch-Router 声称相应模型在匹配人类偏好方面表现优于业界竞屏,并完全开源,便于开发者测试及学习。 Hugging Face 联合创始人 Clément Delangue 表示,当下 HuggingChat Omni“仅仅是个开始”,目前 Hugging Face 平台已收录 200 万个开源模型,涵盖文本、图像、音频、视频、生物学、化学、时间序列等多个领域,后续平台将进一步利用自身优势,充分完善 HuggingChat Omni。 -
GPT-6要「活」了?MIT新作曝光,AI「自进化」不远了 新智元报道编辑:元宇【新智元导读】麻省理工学院最新研究预示着人类距离能够自主学习的AI又迈出了关键一步。该研究推出了一种全新的自适应大模型框架「SEAL」,让模型从「被动学习者」变为「主动进化者」。人类距离能够自主学习的AI又迈出了关键一步!GPT-6是否有望成为第一个具备自主学习能力的大模型? 论文地址:https://arxiv.org/pdf/2506.10943近日,麻省理工学院(MIT)提出了一种「自适应大语言模型(SEAL)」的框架,使大模型能够具备自我调整与持续优化等能力。 网友VraserX在推荐这篇论文时,称未来发布的GPT-6可能不仅更聪明,而且它还可能「活着」(在计算意义上)。SEAL架构可以让模型实时从新数据中学习、自我修复退化的知识、在多次会话之间形成持久的记忆……所以如果GPT-6整合了SEAL这些能力,它将成为一个能随时适应世界变化的模型,一个每天都在变得更好的系统。这可能标志着自主学习AI的诞生,宣告冻结权重时代的终结。 社交媒体资料显示,该论文作者之一的Ekin Akyürek在OpenAI工作,印证了网友VraserX关于「该论文部分作者现在在OpenAI工作的说法」。这意味着GPT-6未来有可能成为首批采用SEAL框架的前沿大模型之一。「自我编辑」让大模型产生「自适应」能力大模型的功能虽然强大,但这种强大往往是「静态」的,无法根据新任务、新知识或新样本而自动更新。在SEAL框架下,当大模型遇到一个新输入时,它会进行一次自我编辑(self-edit),生成一段文本,内容可能是怎样重组已有信息、优化超参数,或调用什么工具来增强数据、更新模型。然后,通过监督式微调(SFT),这些「自我编辑」会带来持久的权重更新,从而让模型具备长期适应能力。为了训练模型这种「自我编辑」能力,研究人员用强化学习(RL)构建了一个闭环系统:模型更新后在下游任务中的表现,会被当作奖励信号,改进其后续的「自我编辑」策略。与以往那些额外加适配模块或辅助网络的方法不同,SEAL直接让模型用自己的生成结果来控制它的学习方式。这一机制使模型摆脱了以往「填鸭教育」的模式,让它更像一个主动学习者。 为了改善大模型的适应性,研究人员主张赋予LLM在面对新输入时生成自己的训练数据与微调指令的能力。具体来说,是通过强化学习算法,训练 LLM 生成「自我编辑」(self-edits)——以自然语言指令的形式,指定用于更新模型权重的数据,并可选地给出优化超参数(如图 1)。研究人员将这种具备「自我编辑」能力的模型称为自适应 LLM(SEAL)。通过知识整合、少样本学习任务来验证SEAL的效果,研究人员发现SEAL可以让大模型具备自我适应的潜力,朝着自我进化的方向前进。与SEAL相关的研究1.合成数据合成数据在训练大模型时越来越常见,SEAL也是在这条思路上发展起来的。但不同的是,以往的生成策略大多依赖人工调参或固定规则,而SEAL使用强化学习来自动优化生成策略,让模型能够生成在后续训练中真正可以提升下游任务表现的数据。2. 知识整合近来的多项工作尝试通过权重更新来修改或注入事实性知识,SEAL主张通过上下文来生成额外的微调数据,并在此基础上通过强化学习让模型学会生成更优的微调数据。3. 测试时训练「测试时训练」(Test-Time Training, TTT)指的是模型在推理时根据输入动态更新部分权重,从而适应新任务。研究发现,将TTT与上下文学习结合,可以在小样本条件下表现更好。SEAL的内部优化过程可以看作一种改进版的 TTT:它多次生成并更新权重,奖励那些带来最大性能提升的数据生成策略。4.强化学习强化学习在提升大语言模型性能方面已被证明非常有效。SEAL的创新之处在于它不是用RL来优化最终答案,而是用来训练模型如何生成那些能用于自我更新的数据。SEAL 的核心思想是「元学习」——也就是让模型学会如何更好地学习,其优势在于直接利用模型已有的生成能力来决定参数更新方式,从而具备更强的通用性。5. 自我提升近年来,许多研究开始探索模型如何自我提升。比如,RLAIF 或自奖励语言模型让模型自己评估并奖励自己的输出,从而改进表现。也有方法通过模型的置信度或多数投票来指导强化学习。但这些方法往往受限于模型当前的自我评估能力。SEAL的做法不同:它把「自我提升」看作与外部数据交互的过程。通过强化学习,SEAL学会如何最有效地利用这些外部数据,真正实现自我改进。不直接教模型做任务而是教它怎样更有效地学习在SEAL中,模型会根据输入上下文(例如一段知识或几个示例)生成一段合成数据,这段数据就叫「自我编辑」,然后模型再用这段数据微调自己。整个生成过程通过强化学习训练而来,随着训练推进,它就逐渐学会生成更有用的编辑。因此,SEAL可以被解释为包含两层循环的算法: 外层循环用强化学习来优化「生成怎样的自我编辑」; 内层循环则用生成的自我编辑微调模型,让模型真正变得更强。 从这点来看,SEAL是一种元学习方法:它不是直接教模型做任务,而是教模型怎样更有效地学习。研究人员在知识整合与少样本学习两个领域对SEAL能力进行验证。知识整合 实例的目标是高效地将段落中提供的信息整合到模型权重中。图2显示了SEAL在知识整合任务中的工作流程,包括Passage(输入段落)、Self-Edit(自我编辑)、Evaluation(评估)。少样本学习 图3显示了SEAL在少样本学习任务中的工作原理,包括Few-Shot Examples(少样本示例)、Self-Edit(自我编辑)阶段、SFT(监督微调)、Evaluation(评估)。 在该项实例中,研究人员通过Llama-3.2-1B-Instruct 进行实验,并与ICL(上下文学习)、TTT + 自我编辑、Oracle TTT等基线进行对比,结果如表1所示:SEAL显著提升了适配成功率达到了72.5%,但其表现仍低于Oracle TTT,说明仍有改进空间。据预测,到了2028年,前沿大模型将在所有公开可用的人类生成文本上完成训练。那时大模型的进步就不再依赖更多人类数据,而要靠自己创造新的学习材料——也就是要学会自身生成、提炼、改进知识。在这样的趋势下,SEAL展示了一种新的可能:大模型在预训练后可以通过生成自己的合成自我编辑数据,并以轻量的权重更新来应用它们,使模型可以自主整合新知识、适应新任务。研究人员希望将能SEAL扩展到更广泛的领域——包括预训练、持续学习和智能体系统,最终让大模型可以在一个数据有限的世界中,真正实现自我学习与自我成长。虽然在测试中,SEAL仍会出现「灾难性遗忘」的问题,还存在着诸多局限,但SEAL的提出仍为未来前沿大模型实现自主学习、自进化提供了一条值得期待的新路径。也许未来在GPT-6上,我们就能看到这种自主学习的能力。参考资料: https://www.wired.com/story/this-ai-model-never-stops-learning/%20https://arxiv.org/abs/2506.10943