找到
898
篇与
互联网
相关的结果
- 第 31 页
-
地平线苏箐:3年后 准L4级系统大概率已经量产 版权声明:本文版权为网易汽车所有,转载请注明出处。 网易汽车12月9日报道 2024年,智能驾驶发生重构式变化,今后3年,这种重构会变成常态吗? 在2025地平线技术生态大会上,地平线副总裁&首席架构师苏箐给出判断,大概率不会。每二三十年,人工智能的发展会出现一个轮回,经过二三十年的积累形成新范式,兑现后又会遇到天花板。“我认为,未来3年行业将聚焦现有系统极致优化,而非理论内核的重构,大家要做好过苦日子的准备。” 重构式变化的原因在于,智能驾驶的技术内核在2024年经历了从rule-based到data-driven的一跃。这一次重构,本质上是深度学习领域最近几年积累的全部功力的一次集中释放与兑现,引爆了从量变到质变的临界点突破。可以说,是2024年特斯拉推出的FSD V12,让大家看到了希望,就像第一颗原子弹的威力大小不重要,重要的是证明了这件事能成。 “若想再有巨大的内核重构,就需要理论层面的突破,而目前尚未看到下一个理论突破的前置信号,即便出现,也可能需要5年、10年甚至20年才能落地。” 随着FSD、HSD这类城区辅助驾驶系统成熟,过去泾渭分明的L2与L4“两个世界”,如今已被打通。因此,苏箐揭示出一条清晰的AD产业发展路线:在经历城区L2系统大规模普及的关键大节点之后,随后会经历作为短暂过渡的小节点L3,最终迎来极低成本部署、可快速区域扩张的L4,届时将同时以乘用车和Robotaxi双形态落地。 这条连续、可兑现的路径,大概率将是未来AD产业发展的核心叙事。 而假设AI/AGI的理论,在未来3-5年没有全新的突破,产业进入技巧型优化演进状态,那我们需要做些什么? 苏箐表示,Scaling Law(规模定律)在AD领域刚刚开始,未来地平线将推动每代AD产品实现10倍算力提升,支撑10倍参数规模的系统进化,持续释放规模性能的潜力。“玩命堆算力就是计算机工业里最核心的基因和逻辑,任何时候不要违背这件事做事,所以我们会持续10倍提升算力和模型容量。” 与此同时,地平线也将以统一的底层技术范式,重投入城区L2与L4两大关键节点,并持续强化工程体系与组织能力建设,构建起持续优化演进的核心能力。 他提到,目前,HSD城区辅助驾驶系统还只是第一个版本,未来两到三年一定会在体验上发生质的飞跃,并期待在未来几年,把L4级别的车以同样价格,在用户无感的情况下送到用户手上。3年以后的车,大概率就会搭载准L4辅助驾驶系统。 对于是否还抑郁的问题,他坦言,前段时间交付时比较抑郁,整个交付测试的团队压力都很大。 “能在这么短的时间内把这些问题解决掉,靠的是我们的工程团队——不是我本人,是我们的工程团队确实非常辛苦,也非常给力。平时我骂过他们很多,也给了他们很大压力,但还是要很感谢他们,他们是业内很了不起的一帮人。” 未来几年,人们将开始以人类标准重新看待HSD系统。“等把这些问题搞定,这个系统可能就真的比较像人了,但这些问题极其难。我们看到了希望,也知道必须解决,只是今天还没有非常清晰的答案。” -
谷歌官宣AI眼镜定档2026,外媒体验后惊呼 作者 | 辰辰 出品 | 网易科技 “这才是AI眼镜该有的样子。” 这是外媒在体验了谷歌最新工程样机后,给出的评价。 这种认可来之不易。十年前,Google Glass因为怪异和昂贵沦为笑柄;十年后,眼看Meta联手雷朋把智能眼镜卖到断货,谷歌终于坐不住了。 本周一,谷歌正式宣告强势回归:计划于2026年推出首款AI眼镜,并拉来三星、Warby Parker等巨头组成“复仇者联盟”。资本市场随之沸腾——消息一出,合作伙伴Warby Parker股价飙涨近14%。 这一次,谷歌彻底摒弃了极客的傲慢,带来了Gemini加持的“实用主义”:看着街道就能弹出导航,盯着菜单就能实时翻译。谷歌用行动证明:眼镜不该是手机的累赘,而应是解放双手的“最强辅助”。 1. 双线并进:音频版与显示版齐发 根据谷歌官方博客及合作伙伴Warby Parker的披露,2026年面世的产品线将非常丰富,主打“实用主义”与“时尚感”的结合。 谷歌计划推出两种不同类别的智能眼镜: (图片由AI生成)· 音频眼镜(Audio-only): 没有屏幕,主打轻便。不妨将其视为“戴在鼻子上的耳机”,核心功能是让用户直接通过语音与Gemini AI 助手对话、听音乐或者打电话。 · 显示眼镜(In-lens display): 这款产品更具科技感,配备了镜片内嵌显示屏,形态与目前Meta的雷朋智能眼镜很像。虽然具体的款式尚未完全公开,但功能极具科幻感:导航指引、实时语言翻译字幕等信息将直接悬浮在用户眼前。 在今年5月份举行的I/O 大会上,谷歌首次公布了与智能眼镜厂商Xreal 合作开发一款代号为“Project Aura”的设备。周一的活动则带来了更多体验和使用上的细节。这款原型机运行Android XR系统,拥有70度的视场角;支持与三星头显相同的手势交互,并采用了比目前产品线更具沉浸感的透视设计。 外媒体验后反馈,沉浸感比市面上的轻量级AR眼镜更强,但需要像三星Galaxy XR头显那样外挂电池包。 2. 上手实测:这才是AI眼镜该有的样子 在发布会前的闭门演示中,外媒抢先体验了多款原型机。实测反馈最一致的观点是:谷歌终于想明白了,眼镜不该是手机的累赘,而是手机的延伸。 为了保持眼镜的轻便性,让其看起来更像普通眼镜,大部分计算处理依然依赖手机,但体验却有很大提升。 ——地图导航:低头有惊喜。 这可能是最打动路痴的功能。当用户佩戴显示版眼镜使用谷歌地图时,视野前方会出现箭头指引方向。但这还不是全部——当用户稍稍低头时,眼镜还会展示当前位置的俯瞰地图和指南针。这比拿着手机一边看屏幕一边找路要直观得多,完全解放了双手。——实时翻译:打破语言墙 用户可以选择让眼镜将对话实时转化为字幕显示在镜片上,也可以选择关闭屏幕,只听语音翻译。这种“此时无声胜有声”的交互,在跨语言社交中极其实用。——Gemini 加持:看图识物 在AI 体验环节,谷歌展现了内置Gemini 的强大多模态能力。比如用户可以看着书架问“这个系列的书我需要读其他几本吗”,或者盯着超市货架问“这辣椒辣不辣”。这种常规的“看图识物”对谷歌Gemini来说都不在话下。谷歌联合创始人谢尔盖·布林(Sergey Brin)曾在今年5月坦言,谷歌汲取了很多教训。他表示:“在当下的AI时代,这些眼镜能在不分散你注意力的情况下提供巨大的帮助,这种能力比过去强太多了。” 演示中还展示了代号为“Nano Banana Pro”的生成式模型。 现场实测显示,用户只需拍一张环境照片并说出指令,眼前画面瞬间就能变成“北极风格”。这种无需手机App介入的实时视觉重构虽然效果震撼,但也让不少媒体对其潜在的隐私和造假风险表示担忧。 3. Android XR:谷歌的真正杀手锏 (图片由AI生成)硬件只是躯壳,系统才是灵魂。这次所有的新品都将基于Android XR操作系统。 谷歌显然想做AI穿戴时代的“安卓盟主”。Android XR不仅支持谷歌自家的眼镜,还开放给三星、Xreal等合作伙伴。 谷歌这次也并未遗忘刚发布的三星Galaxy XR 头显。针对用户吐槽的痛点,谷歌迅速推出了几个重磅更新: · 旅行模式(Travel Mode): 解决了在汽车或飞机上使用XR设备时窗口“乱飞”的问题,现在用户可以稳稳地在旅途中看巨幕电影。 · PC互联(PC Connect): 支持将 Windows 电脑画面投屏到头显中(macOS 版本也在开发中),甚至支持玩游戏,直接对标苹果Vision Pro的Mac虚拟显示功能。 · 拟真化身(Likeness): 告别卡通形象,新的 Avatar 系统能通过手机扫描生成极具真实感的人物形象,连面部微表情和手势都能还原。 4. 剑指Meta:夺回失去的十年 谷歌此举的战略意图非常明显:不能让Meta一家独大。 Meta与雷朋合作的智能眼镜销量火爆,甚至被视为AI穿戴领域的标杆产品。Meta也于今年9月发布了自己的显示眼镜,并在随后展示了代号为Orion的全息AR眼镜。此外,Snap、阿里巴巴以及苹果都在对这一市场虎视眈眈。 科技博主/分析师@william_R2Rclub认为,谷歌这次重返AI眼镜市场或将重塑可穿戴设备格局,并吸引更多用户加入其生态系统。 谷歌Android XR产品管理总监贾斯顿·佩恩(Juston Payne)表示:“如果你回顾谷歌和行业内许多公司的发展,你会发现这总是关于扩展新的计算平台。” 谷歌坦承,智能眼镜在短期内不会取代智能手机,但他们希望通过Gemini和Android XR,让用户减少“每隔几秒钟就掏一次手机”的频率。 (图片由AI生成)2013年的 Google Glass 输在了太超前,而2026年的谷歌 AI 眼镜则面临着 Meta 等强敌的贴身肉搏。谷歌坦承这不会立即取代手机,但它所构建的“Gemini+Android XR”生态,或许正是通往下一代计算平台的门票。 究竟是重蹈覆辙还是成功雪耻? 2026年,我们拭目以待。 -
AI眼镜大战升温!谷歌(GOOGL.US)首款产品搭载Gemini明年硬撼Meta(META.US)、苹果(AAPL.US) 智通财经APP获悉,Alphabet旗下谷歌(GOOGL.US)表示,其正在致力于打造两类不同的人工智能智能眼镜,以在明年与Meta Platforms(META.US)的现有型号竞争:一类配备屏幕,另一类主打音频功能。公司在周一的博文中表示,其合作开发的首批AI眼镜将在2026年某个时间推出。三星电子、Warby Parker(WRBY.US)和Gentle Monster是其早期的硬件合作伙伴,但这些公司尚未展示任何最终设计。谷歌还概述了即将应用于三星Galaxy XR头显的多项软件改进,包括一种"旅行模式",该模式将允许该混合现实设备在汽车和飞机上使用。在AI和增强现实(AR)眼镜这一新兴类别中,竞争正在升温。Meta公司一直是该领域最活跃的参与者。它以Ray-Ban和Oakley品牌销售价格相对亲民的眼镜,并获得了积极评价和不俗的销量,公司最近还推出了一款价格更高、集成显示屏的型号。Snap Inc.(SNAP.US)的首款面向消费者的AR眼镜也计划于明年亮相,而苹果公司(AAPL.US)也计划在大致相同的时间进军该领域。对谷歌而言,这些新产品,以及其新的Android XR操作系统,代表着与"谷歌眼镜"相比更为精炼、更有规划的策略。在谷歌纽约市办公室的一次演示中,公司呈现了几款不同的AI眼镜原型,以及谷歌与Xreal合作开发的代号为"Aura项目"的眼镜早期样品。与Meta广受欢迎的Ray-Bans类似,这些眼镜大多通过无线方式连接到智能手机,并依赖手机来处理请求,无论是要求谷歌的Gemini AI助手播放YouTube Music上的歌曲,还是分析面前的食材以生成食谱。让手机承担大部分繁重计算任务,使得这些眼镜能够做到足够纤薄轻便,看起来像普通眼镜。在周一发布前的上手演示中,公司演示了两款不同的内置显示屏智能眼镜原型:一款是单目眼镜,即右镜片内置单个屏幕;另一款是双目眼镜,每只眼睛前各有一个显示屏。两种类型都支持为谷歌地图和Google Meet等应用提供增强现实叠加界面,但双目设计能提供更大的虚拟显示屏。"我们希望让您能根据需求,在重量、款式和沉浸感之间找到合适的平衡,"该公司在博客文章中表示。该公司的目标是让尽可能多的软件体验在两种格式上都表现良好。用户在使用实时翻译功能时,可以在屏幕上显示对话的字幕,也可以关闭显示屏,专注于通过扬声器传出的翻译。显示屏尤其具有优势。在使用谷歌地图时,其可能性远不止增强现实的逐向导航。用户可以向下看,获得当前位置更大的俯视地图,并附带显示所面对方向的指南针。当拍摄一张照片并要求Gemini使用谷歌的Nano Banana Pro生成式AI模型进行美化时,无需掏出手机就能预览最终结果。与Xreal合作的眼镜独特之处在于它是独立的体验:Aura项目像三星头显一样运行Android XR系统,但外形更时尚,类似于该公司的其他眼镜,包括One Pro。与Galaxy XR类似,Aura项目必须始终连接外部电池包才能工作。这款眼镜将提供70度的视场角,比Xreal目前的系列更具沉浸感。在Aura项目中的导航感觉熟悉且直观,因为它使用了与三星头显相同的手部追踪技术,尽管摄像头数量较少。Galaxy XR的改进谷歌和三星正在针对售价1800美元的Galaxy XR头显的早期反馈做出反应,引入了一些用户和评测者一直在要求的功能。其中之一是即将推出的"旅行模式",使在移动中使用XR设备变得更加容易。此前,在汽车或飞机上时,虚拟窗口会从使用者身边飞过,这使得在飞机上看电影变得异常困难。 谷歌还将发布一款PC Connect应用,允许任何Windows PC连接到Galaxy XR,并在虚拟环境中镜像其笔记本电脑屏幕。该应用目前处于测试阶段,也可用于游戏,这可能极大地拓宽该头显的吸引力。这相比发布初期的情况是一个改进,当时客户需要使用三星自家的Galaxy Book笔记本电脑才能使用虚拟桌面模式。谷歌表示,也正在开发macOS版本。此外,谷歌正在推出一种新的"拟真"虚拟形象风格,比三星卡通化的设计更为逼真。借助智能手机应用的帮助,Galaxy XR用户将能够扫描自己的面部,在视频通话中获得一个精确的自我形象代表。拟真形象可以模仿面部动作和手势。与PC Connect应用一样,此功能将以测试版推出。两者都将从本周开始提供。 -
大厂禁用Cursor,程序员回归“手搓时代”? 文 | 超聚焦又一家大厂,建起了自己的代码防火墙。近日,据鞭牛士报道,相关人士爆料称,快手的研发线发布通知,对几款第三方编程软件收紧了使用权限。不少同学发现,只要在自己办公电脑上点开Cursor,它就直接闪退,根本用不了。这导致一些早已将AI编程工具深度融入日常开发流程的工程师措手不及。主力辅助工具的突然失效,不仅打断了高度自动化的编码节奏,也让许多原本由AI即时补全或生成的环节被迫回归手动操作,整体开发效率明显下滑。原本几分钟就能自动生成的模板代码,现在又得手动敲;原本靠自然语言描述就能完成的函数逻辑,如今不得不重新翻文档、查API。效率断崖式下跌,工作流被打断,甚至员工调侃:“没Cursor的日子,我连Hello World都写不顺了。”而这其实并非孤例。在过去两年中AI工具从“新奇玩具”迅速演变为“开发标配”的过程中,越来越多技术团队开始面临一个两难命题:一边是肉眼可见的效率跃升,一边是难以量化的安全隐忧。当一行由远程模型生成的代码可能携带着未知的数据回传、训练偏见甚至知识产权瑕疵,企业不得不重新评估——所谓“智能辅助”,边界究竟该划在哪里?那么,类似的情况在其他大厂是否也已出现?这样的“代码防火墙”,究竟是未雨绸缪的安全防线,还是因噎废食的过度防御?其背后的考量、潜在的风险与实际收益,又该如何权衡?01 字节微软亚马逊, 选择牺牲效率要安全? 事实上,对代码与数据安全的警惕,并非AI时代才有的新课题,早在大模型尚未渗透进开发流程的年代,企业就已建立起层层防护机制。事实上,对代码与数据安全的警惕,并非AI时代才有的新课题。早在大模型尚未渗透进开发流程的年代,企业就已建立起层层防护机制,其核心目标之一,正是防止敏感代码和业务逻辑通过开发工具或外部服务意外外泄。上世纪末至2000年代初,随着开源协作和远程开发逐渐普及,企业开始严格限制开发者使用未经审核的第三方IDE插件、脚本工具或远程调试服务。彼时的管控逻辑很简单:任何可能将本地代码上传至外部服务器的行为,都被视为潜在的数据泄露风险。于是,“禁止使用非官方插件”“禁用自动错误上报”“关闭远程日志回传”等策略,成为大型科技公司研发安全基线的一部分。进入云时代后,这一原则并未松动,反而更加制度化。即便是在广泛采用GitHub、GitLab等平台的今天,许多企业仍强制要求私有仓库隔离、代码提交审计,甚至对剪贴板操作、屏幕共享等行为进行监控,目的只有一个:确保核心代码不出内网。而如今,当Cursor、Copilot这类AI编程工具默认将用户输入发送至云端模型进行推理时,它们本质上触发了同一套安全警报机制:你写的每一行注释、每一段未提交的草稿,都可能在不经意间离开企业边界。正因如此,快手此次对AI编程工具的限制,其实是行业集体转向的一个缩影。当“代码即资产”的认知深入人心,任何可能将未公开代码片段上传至外部模型的行为,都会被安全团队视为不可接受的风险敞口。事实上,在过去一年中,多家科技巨头已悄然收紧对第三方AI开发工具的管控,甚至不惜以牺牲短期效率为代价,也要守住数据主权的底线。字节是最早采取系统性措施的公司之一。5月28日,其安全与风控部门向全体员工发送邮件,明确指出:“为防范潜在的数据泄露风险”,自6月30日起,将在内部分批次禁用包括Cursor、Windsurf在内的第三方AI编程软件。与此同时,字节大力推广其自研的智能编程助手Trae,要求研发团队逐步迁移至该内部工具。这一举措不仅切断了外部模型对内部代码的“窥探”路径,也标志着其在AI辅助开发领域加速构建技术闭环。几乎在同一时间,微软也在政策层面划下红线。9月,在一场国会听证会上,公司副董事长兼总裁布拉德·史密斯公开表示,微软已全面禁止员工使用DeepSeek相关应用。“我们不允许任何未经审查的AI服务接触公司代码库,”他强调,“这不仅关乎知识产权,更涉及客户信任。”除去国别因素外,北美的不同企业间也在相互“提防”。据路透社报道,亚马逊近期向工程师发布内部备忘录,要求优先使用自研AI编码工具「Kiro」,并明确表示将不再支持任何新增的第三方AI开发工具接入开发环境。这意味着,包括OpenAI的Codex、Anthropic的Claude Code,以及广受开发者欢迎的Cursor等工具,均被排除在官方推荐列表之外。备忘录特别指出:“所有代码生成行为必须发生在可控、可审计的内部系统中。”而除了这些互联网企业之外,一些本就注重数据安全的老牌大厂就更不用说了。譬如位于深圳的ICT、计算头部企业,也一直秉持着内部信息不上网的要求,任何向外部网络上传文件的行为也都被从底层程序上禁止。如今,用自家的AI产品写自家的代码,已不再是某一家公司的临时策略,而正在成为行业默认的生存法则。在这个代码即竞争力、模型即风险源的时代,所有规模较大的企业,宁可牺牲显著的开发效率,也要确保代码与数据的安全。02 低效率和不安全, 企业更怕哪个? 然而,当大厂们纷纷筑起代码高墙,另一股声音也在员工之间不断回响:过度封锁是否正在扼杀创新?在AI重构软件工程范式的今天,拒绝高效工具或许能守住数据,却也可能让企业错失生产力跃迁的关键窗口。作为这轮AI浪潮中收益最大的企业,英伟达CEO黄仁勋始终强调AI对生产力的根本性提升,并在三季度公布历史最高的570亿美元季度营收后,给员工们下达了一条“AI时代的职场铁律”:“只要一项任务可以被AI自动化,就应该 AI自动化。为什么不呢?”而他对于那些不鼓励员工们使用AI的管理者也提出了罕见的强烈质疑:“你们疯了吗?”在黄仁勋看来,AI工具带来的效率提升并非边际效应,而是指数级的。在如今竞争白热化的技术领域,任何对外部高效工具的系统性禁用,都可能使企业在人才吸引力和项目交付速度上全面落后。这种生产力与安全之间的矛盾,在国内大厂的研发一线体现得尤为尖锐。当外部的Cursor、Copilot等工具因安全顾虑被一刀切地禁用后,许多工程师被迫转而使用公司自研的内部替代品。然而,这些内部工具的表现往往不尽如人意。一位来自某大型电商平台的资深后端工程师Leo在交流中向我们表示,他所在的团队已完全切换至内部AI助手,但体验非常糟糕:“以前用Cursor写注释,它能直接给我生成一个80%可用的函数体。现在这个内部的工具,经常给我的建议都是错的,而且是在我写到一半时才弹出来,反而干扰思路。我现在最大的痛苦就是,明明知道外面有更好用的‘武器’,但却被要求用一把‘生锈的刀’。 效率下降是实实在在的。”这种对内部工具的“吐槽”,在技术社区中形成了大量共鸣。一个程序员群体中流传的经典笑话,正是对这种低效辅助的无奈写照:“如果一个函数你写了90%,剩下10%让国内的AI编程应用补,它能给你把前面90%的代码全部改错。”更令人啼笑皆非的是,随着程序员与这些尚不成熟的AI助手磨合,他们与机器的“对话”模式也开始变得反常和充满怨气。我们从一张流传于技术圈内的“Top 20 AI Prompt编程语言”榜单中,可以看到这种独特的“黑色幽默”。这张榜单并非传统意义上的编程语言,而是程序员在与AI编程工具交互时,最常说出的“提问”和“指令”——实际上更像是抱怨和请求。 程序员吐槽从榜单中可以看出,除了排名第一的“给我生成完整可运行的代码”是正常需求外,大量高频指令如“别又给我生成一个TODO”、“这个错误你上次就犯过”、以及直白的“你这代码根本编译不过”,都揭示了程序员对某些AI工具低效、重复犯错和缺乏上下文理解的强烈不满。这些“提示词”本质上是在对AI进行“纠错”和“调教”,而非顺畅的协作。对于习惯了Copilot和Cursor等工具高召回率和上下文理解能力的工程师来说,这种体验无异于降维打击。因此,许多工程师认为,在当前阶段,一味地追求“绝对安全”而禁用外部顶尖工具,是在用看得见的效率损失,去换取看不见的、概率极低的潜在数据风险。安全固然是底线,但如果技术团队因此失去了30%甚至更高的开发效率,导致产品迭代速度放缓,最终损害的还是企业的核心竞争力。在AI浪潮席卷开发领域的今天,代码安全已成为所有科技巨头必须守住的“第一性原理”。从历史遗留的安全基线,到自研工具的技术闭环,大厂们正以前所未有的速度筑起“代码防火墙”。然而,墙内墙外的AI效率鸿沟,也真实地将工程师们困在了“既要安全,又怕落后”的两难境地。是继续使用相对低效的内部工具,忍受工程师的抱怨和生产力的折损,以确保代码的绝对主权?还是在审慎评估风险后,探索更安全的外部工具部署方式,拥抱全球最前沿的生产力跃迁?这场关于数据主权和技术效率的博弈,最终的裁决权,交给了大厂自己。但可以确定的是,在AI重塑软件工程的时代,安全策略本身,也需要一场智能化的升级。 -
苹果高管及AI人才大量流失,人事动荡持续 苹果近期经历剧烈人事动荡。过去一周内,四位直接向CEO蒂姆·库克汇报的高管离职或即将离职,包括人工智能负责人约翰·詹南德雷亚、用户界面设计负责人艾伦·戴伊、总法律顾问凯特·亚当斯和负责环境、政策及社会倡议的副总裁丽莎·杰克逊。此外,苹果芯片业务掌舵人约翰尼·斯鲁吉也在考虑离开,若其离开,将对苹果核心竞争力造成沉重打击。斯鲁吉主导了苹果从英特尔芯片向自研Apple Silicon的转型,M系列芯片和A系列处理器都离不开他的团队。今年7月,曾被视为库克接班人的首席运营官杰夫·威廉斯宣布退休,8月首席财务官卢卡·马埃斯特里也退居二线。这场人事变动被多个媒体称为“自史蒂夫·乔布斯2011年去世以来最大的领导层重组”。离职的高管各有原因,詹南德雷亚加入苹果后,Siri表现未达预期,苹果在生成式人工智能领域落后,Apple Intelligence平台延期且功能不足。戴伊离开后,苹果内部对其接替者史蒂夫·勒梅感到欣喜。苹果AI团队人才流失严重,从7月开始,AI基础模型团队负责人庞若鸣离开加入Meta,此后十多位核心研究员离职,去向包括Meta、OpenAI等。《华尔街日报》发现,数十名苹果工程师和设计师转投OpenAI。人才外流的原因包括薪酬竞争和战略方向的摇摆迟缓,苹果否决了AI团队开源基础模型的提议,还计划大量使用外部模型来驱动Siri。目前,苹果正在加速为库克寻找接班人,硬件工程高级副总裁约翰·特纳斯被广泛视为最可能的继任者。苹果也在努力挽留斯鲁吉,但其是否留任仍不确定。苹果企业文化与AI研究主流文化存在差异,其在AI领域的落后和对自身AI能力的不自信,正在促使人才流向Meta、OpenAI等公司。 -
科技巨头加码端侧AI“英雄所见略同” 基金经理看好上游供应链率先受益 证券时报记者 赵梦桥在人工智能(AI)浪潮席卷全球的背景下,关于AI应用场景的探索也逐渐步入“深水区”。近期,科技巨头纷纷加码端侧硬件,标志着AI应用正从云端向终端设备快速延伸。而受益于算力爆发,端侧AI正凭借更快的响应速度以及更好的隐私保护重塑消费电子的业态。从端侧形态的演绎来看,多名基金经理认为,手机作为较成熟的应用,未来或仍是“第一载体”,当然AI眼镜也是具有潜力的品类之一。因此,辐射到投资端,端侧硬件品牌以及上游供应链或率先受益,此外系统交互、语音识别等关键环节亦有放量机遇。科技巨头加码端侧AI近期,海内外各大科技巨头动作频频。11月27日,阿里巴巴集团首款自研夸克AI眼镜正式发布,该产品深度整合千问大模型与阿里生态服务,具备导航、支付、AI问答等功能;12月1日,字节跳动联合中兴通讯推出搭载豆包手机助手技术预览版的努比亚M153工程样机并少量发售。国外方面,无论是OpenAI,还是谷歌等科技巨头,均有多款智能终端产品发布。华夏基金表示,这些巨头的集体行动并非盲目跟风,而是源于端侧AI清晰的盈利逻辑。比如,工业富联三季度净利润大增62%的业绩公告,揭开了产业链的盈利密码——AI服务器、智能硬件零部件的需求爆发,正让中国供应链企业直接受益。全球性企业增长咨询公司弗若斯特沙利文(Frost & Sullivan)预测,2029年,中国端侧AI市场将达到3077亿元,复合年增长率高达39.9%。与在“云端”完成计算不同,端侧AI指的是模型在终端设备运行,运算推理在设备本地完成,用户指令和数据并不会发向云端服务器。民生加银基金基金经理王悦认为,受制于端侧的运存能力,端侧AI模型一般参数量较小,只能完成轻量级任务;但其响应速度、隐私保护等好于云侧模型,且不依赖于网络连接。云侧AI的发展往往更注重复杂任务的完成能力、思考深度等,科技公司会聚焦模型的能力进行不断迭代和训练;而端侧AI更侧重于与硬件的配合,以尽可能低的功耗完成端侧的轻量级任务,更注重模型在端侧的适配程度和对APP的整合调用能力。“未来,二者将更偏向于协同关系。端侧负责处理用户的简单需求,包括调用APP接口等,并将用户的隐私数据留存在本地。而端侧无法处理的复杂需求,则由具备多模态和更好推理能力的云端模型完成,从而使得模型的使用效率更高,隐私也得到了更好的保护。”王悦表示。手机依然是“第一载体”尽管国内外科技巨头围绕端侧AI动作频频,但多集中在AI眼镜、AI音箱以及专属智能终端等产品之上。多名基金经理表示,作为第一流量入口,手机仍是端侧AI第一载体。王悦指出,从短期的推进度来看,手机仍然是逻辑上最通顺的应用场景:一是手机相较于智能眼镜等新品类,其硬件更为成熟,已是移动互联网时代的成熟载体,在使用体感上最为顺手;二是手机厂商具备和上游软件厂商合作的完整生态和模式,在推动端侧AI与软件的协同整合上速度最快;三是手机的下游用户群体最广、支付意愿最强,在商业化上最有希望快速跑通。诺德基金基金经理谢屹也持有类似观点,他说:“大模型的确可以嵌入不同的终端产品,目前来看可能手机还是相对更为合适的,它拥有较大的现成保有量和使用习惯,可以得到迅速普及。”谢屹认为,当前,手机在体积上较为适中,人机交互的方式也较多,技术路线和产业链也相对成熟。而智能眼镜可能需要较长的推广期,不过在特定场景上可能会更为合适,例如AR导航、实时拍摄、医疗辅助和健康监测等,它更可能创造出一些新的使用场景,而非直接替代手机。“当然,我们现在还很难直接判断端侧AI会和多少或哪些终端结合,这还需要我们时刻去跟踪产业的变化。”他说。华南某公募投研人士认为,从未来的形态演绎来看,端侧AI对于端侧产品的用法、能力的改变会非常大,因此厂商会在各种新形态之间进行持续探索,其中智能眼镜就是现阶段玩家们选择的一个最有潜力起量的品类。眼镜或是手机之后端侧落地起量最为顺畅的品类之一,但拉长时间轴来看,端侧品类的形态仍有很长的探索期。契合消费电子投资逻辑若将端侧AI的发展脉络辐射至资本市场,目前消费电子的投资逻辑或与其更契合。在王悦看来,端侧AI投资的核心维度还是看创新驱动的产业链价值变化,可以关注消费电子创新供应链的优质企业、具备配合客户共研新形态端侧硬件的组装厂以及端侧运存要求提高下可能受益的散热、存储、系统交互、语音识别等关键公司。“另外,也可以关注具备生态和品牌能力的终端厂商,它们一方面拥有资源和能力去推动自研的端侧大模型,另一方面有望延续移动互联网时代的品牌壁垒,在端侧AI时代获得先发优势。”王悦表示。前述华南某公募投研人士认为,端侧AI短期会先从硬件迎来产业创新,AI手机、智能眼镜等产品会逐步起量和加配,上游的供应链(整机组装、核心零部件)会率先受益。同时,终端的硬件品牌厂商也会在前期的投入探索后逐步找到新的商业化路径,带动端侧终端价值量和渗透率进一步提升。谢屹也表示,受益于端侧AI的产业链包括提供算力的上游芯片厂、提供传感器和其他基础部件的电子元器件和模组厂商,以及提供组装的代工企业。当然,定义产品的主机厂也十分重要。“在选择标的时,我们当前会比较倾向于主机厂,因为相对来说它们是最接近于消费者环节的,如果发展较好可能会很容易形成一定的品牌优势和市场认知。另外,代工环节也会相对好一些,虽然议价能力稍弱,但是能见度相对较高。总体上,上游元器件可能会有较大的波动,毕竟不同的技术路线会对其产生较大的影响。”谢屹称。景顺长城基金基金经理刘煜认为,未来的投资重点,除了关注算力增长,还要关注“如何让算力更高效、更人性化地服务于人”。“我们关注的不再是单一硬件或软件,而是‘脑—体—感’协同的生态系统。谁能更好定义人机交互新范式,谁能更精准捕捉情感陪伴等新兴需求,谁就能在未来的价值链中占据主导地位。”刘煜表示。产业并未进入泡沫化阶段年内的“科技热”行情,已将端侧AI的多只个股估值抬升到了数年来的高位,因此关于板块投资的“泡沫”之争近期也被频繁提及。“‘泡沫’的论调,更多是因为市场对于产业的发展缺乏足够的耐心。”王悦表示,一个新产品的出现,大都会经历较长的前期投入和用户心智培养,而投资不能抛开潜在收益只看短期回报。如果以当前端侧AI乃至整个AI的投入与回报做对比,那么净资产收益率(ROE)会非常差,但是参考移动互联网的“烧钱”大战,可以看到在确定性的产业趋势面前,供给侧完全可以忍受一段时间的投入,并在找到C端的需求偏好后通过快速的商业化回收前期成本。前述华南某公募投研人士也表示,当前,无论是手机大厂如苹果、三星、华为等,还是云厂商OpenAI、Meta、谷歌、亚马逊等,都在加速开发自身的端侧AI新品。云厂商们有动力将前期投到大模型上的成本找到商业化回收方式,手机厂商也需要快速提升自身的模型能力去应对云厂商对于硬件领域的竞争。未来,我们会看到较长时间各大玩家对端侧AI的持续投入,以构建自身的“护城河”。“因此,不能以简单的ROE思路去看待端侧AI的发展,产业现在并没有到泡沫化的阶段。”该人士说。谢屹则认为,需要对不同公司进行单独分析,如果是传统业务发展较好且叠加端侧AI新业务的公司,其估值泡沫可能会相对小一些,因为基本盘与盈利估值是相对匹配的。不过,那些原有主业较弱、新业务又尚未形成有利局面的公司,如果其股价已有大幅上升的情况,那么估值大概率会隐含一些泡沫。 -
天气预报装上“AI大脑” 深圳加速探索人工智能赋能精准气象预报,世界气象组织首个AI试点项目亚洲临近预报比对活动在深启动。 2025年3月深圳市气象局联合华为云发布人工智能区域集合预报模型“智霁”2.0。 十五运会闭幕式现场,气象台应用人工智能气象预报技术提供精细化气象保障服务。 12月7日,全国第十二届残疾人运动会暨第九届特殊奥林匹克运动会马拉松项目与2025年深圳马拉松比赛,先后在市民中心起跑。两项赛事史无前例地共用了一条比赛路线,统一配置医疗急救、志愿者服务、安全交通保障和气象服务等资源。 开赛前夕,竞赛指挥部MOC(赛事指挥中心)马拉松赛事气象专题页面上,赛道沿线近气象自动站和生物舒适度仪的实时数据和精细化预报,正一组组不断向赛事竞委会同步,为决策部门提供着赛事支持。这套经过全运会深港跨境马拉松检验的赛事气象服务“深圳方案”,正是深圳加快推动人工智能气象应用创新生态体系建设的生动实践之一。 实际上,深圳对于人工智能在气象预报领域的应用不只在于气象服务保障,更是从2017年就开始聚焦超大城市气象防灾减灾中,灾害性天气预报“报不早、发不快、说不清”等痛点问题,从顶层开始着手设计,以《深圳市加快推进气象高质量发展的若干措施》为指导、业务需求为引领,构建人工智能与气象深度融合的协同创新体系,通过联合创新研发“智霁”“智瞳”“阿福”等一系列AI气象预报服务核心技术,推动气象预报从“传统数值模式驱动”向“模式与智能并驾齐驱”跨越,显著提升了超大城市防灾减灾的智慧与底气。 构建“六个一”协同创新体系 打造气象AI新生态 气象预报,一直都被视为高性能计算的代表性领域。然而,面对近年来愈发极端的暴雨和快速变化的台风预报,传统数值模式预报在精准度和时效性上逐渐显露出“天花板效应”。如何在台风、暴雨频发,季风活跃的地区提高早期预警系统的准确性,支持“全民早期预警”倡议?深圳给出的答案是:打造人工智能+气象“六个一”协同创新体系,加快人工智能与气象的深度融合、技术研发和业务应用,为灾害性天气预报预警服务赋能增效。 今年的世界气象组织(WMO)第一个人工智能临近天气预报AINPP(试点)项目——亚洲临近预报比对活动启动会上,有专家指出,深圳不仅有着丰富的气候条件,还有很多在人工智能领域的优势企业和人才。这也印证了深圳气象局在加快打造气象AI新生态上,从不是单打独斗,而是以实际的业务需求为牵引,逐渐构建起了多方协同推进、政企学多元合作、数据安全可控、数算资源支撑的人工智能+气象“六个一”的协同创新体系,打通了数据、算力与算法的壁垒,让深圳迅速在人工智能气象应用赛道上实现了“换道超车”。 三大人工智能服务产品 精准预警守护城市安全 在这一生态下,三个以实际场景驱动的人工智能预报预警服务产品应运而生。首先是深圳市气象局与华为云联合研发首个业务应用的人工智能区域预报模型“智霁”。据介绍,该模型是基于AI大模型研发的适配区域气象特征的预报模型,其核心在于提高预报的分辨率,能够快速得到未来5天深圳及周边地区空间分辨率3公里、时间分辨率1小时的气温、降雨、风速等气象要素预报。在2024年广东省“数据要素×”大赛中,以“智霁”为核心内容的成果一举斩获特等奖。 今年的超强台风“桦加沙”来袭时,“智霁”对台风路径以及外围环流引发的大范围暴雨落区预报,也表现出了超越传统方法的稳定性和准确性。这份精准的预报,为深圳市实施渐进式“五停”决策提供了至关重要的科学依据,实现了超大城市台风防御的“一键暂停”与“一键恢复”,避免了“一刀切”带来的社会成本浪费,最终助力深圳打赢了这场“强度极强、范围极广、风险极大”的防御攻坚战。 其次是专攻“短临”难题的“智瞳”。强降水临近预报一直是气象界的难点,往往“雨到了,预警才到”。深圳市气象局联合哈尔滨工业大学(深圳)持续深耕,瞄准的就是提高灾害性天气临灾预警的精准度和延长预见期。在今年“8·5”特大暴雨过程中,“智瞳”成为支撑深圳临灾预警叫应“343”机制的关键技术,强降水有效预报时间从1小时提升到3小时,为分区发布暴雨红色分区预警赢得了宝贵时间。 此外,是在刚刚过去的十五运会赛事气象保障中初显身手的“阿福”。它是深圳市气象局联合鹏城实验室开发的人工智能预报员助手,它像一位不知疲倦的数字员工,实时接入气象数据,自动匹配风险阈值,在十五运会深圳赛区保障中,“阿福”基于多源数据可在10秒内自动生成精细化的短临预报提示产品,经预报员审核后快速发布,为火炬传递、深港马拉松以及充满挑战的海滨闭幕式演练提供了精准的气象信息服务,优化了传统人工流程,提高了预报员的工作效率。 从深圳走向世界 人工智能气象服务的全球示范 从防灾减灾的“硬核防线”,到重大活动的“贴心管家”,深圳的人工智能+气象协同创新实践,实际上正在重新定义气象在城市治理中的角色。它不再仅仅是播报天气,而是不断延伸到超大城市的交通疏导、应急管理、赛事运营乃至经济生活的方方面面。深圳市气象局在人工智能气象领域的深度融合应用也被纳入到深圳“城市+AI”应用场景当中,成为深圳打造人工智能先锋城市的典型案例。 其中,人工智能临近预报技术作为支撑深圳气象灾害早期预警的核心技术之一,被纳入世界气象组织(WMO)超大城市智慧气象服务公私参与示范项目的重要成果进行推广,深圳人工智能降水临近预报技术获得广东省气象局2024年科技成果评价优秀,并作为极端天气下城市防灾减灾气象科技成果之一被城市气象科技联盟向全国发布。 而在今年启动的世界世界气象组织人工智能临近天气预报(AINPP)试点项目——亚洲临近预报比对活动中,由深圳市气象局与国家气象中心共同牵头负责协调该项目的组织和总体实施。深圳的政企学多元合作主体也正凭借深圳“人工智能+气象系统创新”体系,与谷歌、微软等国际巨头同台,将中国在超大城市防灾减灾早期预警服务上的经验输送给更多的发展中国家。 以场景式驱动技术研发,以业务需求牵引技术创新。从防范超强台风“桦加沙”的从容调度,到应对“8·5”特大暴雨的精准预警,再到保障十五运会深圳赛区的万无一失,一系列成功案例证明,深圳通过AI+气象协同创新,助力超大城市气象防灾减灾能力提升的同时,也印证着这一科技赋能城市安全治理的新路径。 采写:南都记者 覃仕林 受访单位供图 -
靠一台电脑和3D打印机 80后男子在杭州车库手搓机器人 来源:潮新闻一个仓库,一台电脑和3D打印机,一堆各式各样的零件,就能像玩乐高一样,徒手组装出市面最火的人形机器人?最近,在社交媒体上,“张工的车库”火出了圈。许多粉丝追着看视频,看他直播手搓机器人,还有很多年轻的工程师从外地赶来,专程跟他“拜师学艺”。“张工”名叫张冬,80后,他手搓机器人的车库就在杭州。近日,潮新闻记者与张冬见了一面,聊聊手搓机器人的那些事。 图为张冬 记者 杨云寒 摄200平方米的仓库里,他们用极普通的材料搓出人形机器人见面的地方,在萧山区金一路边的一个园区里。张冬个头不高,身材微胖,气质有些儒雅。他在这里有个工作室,门口挂着“人形具身机器人研发中心”的牌子。 图为张冬的工作室 记者 杨云寒 摄工作室是一个200平方米的仓库,进门坐着个人形机器人,往里走一点是直播区,有人在开播介绍各种机器人,最里面还有几排电脑桌,有十几个年轻的工程师正对着电脑屏幕操作着,桌上还摆着各式各样的零配件和机器人半成品。看起来像个创业公司,但张冬笑着说,手搓机器人只是大家的爱好,“他们都不是我的员工,都是机器人爱好者,我们这些小伙伴平时有空都在这里,一起研究机器人。”聊起机器人的话题,张冬有些停不下来,如数家珍地说了不少,可蹦出第一个专有名词,就险些把记者听蒙了,记录的速度也不由慢了下来:具身机器人,是什么?张冬解释说,具身机器人,就是脑袋里安装了AI大模型的机器人,可以通过与物理世界的不断交互,像人一样学习和工作。这些年宇树科技火了半边天的四足机器狗和双足机器人,就是一种典型的具身机器人。 摆在桌上的仿真人头 记者 杨云寒 摄张冬的工作室里正在手搓的具身智能机器人,主要有三种,一种是安装了灵巧手和仿真人头的人形机器人,可以模仿人的动作和表情,像人一样交流,能在公司当前台,在小区当保安,还可以去学校里给孩子们上课;一种是双臂轮式机器人,可以在工厂里当流水线工人,两条灵活的机器臂不仅能拧螺丝,还能拿起水杯倒开水;最后一种也是机器狗,功能和宇树的差不多,能巡逻检查,也能帮人跑腿。因为都是手搓的,制作的基础零件,网上都可以找到。比如电机、传感器、线路板等等,都是张冬从网上淘来的,那些需要个性化的配件,则是通过工作室的4台3D打印机来实现。20多年前就能搓出农业机器人,后来把车库改造成实验室张冬是陕西人,跟杭州的渊源颇深,他在浙江大学读过博士,毕业后也多次来杭州。目前,他在杭州一家机器人领域的训练公司担任技术合伙人。手搓机器人,纯粹是个人爱好。张冬说,早在20多年前,他还在宁夏大学当研究生时,就已经开始研究农业机器人,还曾手搓出一台红枣机器视觉分级分选机,可以根据红枣的大小、颜色和表面缺陷等设定标准,对红枣进行分级筛选。20多年里,他在杭州、深圳以及罗马、伦敦等多个城市求学、工作,当过大学老师,也在企业主导过自动化装备研发,对机器人的兴趣一直没有减少过,还积攒了不少奇奇怪怪的创新想法。 图为灵巧手 记者 杨云寒 摄5年前,他再次回到杭州发展。有一次,听住在西湖区文新街道美都新村的外婆提起,楼下两个连在一起的车库正在出售,兴高采烈地掏出40多万买下来,打造起了自己的秘密实验室。这也是他在杭州的第一个手搓机器人工作室。 张冬在美都新村的车库 受访者供图这些年,闲暇时他都会窝在这个40多平方米的实验室里,按照自己的构思手搓出有使用场景的机器人,还低价从网上淘来一些破产清算的装备和工具,把两个车库塞得满满当当。 图为机械臂 受访者供图比如前段时间他网拍来的一台紫外水冷激光打标机,平常买要5万元,拍卖只花了5000元,也是他的宝贝,“后期开发机器人的过程中,可以发挥巨大的作用,比如可以在各种材料上刻logo、文字等,甚至可以刻制电路板。”年轻工程师从外地赶来拜师学艺,他想让更多人享受科技便利3个月前,张冬开始接触自媒体,起名叫“张工的车库”,向网友展示手搓机器人的过程。做自媒体的原因,他说主要是因为国内机器人爱好者不少,但因为机器人的门槛比较高,很多爱好者,特别是一些青年学生,缺少一个入门的渠道,“我有充分的经验,可以和他们交流,通过线上教学,为他们答疑解惑。”没想到,才刚开始做就火了,还积攒了好几万的粉丝。很多年轻的工程师,因为看了他的视频,专程赶到杭州。 “张工”与小伙伴们交流 记者 杨云寒 摄24岁的安徽小伙任明星,大学学的是电子专业,他也是在网上看了张冬的视频,慕名从江苏徐州赶来,跟着他研究具身智能机器人,目前在实验室参与研发。在杭州待了3个月,任明星直言收获不小,“每天都在接触新的知识,开阔了视野,把硬件搭建起来,感觉特别有成就感。”他也很崇拜张冬,“张老师技术很厉害,新来的小伙伴在技术上有什么疑惑,他一点就通,而且人也很随和,像老师更像是大哥。”目前,张冬的小伙伴有十多个人,基本都是慕名而来的“95后”“00后”工程师,其中不少是从上海、福建等地专程赶来,跟着他圆手搓机器人的梦想。因为团队越来越大,于是张冬在萧山又找了现在这个仓库,打造了第二个工作室。目前,两个工作室的运行都是靠“爱”发电,也期待后续能找到合适的商业支撑,“目前已经有广东、山东和省内其他地方的企业来洽谈了。”张冬说,目前所使用的源代码都是完全公开的,项目会在世界知名的开源网站GITHUB上发布,方便更多爱好者在他们的基础上进行创新,从而降低机器人领域的门槛,让更多人享受到高科技带来的便利。 -
AI视频创业公司挣到钱了 经济观察报 记者 任晓宁早上10点,AI创作者KK熟练地打开了电脑上的三个AI视频软件。作为虎山行AI创意工作室的创始人,过去半年里,他凭借AI制作的视频广告获得了数十万元的收入——这远超他之前在广告公司打工的薪水。为了维持这个高收入流,KK毫不犹豫地成为了AI视频工具的付费用户,每月会员费近千元。(KK制作的AI视频《无主时代》。视频来源:虎山行AI创意工作室)KK并非个例,正是成千上万个像他这样利用AI成功变现的创作者,合力将2025年的中国AI视频行业推向了一个前所未有的商业高度。仅用了一年时间,AI视频赛道已经从“震撼但难用”的炫技阶段,逐渐进入到让技术层和应用层甚至普通用户有望赚到真金白银的阶段。据经济观察报记者统计,近期公布业绩的头部AI视频公司,其年收入规模已从去年的“少到可以忽略不计”跨至亿元俱乐部,少则1.4亿元,多则逼近10亿元大关。快手可灵、字节跳动即梦、拍我AI(PixVerse)、海螺AI、Vidu等AI视频产品相继推出了会员模式,月度会员最低为59元,最高为1399元。和大语言模型赛道还在苦苦寻找落地场景不同,AI视频公司似乎率先拿到了一把打开金库的钥匙。C端用户愿意付费了KK这样的创作者跑通内容变现路径后,愿意持续为AI视频会员续费。这些C端用户扛起了AI视频公司收入增长的大旗。以爱诗科技为例,其收入近80%来自C端用户付费订阅,且绝大部分是海外用户。欧美用户贡献了超过一半收入,巴西紧随其后。在海外,大量普通用户通过AI视频产品第一次尝到了做网红的甜头。巴西用户nerdsoul利用AI制作经典角色老龄化特效,视频播放量破2.1亿,两月涨粉30万;葡萄牙导演Joao More借助PixVerse制作的AI电影入围了国际电影节。因为能获得流量、赞誉甚至收入,这些非专业用户心甘情愿地支付每月几十美元的订阅费。(巴西用户nerdsoul制作的AI视频。视频来源:爱诗科技)国内巨头快手的路径略有不同,但同样依赖C端。作为目前收入最高的玩家,可灵2025年预计收入达10亿元,其中70%来自会员订阅。与爱诗科技不同,可灵主要面向专业影视创作者。快手CEO程一笑明确表示,目标是AI影视创作,核心在于提升专业人士的使用体验。除了C端,B端收入也起量了。小米、亚马逊云科技、蓝色光标等2万多家企业客户已经调用可灵的API服务,将其纳入工业化生产流。爱诗科技也有近20%的收入来自API,并开始在新兴市场测试“看广告换积分”及创作者分成模式,试图构建更多元的收入结构。而AI视频公司商业化爆发的底层支撑,是AI视频技术逐渐跨越了“可用性”这一临界点。KK对去年的“惨痛经历”记忆犹新。2024年9月,他制作一支AI视频需要两天,输入像咒语一样的长文本,等待十几分钟后,生成的往往是画面崩坏、人物口型对不上的“废片”。当时的他,从不敢奢望依靠AI视频接到商单,因为视频质量首先过不了自己这一关。“到了2025年,(AI视频应用)已经是完全不同的物种。” KK感叹。现在的AI视频,5到30秒即可生成,支持自然语言交互(说人话),画质从780P飞跃至1080P以上。更重要的是,它具备了可控性:一键转风格、局部修改、动作捕捉。DIG'IT低聚体主理人林耿旭也有同感。他每月花费1万元购买各类AI会员,目睹了这一年的巨变:以前人物走路肢体扭曲,现在肉眼几乎无法分辨真假。(低聚体制作的AI视频。视频来源:DIG'IT低聚体)这种进步源于厂商近乎疯狂的迭代速度。爱诗科技创始人兼CEO王长虎透露,爱诗科技核心模型平均3个月迭代一次。可灵一年内完成了5个大版本升级。正是这种高频迭代,将AI视频从尝鲜玩具,变成了具备完整表达能力、能稳定产出商业素材的生产力工具。资本市场“香饽饽”营收增长和技术日趋成熟,让AI视频成为了2025年一级市场上烫手的“香饽饽”。今年下半年,爱诗科技、生数科技、LiblibAI接连宣布获得数亿元乃至上亿美元的融资。在海外,Runway和Luma AI也在寻求数亿至十亿美元的巨额融资。“我们B轮和B+轮融了7000多万美元,但投资意向金是是这个数字的几倍。一些投资人最后没能参与进来。”爱诗科技联合创始人谢旭璋透露,今年第二季度已经确定了B轮融资,但由于投资人热情较高,这轮融资还分成几次进行交割。今年9月,爱诗科技宣布完成6000万美元(约4.3亿元人民币)B轮融资,10月宣布完成1亿元人民币B+轮融资。王长虎告诉记者,如果不算自研大模型投入,爱诗科技已经可以自负盈亏,不需要融资太多。但考虑到AI视频赛道竞争越来越激烈,爱诗科技也需要储备资金,为后续竞争作准备。这是爱诗科技年内进行融资的原因。巨人网络战略投资部负责人邓昆年内参投了两家AI视频公司,分别是爱诗科技和LiblibAI。邓昆坦言,AI视频的发展速度令他吃惊,2024年他还认为这只是素材工具,但在看到爱诗科技明确To C战略、月活涨至1400万,还有部分AI创业公司调用其API作为核心支撑能力后,改变了他对爱诗科技的认知。爱诗科技的用户增长速度之快,也超出了谢旭璋的预期,甚至连商业化都不是公司提前规划的。今年下半年,王长虎及谢旭璋成了各大行业论坛及政府活动的座上宾。而在去年同期,他们的状态是“如履薄冰,不知道未来在哪里”。彼时,AI视频生成赛道在投资圈眼中仍是“非共识”领域——技术太难、成本太高、短期难以跑通。绝大多数AI公司还在为如何突破百万用户大关而焦虑。转折点发生在2024年11月。 爱诗科技旗下的PixVerse上线了一款“变身特效”模板,用户上传照片即可生成电影级的人物变身效果。这一功能迅速击中了TikTok用户的嗨点,视频累计播放量数十亿,PixVerse一夜之间登顶30多个国家的应用商店榜首。甚至因为当时未推国内版,闲鱼上出现了大量“代做视频”的付费需求。PixVerse用户两个月涨了1000万,这场突如其来的泼天流量,直接倒逼了爱诗科技的商业化进程。“(用户)涨太快了,如果再不商业化,我们就得亏。”谢旭璋的言外之意是,如果用户规模暴涨,AI视频创业公司可能会被算力成本拖垮。还不够好AI视频产品飞速迭代,但对于创作者而言,这些产品仍有改进空间。作为重度使用者,KK和林耿旭已经感觉到了现有产品的瓶颈。一是AI视频产品没有连续创作功能,这让KK很困扰,比如用AI生成一张图,他想继续修改,就需要下载这张图,再重新上传到对话框,过程繁琐。他发现,国内绝大多数AI视频工具都有这个bug,而其他多模态产品都能联系上下文进行多轮对话。二是协作困难。林耿旭反馈,市面上AI视频产品主要面向个人,几乎没有面向团队的产品,对于像DIG'IT这样拥有15人AI团队的公司,团队协同工作时很麻烦。三是精细控制不足。林耿旭认为,当前AI生成的人物姿态类视频的错误率仍比较高,尤其是在舞蹈、体操等复杂动作上。各个AI视频产品各有长处和短板。KK的使用心得是:拍我AI生成速度很快,5秒能生成360P画质,1分钟能生成1080P的视频,适合紧急项目、需要大量素材的时候用;海螺AI呈现大动作的能力较强,适合生成武打戏场景;Vidu的多参数功能较好用,生成的视频一致性较强,但画质一般。KK理想中的AI视频产品,是一个整合各家长处、支持连续创作的“超级工具”。最近一年内,邓昆几乎把市面上的AI视频公司都“盘”了一遍,数量多到一张表都列不下来。他认为,AI视频目前还在行业早期,产品效果已经达到短视频平台内容消费水准,也已经出现了健康可持续的商业循环,未来其商业收入提高是必然趋势。邓昆判断,2026年AI视频在电商、教育、短剧、漫剧等领域能看到更好的商业收益。下一步的决胜点,在于能否开发出电影级画质的AI视频产品。届时,AI视频赛道或许有可能出现平台级的入口,也可能出现交互式视频。(作者 任晓宁)免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。 任晓宁TMT新闻部资深记者 关注并报道TMT(科技、传媒、通信)领域重大事件,擅长行业分析、深度报道。 联系邮箱:renxiaoning@eeo.com.cn 微信号:tangtangxiaomo -
Anthropic自研AI面试官,深度访谈1250名职场人,揭示AI在工作中的真实影响 ↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新Anthropic刚刚发布了一款名为Anthropic Interviewer的新工具,旨在规模化地理解人们对AI的看法为了测试这款工具,他们已经用它对1250名专业人士进行了一场大规模访谈,覆盖普通职场人、科学家和创意工作者三大群体研究的核心发现是什么?一言以蔽之:普遍乐观,局部悲观:在受访样本中,人们对AI在工作中的作用持乐观态度。但少数话题,如教育融合、艺术家替代和安全问题,则带有更多悲观情绪普通打工人:希望保留定义其职业身份的核心任务,将重复性工作委托给AI。他们设想的未来是,AI负责自动化常规任务,而自己的角色转变为监督AI系统创意工作者:尽管面临同行评判和对未来的焦虑,他们仍在使用AI提高生产力,同时也在应对AI使用带来的污名化、经济替代和人类创意身份被侵蚀的深层担忧科学家:渴望与AI建立伙伴关系,但目前还无法信任它执行核心研究。他们普遍希望AI能生成假设和设计实验,但实际使用仅限于撰写文稿或调试代码等辅助任务Anthropic表示,这项研究的数据(经参与者同意)将全部公开发布。现在,让我们深入了解这项研究是如何进行的,以及它还揭示了哪些细节。用AI面试官,规模化探究AI影响 数以百万计的人每天都在使用AI。作为AI开发公司,Anthropic希望了解用户如何及为何使用AI,以及这对他们产生了什么影响。这不仅是为了开发更好的产品,更是为了解答“人与AI的互动”这一我们时代最重大的社会学问题之一。此前,Anthropic的工具只能分析Claude对话框内发生的事情。但对话结束后呢?人们如何使用Claude的输出?他们对此有何感受?他们如何想象AI在自己未来工作中的角色?要获得全面的图景,就需要直接与人交流。传统上,这意味着要进行数百次人工访谈。这一次,Anthropic让AI来帮忙。他们构建了一款由Claude驱动的访谈工具——Anthropic Interviewer。它能以前所未有的规模自动进行详细访谈,并将结果反馈给人类研究员进行分析。研究方法 本次初步测试的核心是探索工作者如何将AI融入专业实践,以及他们对AI未来角色的感受。参与者Anthropic Interviewer共访谈了1250名专业人士。这些参与者通过众包平台招募,但他们的主业均非众包工作。普通职场人群(1000人):样本未限定特定职业。其中最大的子群体来自教育(17%)、计算机与数学(16%)以及艺术、设计、娱乐和媒体(14%)创意工作者(125人):主要包括作家(48%)和视觉艺术家(21%),以及电影制作人、设计师、音乐家等科学家(125人):包括物理学家(9%)、化学家(9%)、化学工程师(7%)和数据科学家(6%),覆盖超过50个不同的科学学科。之所以选择创意和科学这两个专业领域,是因为AI在这些领域的角色仍充满争议且在迅速演变。所有参与者均同意其访谈数据用于研究分析并公开发布。Anthropic Interviewer如何工作? 整个流程分为三步:规划、访谈和分析。1.规划(Planning):AI首先创建一个访谈框架。这个框架既能保证所有访谈都围绕核心研究问题展开,又足够灵活,能适应个别访谈中出现的不同话题和方向。研究人员通过系统提示(System Prompt)设定研究假设和访谈最佳实践,然后AI生成具体问题和对话流程,最后由人类研究员与AI协作完成最终方案。2.访谈(Interviewing):AI随后根据访谈计划进行实时、自适应的访谈。每次访谈在Claude.ai上进行,持续约10-15分钟。3.分析(Analysis):访谈结束后,人类研究员与AI协作分析访谈记录。AI根据最初的访谈计划,输出研究问题的答案和相关的引言。同时,一个独立的AI分析工具会识别出访谈中涌现的普遍主题,并量化其出现频率。研究目标 本次测试的主要研究目标如下:普通职场人群:了解个人如何将AI工具整合到专业工作流中,探索使用模式、任务偏好和互动方式创意工作者:了解创意专业人士目前如何将AI融入创作过程,以及他们对AI与人类创造力未来关系的看法科学家:了解AI系统如何融入科学家的日常研究工作流,考察其在科学过程不同阶段的使用模式、感知价值、信任水平和采用障碍。研究发现 AI对普通职场人群的影响 总体而言,普通职场样本的成员将AI视为生产力助推器。86%的受访者表示AI为他们节省了时间,65%的人对AI在工作中的作用感到满意。一个普遍的主题是工作场所动态对AI采纳的影响。69%的专业人士提到,在工作中使用AI工具可能会带来社会污名。一位事实核查员说: “最近一个同事说他讨厌AI,我什么也没说。我不会告诉任何人我的工作流程,因为我知道很多人对AI的看法。”在工作安全感方面,41%的受访者认为自己的工作很安全,相信人类技能是不可替代的;而55%的人则对AI的未来影响表示焦虑。在感到焦虑的群体中,25%的人选择为AI使用设定界限(如教育工作者坚持自己制定教学计划),另有25%的人则通过承担额外职责或追求更专业的任务来调整自己的工作角色。应对策略也多种多样。一位数据质量经理选择学习而非自动化:“我把它看作学习外语——只用翻译App学不到任何东西,但有一位能回答问题、为你定制内容的导师则大有裨益。”一位市场营销人员采取了灵活策略:“我正努力在保持强大专业优势的同时实现多元化。”一位口译员已经准备转行:“我相信AI最终会取代大多数口译员……所以我已经在为职业转换做准备了。”值得注意的是,只有8%的焦虑者没有明确的应对计划。情感分析图表显示,不同职业的情感特征非常一致,均表现出高满意度。然而,这也伴随着挫败感,表明专业人士在发现AI有用性的同时,也遇到了显著的实施挑战。在之前的分析中,AI的使用被分为增强(AI与用户协作完成任务)和自动化(AI直接执行任务)。在本次访谈数据中,65%的参与者将AI的主要作用描述为增强,35%描述为自动化。这与此前对Claude实际使用情况的分析(47%增强 vs 49%自动化)存在显著差异。可能的原因包括:样本差异、用户在对话后对AI输出进行了再加工、用户为不同任务使用不同AI、自我报告与实际使用存在偏差等。对于未来,专业人士设想的是一种增强与自动化并存的模式:自动化处理常规、行政性任务,同时保留人类的监督。48%的受访者考虑将自己的职业转向管理和监督AI系统,而非直接从事技术工作。AI对创意行业的影响 创意专业人士同样报告了AI带来的生产力提升。97%的人表示AI节省了时间,68%的人认为AI提高了作品质量。一位小说家解释说:“我感觉写作速度变快了,因为研究工作不再那么令人望而生畏。”一位摄影师提到AI处理了常规的编辑任务,将周转时间从“12周缩短到大约3周”。与普通职场人群相似,70%的创意工作者提到他们需要应对来自同行的评判压力。一位地图艺术家说:“我不想让我的品牌和商业形象与AI及其附带的污名紧密相连。”经济焦虑贯穿了创意工作者的访谈。一位配音演员直言: “由于AI的兴起,配音行业的某些领域,比如工业配音,基本上已经消亡了。”一位作曲家担心,平台可能会“利用AI技术和他们的发行曲库无限生成新音乐”,从而用廉价的替代品充斥市场。另一位艺术家表达了类似的担忧:“现实地说,我担心我需要继续使用生成式AI,甚至开始销售生成内容,才能在市场上跟上步伐,维持生计。”一位创意总监也表示:“我完全理解,我的收益就是另一位创意工作者的损失。我过去每天要付2000美元的产品摄影师,现在接不到我的生意了。”(值得注意的是,Claude不生成图像、视频或音乐,因此参与者表达的焦虑是针对广义的AI。)所有125名创意工作者都提到希望保持对创作成果的控制权。然而,这一界限在实践中并不稳定。许多参与者承认,在某些时刻,AI主导了创意决策。一位艺术家承认:“AI驱动了很大一部分概念;我只是试着引导它……60%是AI,40%是我的想法。”情感分析显示,不同创意领域的情感特征存在差异:游戏开发者和视觉艺术家报告了高满意度,但同时也伴随着高度的担忧。设计师则呈现出相反的模式,以挫败感为主,满意度极低。所有领域的信任度都持续偏低。满意度与担忧之间的紧张关系,可能正反映了创意工作者既拥抱AI工具,又对人类创造力的未来感到忧虑的矛盾处境。AI对科学工作的影响 在对化学、物理、生物和计算领域研究人员的访谈中发现,AI目前还无法处理他们研究的核心环节,如假设生成和实验设计。科学家主要将AI用于文献回顾、编码和写作等辅助任务。信任和可靠性问题是79%访谈中提到的主要障碍。一位信息安全研究员指出:“如果我必须仔细检查并确认AI给出的每一个细节以确保没有错误,那让AI来做这项工作就失去了意义。”一位数学家也表示:“在我花时间验证AI的输出后,花费的时间基本上和自己做差不多。”一位化学工程师则提到了AI的“迎合奉承”问题,解释说AI会根据用户提问的方式改变答案,这种不一致性让他对AI的回答持怀疑态度。情感分析显示,大多数科学领域报告了高满意度,但挫败感模式各不相同:物理学家和数据科学家的挫败感更高。这可能反映了计算领域与实验领域在尝试将AI整合到核心工作流中的差异。与创意工作者不同,科学家们对AI的担忧程度相对较低,这与他们对AI目前无法完成核心研究任务的挫败感相符。他们普遍不担心因AI而失业。原因包括:研究中存在难以数字化的隐性知识(一位微生物学家举例说,有些实验步骤需要根据细胞呈现的特定颜色来判断,这种颜色差异必须亲眼所见才能理解);以及研究决策的内在人性。外部限制,如安全规定和预算/时间限制,也构成了AI替代的障碍。尽管如此,91%的科学家表示渴望在研究中获得更多AI辅助。大多数人希望AI能在整个研究过程中提供支持:评估实验设计、访问科学数据库、运行分析等。一个共同的愿望是,希望AI能产生新的科学思想。一位医学科学家说: “我希望AI能帮助生成或支持假设,或者寻找人类不易察觉的新颖互动/关系。”另一位科学家也表示:“我渴望一个能像有价值的研究伙伴一样的AI……能带来一些新东西。”这次初步测试证明了Anthropic Interviewer在规模化研究方面的潜力,它使得原本耗时耗力的研究得以高效进行,并能提出和回答关于AI社会角色的新问题。通过这项研究,Anthropic获得了超越聊天窗口使用数据的洞察,了解了人们对AI的感受、期望和未来构想。这些发现将被用于与经济顾问委员会和高等教育顾问委员会的讨论,并为产品开发和政策倡导提供信息Anthropic也正在与特定社群展开合作,将他们的专业知识融入AI开发Anthropic表示,通过大规模部署Anthropic Interviewer,他们希望在人们的AI体验和AI的开发之间建立一个反馈循环,最终构建出能反映公众观点和需求的AI系统参考:https://www.anthropic.com/research/anthropic-interviewer--end--最后记得⭐️我,每天都在更新:欢迎点赞转发推荐评论,别忘了关注我 -
OpenAI的“治理大修”:一场资本重组修缺的大戏 引言:从一场惊心动魄的“宫斗”到一次公司治理的“修复手术”在科技界,2023年年底发生在人工智能领军企业OpenAI内部的那场“宫斗大戏”,至今仍让人记忆犹新。公司的灵魂人物、CEO萨姆·奥特曼被董事会突然解职,短短几天后戏剧性地官复原职。这场风波表面上是人事动荡,但实质上向全世界暴露了OpenAI先天的公司治理结构缺陷。2025年10月,OpenAI宣布完成了一场历时近一年的、估值高达5000亿美元的资本重组。据公开信息,此轮规模空前的重组由软银领投300亿美元,并引入了包括Thrive Capital在内的多家新老投资机构共110亿美元,成为科技史上规模最大的私募融资之一。但其深远意义远超金钱层面,它更像是一次针对自身“先天不足”的公司治理体系进行 “修复手术”,本文试图还原解析OpenAI这场“大手术”的前世今生和前因后果。一、病根深种:OpenAI旧治理结构的三大“先天缺陷”要理解这次重组的重要性,我们首先要诊断出OpenAI旧体制的“病根”,2023年的狗血剧,暴露了公司治理结构的“先天缺陷”主要体现在以下三个核心矛盾上:1.董事会的“精神分裂症”:董事信义义务的终极悖论这是最根本的缺陷。用通俗的话讲,公司的董事们就像同时收到了两个老板发出的、方向完全相反的指令,陷入了左右为难的困境。老板A(公司法基本原则)的要求:根据注册地特拉华州的公司法,董事信义义务责任是为公司利益最大化服务,简单说,就是要尽可能多地赚钱,这点也是全球各国公司法的基本原则。老板B(公司架构和章程)的要求:然而,公司架构和创始章程却坚守董事会的首要职责是确保人工智能“造福全人类”,即使这可能会损害公司的经济利益。这种制度性的“精神分裂”,让董事们几乎无法做出既自身风险小又符合初衷的决策,为内部冲突埋下了伏笔。2.“上帝董事会”与“黑箱操作”:权力制衡机制的缺失在原来的架构中,真正的最高权力机构是一个非营利母公司的董事会。这个董事会权力极大,却缺乏有效的监督和制衡。至高无上的权力:这个董事会不仅能任命和罢免营利性子公司的董事,甚至有权否决公司的商业决策。然而,这个掌握生杀大权的董事会本身,有的董事会成员构成偏向于技术伦理领域,如时任首席科学家伊尔亚·苏茨克维等,虽然技术造诣深厚,但是在公司治理方面经验有限。不透明的决策机制:旧章程允许董事会成员通过简单的邮件书面同意,就能做出重大决定,无需经过正式的、有记录的会议决策。2023年解雇奥特曼的决策,据信就是在这种缺乏充分讨论的情况下做出的,最终引发了巨大的反弹。3.“金主”与“功臣”的权益失衡:激励机制的错位一个健康的公司需要平衡各方利益,但OpenAI原公司架构(如下图),却让关键角色感到“很受伤”。 OpenAI原公司架构图微软的尴尬处境:作为早期最重要的投资者和合作伙伴,微软先后砸钱130亿美元,并提供了强大的Azure云计算资源。然而,通过复杂的投资协议,微软获得的主要是利润分成权和产品整合权,但并无董事会席位。这就像一个出了大钱盖楼的合伙人,却无权置喙楼该怎么设计。员工持股的“纸面富贵”:许多核心员工获得了股权激励,但这些股权受到严格限制,难以变现。这好比给员工发了一张写着巨额数字、却无法兑换的“奖状”,难以真正留住顶尖人才,加剧了人才流失的风险。“无私”董事的潜在问题:董事会成员大多不持有公司股份,这本意是让他们超脱于经济利益,专注于使命。但这也可能导致他们,在决策时过于理想化而忽视商业现实。二、手术刀与蓝图:资本重组如何系统性修复缺陷?面对这一系列盘根错节的治理难题,OpenAI无法小修小补,只能进行一场系统性重构。这次资本重组,是一次融合了法律、金融和公司治理的 “修复工程”。1.创立“使命守护神”:OpenAI基金会重组后,原来的非营利母公司转型升级为“OpenAI基金会”。这个基金会被赋予了至高无上的特殊权力:任命和随时更换下层运营主体的所有董事。基金会不参与日常商业运营,但通过股权类别实现权力控制。基金会持有Class N 股,拥有绝对控制权和关键事项否决权。员工、投资者和微软持有的Class A/B 股及优先股,拥有经济权益,但投票权受限。这样的股权类别,实现了基金会对公司最终发展方向的牢牢掌控。2.选择新“身份标签”:公共利益公司为了解决董事会的“精神分裂”问题,OpenAI的运营主体选择了一个相对新颖的法律形式——公共利益公司(以下简称PBC)。 2025年10月28日,OpenAI的PBC公司章程首页截图它是什么?PBC不是传统的慈善组织,它依然要追求利润。但关键在于,它的公司章程里会明确写入其追求的一项或多项公共利益目标(对于OpenAI,就是“安全、广泛受益的人工智能”)。“免责金牌”:法律明确规定,PBC的董事和管理层在做出决策时,必须考虑其对社会和环境的正面影响,而不仅仅是股东利润。当股东起诉董事“没有最大化利润”时,董事可以凭借“我们是在履行章程规定的公共利益使命”作为合法的抗辩理由,这相当于给管理层发了一张“免责金牌”,试图合法地解决信义义务冲突。3.作为融资主体的PBC:股权结构“大扫除”针对之前股权混乱、激励不足的问题,重组方案对资本结构进行了彻底的“标准化”清理。同股同权:此轮高达410多亿美元的融资,所有投资者,包括微软(持股估值约1350亿美元)、软银、Thrive Capital等,现在都持有同一种类型的股权。员工激励“变现”:设立了明确的员工持股变现通道,增强了团队的稳定性和凝聚力。4.董事会“换血”:专业化重构新的董事会彻底改变了原来结构单一、缺乏制衡的局面。重组后的新董事会实现了背景的多元化与专业化升级:多元化的构成:新董事会不再局限于技术专家,而是吸纳了布莱特·泰勒(前 Salesforce 联席CEO)这样的资深商业领袖作为董事长,以及顶尖的经济学家和法律合规专家等,形成了一个背景多元、能力互补的决策团队,能够从技术、商业、法律、政策等多个维度审视公司战略。委员会机制:设立了审计、薪酬、治理与公共利益等专业委员会,使其运作符合《萨班斯-奥克斯利法案》等法规要求。奥特曼作为CEO,是唯一的内部董事。三、手术效果评估:新治理体系的价值与隐忧这场大手术的效果如何?它确实系统性地修复了大部分核心缺陷,但也留下了需要时间检验的挑战。积极成效:根治了“精神分裂”:PBC架构从法律上赋予了平衡使命与利润的合法性,基金会控股权则从执行上确保了使命的优先性。管理步入正轨:新的治理结构完全能满足未来上市所需的严格合规要求(如《萨班斯-奥克斯利法案》),为公司走向公众市场扫清了主体的障碍。利益分配重归公平:各方利益(股东、员工、合作伙伴)在新的法律框架下得到了清晰界定和保障,内部凝聚力显著增强。微软和软银等投资机构在新PBC下获得了与其投资相匹配的收益权利,合作关系更加稳固。生态合作更健康:与微软、甲骨文等伙伴重新签订了更清晰、对等的商业合同,重建了互信共赢的合作关系。待决挑战:PBC的“司法初裁”:PBC作为一个较新的法律形式,其董事在平衡利益时的“自由裁量权”边界到底有多大,尚未经过大量法庭案例的检验。在美国这样的案例法主导的国家,未来一旦发生诉讼,法官如何裁决,将成为一个重要的不确定性。反垄断的“达摩克利斯之剑”:作为AI巨头,其与微软、甲骨文等巨头的深度合作,如与Oracle、软银合作的德州数据中心以及未来几年高达1.4万亿美元的“财务义务”, 极易引起全球反垄断监管机构的关注和调查。外部法律挑战:像埃隆·马斯克等发起的一系列诉讼,正在考验着新架构的法律稳固性,任何不利的判决都可能带来冲击。四、示范效应:OpenAI重组对科技行业的深远启示OpenAI的这次实践,其意义远超一家公司本身,它为所有追求超越股东价值目标的全球化科技公司提供了一个极具参考价值的“治理范式”。提供了新选择:PBC这个公司形态为那些希望超越“股东利益至上”的传统模式的企业,提供了一个公司形态的选择,大家注意这是在美国大公司最偏爱的注册地特拉华州。探索了新结构:“非营利基金会+营利性PBC”的混合治理模式,探索出一条兼具“使命刚性”和“运营灵活性”的可行路径。它像一套双核系统,一个核心(基金会)确保方向不变,另一个核心(运营公司)保障运行效率。结语:拭目以待这场静悄悄的公司治理大修回顾OpenAI近期完成的2025年资本重组,它远非一次简单的重大融资活动,而是试图通过精巧地融合非营利基金会的使命坚守、公共利益公司的法律包容性、标准化股权的利益共享机制以及现代化的董事会治理,把一个可能导致公司分裂的结构性矛盾,转化为一个可以被现有法律框架所容纳的系统。奥特曼称此次重组是为了简化复杂的资本结构,使其更像传统公司,以筹集所需“数万亿美元”资金,但PBC章程展示的结构远非传统。其复杂的股权类别和投票权限制,使传统IPO难度不小。无论如何,这次重组得以实现离不开以微软这样的老牌科技公司,以及软银这样的长期导向投资机构为首的投资方,对公司长期价值而非短期控制的认同,叠加了一个更具公司治理能力的新董事会运筹帷幄。这场大戏侧面证明,在人工智能技术狂飙突进的时代,资本的力量不仅可以用于扩张和竞争,更可以成为修复治理缺陷的工具。未来,随着AI技术更深刻地重塑世界,公司治理缺陷的识别与修复将成为所有追求超越股东价值企业的核心挑战。2025年OpenAI的这场“大修”,注定会成为科技公司治理演进史上的一个重要里程碑,其是否可以实现“追求商业辉煌的同时不忘那份更高追求的初心”的目标,让我们拭目以待。(作者冯斌供职于某国际化企业,华东师大CTO学院客座教授,清华苏世民书院行业导师,南京大学和曼大中国中心MBA导师,讲授《并购、战略与公司治理》研究生课程)来源:冯斌 -
9月,全球AI月访问量达70亿次,同比增长76%,流量直逼社交网络 生成式AI正从新奇工具演变为互联网基础设施的核心层。日前,据Similarweb公布的数据显示,2025年9月全球AI服务月访问量达到约70亿次,同比增长76%,流量规模已可与主流社交网络匹敌。 这一增长不仅体现在网页端。移动端的扩张更为迅猛,AI应用会话量在过去一年增长了五倍,应用下载量飙升778%。ChatGPT仍是流量主导者,9月访问量达到约59亿次,跻身全球访问量前五的网站。用户结构也在发生变化。虽然18至34岁用户仍占主导,但45岁及以上用户群体增速最快,目前已占总访问量近30%。这表明AI技术正在突破早期采用者圈层,向更广泛人群渗透。数据还显示,AI聊天机器人尚未取代传统搜索引擎。在4.62亿ChatGPT访问者中,95%的用户同时使用Google,表明用户正根据不同任务在对话式AI和搜索引擎之间切换。ChatGPT占据八成全球AI流量 ChatGPT的市场主导地位依然稳固。OpenAI的平台从2022年约1900万月访问量增长至2025年9月的约59亿次,使其成为全球访问量前五的网站之一,与Instagram的65亿次月访问量处于同一量级。 尽管面临来自Gemini、Claude和Perplexity等竞争对手的挑战,ChatGPT仍占据全球生成式AI访问量的近80%。这种压倒性优势反映出先发平台在用户习惯养成方面的壁垒效应。 AI与搜索引擎呈现并行使用模式 据Similarweb数据,AI聊天机器人并未取代传统搜索引擎,而是形成了并行使用格局。在4.62亿ChatGPT访问者中,95%同时使用Google,重叠用户达4.41亿。这表明用户会根据具体任务在对话式AI和搜索引擎之间切换。 在用户粘性方面,ChatGPT表现显著领先。在美国市场,ChatGPT移动应用拥有4130万月活跃用户,其中33%每天打开应用。相比之下,Perplexity(340万月活用户)和微软Copilot(310万月活用户)的日活跃率仅为5%至17%,显示出更零散的使用习惯。中老年用户成为增长最快群体 用户年龄结构正在发生显著变化。虽然18至34岁用户仍是最大群体,拥有19亿用户(占比53%),但45岁及以上用户群体的增长速度最快,目前已占所有访问者的近30%。 这一趋势表明生成式AI正在跨越早期采用者阶段,向主流人群扩散。中老年用户的加速涌入,意味着AI工具的易用性和实用价值已获得更广泛认可。AI功能整合仍处试验阶段 AI技术向现有平台的整合正在扩大。Google的"AI模式"成为美国市场最快达到1亿访问量的生成式AI功能,这得益于该公司的庞大用户基础。不过数据显示,这类整合功能的使用仍处于试验性阶段。在为期两个月的观察期内,超过半数用户仅在单日与该功能进行过互动,表明用户尚未形成稳定的使用习惯。这一现象凸显出,将AI能力深度嵌入现有产品生态系统仍需时间培育用户行为。 -
揭秘AI手机的 “上帝权限”,看其如何跨 App 替你操作 图片来源:视觉中国蓝鲸新闻12月5日讯(记者 朱俊熹)上线不到一周,字节跳动联手中兴打造的首款"豆包助手"AI手机便卷入舆论风波。部分首批用户在试用过程中,遭遇无法登录微信、被多款银行App弹窗预警等状况。一时之间,究竟该不该"让AI接管手机"成为公众讨论焦点。12月5日,豆包手机助手团队再发声明称,为了让技术发展、行业接受度和用户体验多方都能形成良性适配,计划在接下来的一段时间,在部分场景对AI操作手机的能力做一些规范化调整。具体调整包括但不限于,一是限制刷分、刷激励的使用场景;二是进一步限制金融类应用的使用;三是限制部分游戏类使用场景。在科技公司的炫目演示中,AI仿佛已化身万能助手,为用户带来科幻般的便捷生活。然而,背后的隐私安全疑虑就如同一团迷雾。更深处的暗流,是各家应用平台的商业利益之争。留给用户的疑问是,AI究竟如何接管你的手机,信息安全又该怎样得到保障?谁在操控你的手机?12月3日,针对外界关于"豆包手机助手拥有操作系统高危权限"的质疑,团队发布了澄清声明,强调不存在任何黑客行为。声明指出,豆包手机助手拥有INJECT_EVENTS权限,确实是系统级权限。但其技术实现依赖Android系统级权限,有更严格的使用限制。只有拥有INJECT_EVENTS权限许可,产品才能跨屏、跨应用来模拟点击事件,完成用户操作手机的任务需求。而豆包手机助手需要经过用户主动授权后,才可以调用该权限。"据我们了解,目前行业的AI助手,均需要使用该权限(或与其类似的无障碍权限)才能提供操作手机的服务。"团队表示。INJECT_EVENTS权限允许应用向系统注入输入事件,例如模拟用户的点击、滑动、按键等操作。这意味着,拥有该权限的程序可以在系统层面像用户一样控制手机屏幕。而无障碍权限是Android系统为视障、听障等群体设计的辅助功能。获得无障碍权限后,应用可以读取屏幕内容,并执行点击、滑动等部分操作,权限能力相对更有限。个人隐私保护专家、北京汉华飞天信安科技有限公司总经理彭根向蓝鲸科技解释称,INJECT_EVENTS权限属于更高等级的系统底层权限,需要手机厂商通过一定技术方式赋予,一般的应用无法直接获取。相比之下,无障碍权限是普通应用在安装后,经用户主动授权即可开启的权限集合,更强调用户的知情与同意。而在今年8月,大模型厂商智谱AI在发布智能体AutoGLM 2.0时表示,引入了"云手机/云端桌面"式执行形态,可在云端自主完成跨应用任务,无需依赖终端的无障碍权限。有知情人士告诉蓝鲸科技,AutoGLM选择的路径不同于豆包手机助手。它直接To C依托云设备,不依赖手机厂商,从而避免执行时抢占用户屏幕,并降低适配多家不同系统的成本,符合现有系统生态。在通过不同渠道获取必要权限后,AI助手才能做到接管人类手机,执行各种跨App任务。具体操作方式大致分为两类。目前更为主流的是基于GUI的视觉路线,即AI Agent通过阅读和理解屏幕内容,模拟点击、滑动等动作来代替用户操作。在这种模式下,智能体并不需要获得第三方App的许可,可以绕开各家应用的限制。而另一种可行的路径则需要Agent或手机厂商与App方达成协议,通过官方API接口来调用应用功能。据官方介绍,豆包手机助手的操作手机Pro模式除调用GUI Agent外,还可直接调用手机终端的系统工具。演示视频显示,在操作手机Pro模式下,当用户说"帮我给女儿推荐几个礼物放进购物车"时,若记忆中已存储女儿的年龄、兴趣等信息,助手可直接查询符合女儿年龄、偏好的方案,无需用户逐一交代细节。一位业内人士对蓝鲸科技表示,如果从用户的数据安全出发,更好的做法是推动各方主体的合作而非竞争。"但做接口方案的主动权在App厂商手上,而不在Agent方面。"他指出,"安全与权限之争只是表层,深层是决策权的争夺。"如果AI Agent成为统一入口,用户不再直接操作各个App,势必对应用端的用户数据、商业模式构成挑战。类似的纷争在国外已初现端倪。今年11月,亚马逊以侵权为由起诉AI搜索创企Perplexity,试图阻止其通过智能体工具帮助用户在亚马逊上购物。Perplexity回应称,亚马逊本应欢迎这种便捷购物,因为这意味着更多交易和更满意的客户,但它"更关心的是投放广告、显示赞助结果,以及通过附加销售和复杂优惠来影响购买决策"。豆包手机助手团队在最新声明中表示,"目前,我们也在积极寻求与各应用厂商的深度沟通,希望推动形成更加清晰、可预期的规则,避免用一刀切的方式否定用户合理使用AI的权利。"华为小艺、小米小爱曾试水调用微信,后放弃执行回到此次豆包手机助手争议的导火索,是多位用户反馈若涉及操作微信,会出现微信异常退出甚至无法登录的情况。12月3日,豆包手机助手团队回应称,后续已下线手机助手操作微信的能力,样机上被禁止登录的微信账号正陆续解封,请用户等待一段时间并尝试重新登录。微信方面则表示,并没有特别动作,可能是触发了微信原有的安全风控措施。 图片来源:豆包手机助手用户群截图《腾讯微信软件许可及服务协议》中明确指出,不得通过非腾讯开发、授权的第三方软件、插件、外挂、系统,登录或使用微信软件及服务,或者进行自动化操作。也不得自行或者授权他人、第三方软件或系统等对微信软件及其组件、模块、数据进行控制、访问、读取或干扰。搭载豆包手机助手的工程样机nubia M153,并不是业内首款标榜"让AI接管手机"的产品。而通过AI智能体在微信上完成发消息、点赞等操作,也成为众多厂商展示其智能体能力的典型场景。2024年11月,智谱推出升级后的第一代智能体产品AutoGLM。在发布活动现场,智谱CEO张鹏通过语音指令,让手机里的AutoGLM在微信中创建面对面群聊,并发放一百个红包。然而在今年发布AutoGLM 2.0时,智谱的官方演示中不再提及微信,却依然支持操作美团、京东、小红书、抖音等数十款高频应用。此外,手机厂商华为的AI助手小艺也曾支持自动打开微信,帮助用户发送消息。但目前,华为小艺、小米小爱等手机厂商自有的AI智能体已无法直接调用微信功能。原因可能在于,微信作为国民级应用,对任何自动化操作都保持极高风控敏感度,因此也成为此次豆包手机助手最先触发风险的场景之一。至于银行、互联网支付等金融场景,豆包手机助手团队称其直接关联用户的资金安全。虽然豆包手机助手在敏感操作时都需要用户授权,但审慎起见,也将暂时下线操作这类APP的能力。在《豆包手机助手隐私安全白皮书》中,包括金融与交易操作、高风险不可逆操作、健康与医疗数据处理等在内的六大类操作被归为高敏操作,需要用户二次确认后才能接入并执行。另有手机智能体厂商告诉蓝鲸科技,当涉及支付、内容发布等敏感操作时,其Agent系统会强制请求用户确认,或由用户直接"接管手机"完成。此外,厂商还会通过工程策略和权限边界来防止"超指令"行为,高风险步骤默认不自动执行。在蓝鲸科技此前的实测过程中,使用豆包手机助手操作多家银行App时,中国建设银行App会主动弹窗提示,建议用户退出录屏或共享软件"AI操作手机",以保障个人信息及资金安全。中国农业银行App则在豆包手机助手进行转账操作期间,因停留时间过长而触发类似安全提醒。中国交通银行App并未作特别警示,直至涉及具体转账动作时,豆包手机助手会转换到手动操作模式。 图片来源:蓝鲸科技实测截图记者查阅发现,上述几家银行App在个人电子银行服务协议中均提及,用户应妥善保管身份认证要素,不得提供给或交于任何第三方使用。交通银行App还明确规定,用户通过自动脚本或第三方外挂系统登录和使用电子银行服务,银行有权采取包括但不限于限制电子银行服务交易额度和频次、暂停或终止部分或全部电子银行服务的措施。在最新声明中,豆包手机助手称会积极与金融类应用相关厂商沟通,"希望共同制定清晰、安全的AI操作行为准则"。中国社会科学院大学互联网法治研究中心主任刘晓春则表示,AI智能代理行业尚处初期,技术与规范尚在探索。对这类创新技术,需以包容审慎态度,在精准规范风险的同时为创新留出空间,助力行业良性发展。 -
AI热潮的真相,大湾区这场论坛说清楚了 今年什么的科技亮点最值得关注?毫无疑问,人工智能。AI称得上是50年来最具变革性的技术,发展迭代的速度也越来越快,多模态大模型几乎“以月为单位”迭代,芯片技术一年能更新两代。这种速度让很多企业感到“AI焦虑”。在广州举行的“2025粤港澳大湾区新经济发展论坛”上,很多顶尖的学者、企业家和投资人试图穿透这些技术喧嚣,聊聊AI到底走到了哪一步,以及对我们每个人、每家企业意味着什么。我听了他们的讨论,有几个观点很值得关注,今天也分享给你。第一,AI的战场正在悄悄转向。论坛上有个共识:单纯追求模型参数大、跑分高的时代,可能正在过去。没错,技术的绝对前沿仍在突破,但更重要的是,顶级大模型之间的“能力差”正在迅速缩小。这意味着什么?意味着技术的“红利期”可能要来了,竞争的重心转向实实在在的产业里“解决问题”。清华大学田轩院长反复强调,金融要支持“新质生产力”,核心就是支持科技真正落地到产业。阿里云的康敏总也表示,AI已经像水电一样,渗透到游戏、汽车、医药研发、物流供应链等千行百业里。所以,未来的巨大机会,很可能不在继续“卷”大模型本身,而在于如何把AI技术,与一个具体的、庞杂的、传统的行业进行深度结合,解决实际痛点。第二,出海,尤其是科技企业的出海,从可选项变成必答题了。全球很多国家面临“科技供给短缺”,而中国在工业自动化、大模型应用等领域已经跑出了成熟方案。未来我们要输出的不仅是产品,更是技术标准、商业模式,甚至参与制定全球AI伦理与安全规则。所以你看,AI的故事还有很多没讲完,它正在改变商业竞争的逻辑、全球产业的格局。田轩院长也指出,像企业风险投资这样的“耐心资本”,因为投资周期长、容忍失败,更适合支持AI这种长周期、高风险的创新。同时,健全的法治、开放的资本市场、稳定的宏观政策,是培育创新生态必不可少的土壤。论坛的主题叫“创新无界,智见未来”。我想,所谓的“智见”,或许就是在这种激烈的变化中,依然能看清那股推动真实价值创造的底层力量吧。你对AI的落地或者中国企业科技出海有什么看法?欢迎在评论区聊聊。SFC出品丨财经早察工作室总统筹丨陈晨星执行统筹丨祝乃娟监制丨洪晓文 曾婷芳主播丨董静怡剪辑丨实习生 苏磊设计丨王冰拍摄丨肖航21君荐读 -
商家祭出“巨型吊牌”这个新法宝,就能降低网购退货率吗? 半月谈评论员王梓涵 近期,商品挂“巨型吊牌”的话题引发了热议,不少网购消费者反映,服饰类吊牌变得越来越“厚重”。有的吊牌堪比A4纸,印满成分说明与洗涤禁忌;有的串着三四张卡片,附带防伪码、售后须知甚至密码锁。商家在吊牌上大做文章,核心诉求是为了防范“蹭穿”等行为,从而降低退货率。但对消费者而言,这一举动则是将少数人的违约行为转嫁给了全体消费者。根据《网络购买商品七日无理由退货暂行办法》,网购商品到货后7日内可无理由退货(定做、鲜活易腐等四类商品除外),消费者退货需保证商品完好。这一规则本是为保护消费者权益,让人们可以因货不对板、质量瑕疵、尺码不符等合理诉求申请退货。但部分消费者却钻了政策空子,网购多件衣物试穿拍照后退回、使用一段时间后以“质量问题”为由退货,让商家不得不承担额外的物流成本与商品损耗。为阻止消费者“蹭穿”,防范恶意退货行为,一些商家通过强调“吊牌破损不予退货”,并使用复杂吊牌制造穿着不适感来进行应对。与此同时,由于网购平台未建立有效的信用识别与风险预警机制,无法区分正常退货与恶意行为,也迫使商家只得采取“一刀切”的防御行为。对此,多数消费者虽能理解商家应对恶意退货的无奈,但也提出了质疑:为何个别失信行为,要以集体限制的方式进行防范?“巨型吊牌”背后,凸显出商家与消费者之间日益增长的信任焦虑。重塑商家与消费者的信任,需要多方协同破局。消费者应坚守诚信底线,理性行使退货权利,摒弃“蹭穿”等不当行为;商家需以更透明的商品信息、更优的质量、更合理的售后政策主动换取信任,而非依赖“巨型吊牌”被动防御;平台作为核心枢纽,必须承担起治理责任,构建精细治理体系,建立基于消费行为的信用评级机制、推动商品展示标准化;监管部门则有必要补充细化“七天无理由退货”规则,明确“商品完好”的具体标准,划定权责边界。全社会也需要通过舆论引导与公共讨论,让消费者和商家都意识到,“蹭穿”和制造“巨型吊牌”的行为,都破坏了良好的消费环境。唯有建立行之有效的消费及维权机制,让守信者受益,让失信者受限,让消费者放心消费,让商家安稳经营,双方才能摆脱欺骗与防备的内耗,重建健康可持续的网购生态。来源:半月谈新媒体 -
资本加码、生态卡位 人形机器人企业竞夺“链主”之位 聂英好/摄证券时报记者 聂英好伴随着“扎堆上马”“重复建设”的担忧,人形机器人行业资本运作和产业整合的脚步并未停止。近期,优必选发布再融资计划,加码上下游供应链整合;智元机器人与高瓴联手,以“投早投小”挖掘核心技术标的。业内人士分析,目前人形机器人企业的投资,多侧重于通过投资核心零部件厂商保障供应链与产能扩张,同时通过投资换回大客户订单。虽然出手方式各有不同,但背后相通的是,头部企业均试图通过整合上下游,实现对产业价值链条的深度掌控。头部企业积极对外投资2025年具身智能赛道“三足鼎立”雏形初现:智元机器人在技术与生态布局方面抢占先机;宇树科技以自研自产的技术和成本控制能力,实现价格突围和出货量领先;优必选作为在港股上市的“人形机器人第一股”,专注工业场景商业化落地和资本运作能力。近期,智元、优必选等头部企业向外投资步伐提速。优必选近日公告宣布配股融资,拟以每股98.80港元的价格配售约3146.80万股新H股,募资净额约30.56亿港元。优必选本次配售事项旨在整合上下游供应链,巩固及加强公司在人形机器人产业链的链主地位,从而强化公司在工业制造应用场景的战略布局。优必选表示,公司拟于未来两年内投资或收购公司业务价值链中具潜力的上下游目标企业,或与相关行业整合或成立合营实体。同样在近日,智元机器人与高瓴联手布局早期投资的战略正式落地。日前,龙旗科技、宁波韵升、宁波华翔三家上市公司相继公告,拟参与投资上海瓴智新创创业投资合伙企业(以下简称“瓴智新创”)。该基金由珠海高瓴私募基金管理有限公司担任管理人,将聚焦具身智能产业链相关创新企业展开投资。瓴智新创定位为创业投资基金,遵循“投早、投小”原则,投资范围覆盖具身智能产业链上下游。其中,上游包括伺服系统、电机、控制器、减速器、传感器等关键原材料及零部件,以及关键软件系统与人工智能算法;中游涉及机器人本体制造与集成;下游则延伸至机器人应用解决方案。值得关注的是,作为一家创业公司,智元机器人本身也在大规模向外投资,一方面在二级市场上收购科创板上市公司上纬新材,另一方面在一级市场深度布局具身智能全产业链,不仅向外出资组建合资公司、投资具身智能机器人上下游公司,还积极寻求技术和业务合作。企查查显示,截至12月2日,智元机器人在近1年内投资了约30家企业,包括战略投资产业链上下游创企、联手风险资本成立创投公司以及与产业资本、国有资本组建的合资公司。谋求“链主”之位从智元“投早投小”布局具身智能生态到优必选再融资,这两家头部人形机器人企业向外投资的动作与计划,被市场解读为具身智能产业链“链主”地位之争。“目前机器人企业的投资,更多侧重于通过投资核心零部件厂商保障供应链与产能扩张,也能够通过投资来换回大客户订单。”快思慢想研究院院长田丰在接受证券时报记者采访时表示。智元机器人注重“投早投小”,优必选希望通过再融资整合上下游供应链,两种策略背后核心诉求虽各有侧重,但二者最终殊途同归:均是以自身为核心支点,构建覆盖产业链关键节点的协作体系,巩固自身在产业生态中的“生态位”。田丰分析,智元机器人以通用人形机器人为目标,通过投资早期科创企业,广播种才有可能尽早掌握具有颠覆性潜力的新技术,就像Google 4亿美元投资收购DeepMind一样;而优必选则专注深耕制造业能解决生产线问题的工业人形机器人,需要针对工业高精准度、耐久性、长续航等专用需求定制核心零部件,所以投融资整合上下游供应链成为其提升核心竞争力的必由之路。对于智元机器人而言,其大幅向外投资的背后原因在于,智元认为具身智能的突破并非单一技术的跃升,而是得益于生态协同。在8月举办的智元机器人首届合作伙伴大会上,智元机器人董事长兼CEO邓泰华表示,生态共建是具身智能产业规模化的核心驱动力,智元机器人也将其明确列为公司核心战略之一。他坦言,智元本身并不是财务投资,在这个过程中,公司也一直在积累投资的产业经验,包括系统化体系的建设,在这个基础上打算进一步增强产业生态建设。与此同时,作为具身智能领域的明星公司,智元在资本方面“家底丰厚”,这也是智元可以“应投尽投”的原因。据邓泰华透露,即便是在无任何营收情况下,智元机器人现有现金流也能支撑三年,成立至今,智元获得了顶级财务投资和产业投资方的支持。“基本处于想融资就可以融的状态,但核心还是基于业务能力的规划开展。”8月1日,智元机器人获得国际集团战略入股,本次投资由LG电子(LG Electronics)、韩国未来资产集团(Mirae Asset)联合领投。根据公开信息,这是LG电子在具身智能领域全球首次对外布局;7月15日,智元机器人获得百年跨国企业正大集团旗下正大机器人的战略投资,具体融资金额未对外披露。在田丰看来,目前人形机器人产业链的链主企业尚未出现,链主应是全产业链依赖的关键环节,例如机器人芯片、机器人OS(大小脑)、机器人协同网络,仅靠硬件优势容易被竞争对手模仿,而软硬一体的核心技术能力,则能加深护城河。在担忧中快进前有接二连三数亿元级规模的人形机器人订单,现有“高举高打”的产业链投资节奏,人形机器人产业展现出活力迸发的行业生态。不过,关于行业炒作、众多“泡沫”、大量产品同质化的讨论声一直持续不断。11月27日,国家发改委新闻发言人李超表示,具身智能产业规模实现跨越式发展的同时,也要着力防范重复度高的产品“扎堆”上市等风险。“当前人形机器人在技术路线、商业化模式、应用场景等方面尚未完全成熟,随着新兴资本加速入场,中国目前已有超150家人形机器人企业,且数量不断增加,其中半数以上为初创或‘跨行’入局。这对鼓励创新来讲是一件好事,但也要着力防范重复度高的产品‘扎堆’上市、研发空间被压缩等风险。”李超指出。据不完全统计,截至10月,2025年全球共发布超130款人形机器人整机新品;同时,人形机器人行业融资事件超160笔,总金额超400亿元。虽然大多数人形机器人新品均有场景适配特色与形态,但每一次新品的发布并不意味着新的一轮技术更迭,反而面临着技术路线趋同、产品功能相似等问题。例如,众多人形机器人本体厂商都遵循“整机集成+通用大模型”的路径开发产品,导致产品同质化程度较高。面对担忧,相关部门在行动。国家发改委相关负责人表示,将结合“十五五”相关专项规划的编制工作,推动具身智能产业健康规范发展。其中重点提及,加快关键核心技术攻关,支持企业、高校、科研机构等围绕“大小脑”模型协同、云侧与端侧算力适配、仿真与真机数据融合等技术进行攻关,解决产业卡点堵点问题;推动训练与中试平台等基础设施建设,促进全国范围内具身智能技术、产业资源整合和开放共享,加速具身智能体在真实场景中落地应用。田丰认为,向外投资也是攻坚研发技术问题的一种途径。不过他提示,核心技术竞争力是买不到的,应重视生态配套和基础科研。“快速取得‘技术代差’,形成‘领先技术—大客户场景—规模化量产—营收加速度’,才能拿到2026年晋级赛的入场券。” -
资本加码、生态卡位 人形机器人企业竞夺“链主”之位 聂英好/摄证券时报记者 聂英好伴随着“扎堆上马”“重复建设”的担忧,人形机器人行业资本运作和产业整合的脚步并未停止。近期,优必选发布再融资计划,加码上下游供应链整合;智元机器人与高瓴联手,以“投早投小”挖掘核心技术标的。业内人士分析,目前人形机器人企业的投资,多侧重于通过投资核心零部件厂商保障供应链与产能扩张,同时通过投资换回大客户订单。虽然出手方式各有不同,但背后相通的是,头部企业均试图通过整合上下游,实现对产业价值链条的深度掌控。头部企业积极对外投资2025年具身智能赛道“三足鼎立”雏形初现:智元机器人在技术与生态布局方面抢占先机;宇树科技以自研自产的技术和成本控制能力,实现价格突围和出货量领先;优必选作为在港股上市的“人形机器人第一股”,专注工业场景商业化落地和资本运作能力。近期,智元、优必选等头部企业向外投资步伐提速。优必选近日公告宣布配股融资,拟以每股98.80港元的价格配售约3146.80万股新H股,募资净额约30.56亿港元。优必选本次配售事项旨在整合上下游供应链,巩固及加强公司在人形机器人产业链的链主地位,从而强化公司在工业制造应用场景的战略布局。优必选表示,公司拟于未来两年内投资或收购公司业务价值链中具潜力的上下游目标企业,或与相关行业整合或成立合营实体。同样在近日,智元机器人与高瓴联手布局早期投资的战略正式落地。日前,龙旗科技、宁波韵升、宁波华翔三家上市公司相继公告,拟参与投资上海瓴智新创创业投资合伙企业(以下简称“瓴智新创”)。该基金由珠海高瓴私募基金管理有限公司担任管理人,将聚焦具身智能产业链相关创新企业展开投资。瓴智新创定位为创业投资基金,遵循“投早、投小”原则,投资范围覆盖具身智能产业链上下游。其中,上游包括伺服系统、电机、控制器、减速器、传感器等关键原材料及零部件,以及关键软件系统与人工智能算法;中游涉及机器人本体制造与集成;下游则延伸至机器人应用解决方案。值得关注的是,作为一家创业公司,智元机器人本身也在大规模向外投资,一方面在二级市场上收购科创板上市公司上纬新材,另一方面在一级市场深度布局具身智能全产业链,不仅向外出资组建合资公司、投资具身智能机器人上下游公司,还积极寻求技术和业务合作。企查查显示,截至12月2日,智元机器人在近1年内投资了约30家企业,包括战略投资产业链上下游创企、联手风险资本成立创投公司以及与产业资本、国有资本组建的合资公司。谋求“链主”之位从智元“投早投小”布局具身智能生态到优必选再融资,这两家头部人形机器人企业向外投资的动作与计划,被市场解读为具身智能产业链“链主”地位之争。“目前机器人企业的投资,更多侧重于通过投资核心零部件厂商保障供应链与产能扩张,也能够通过投资来换回大客户订单。”快思慢想研究院院长田丰在接受证券时报记者采访时表示。智元机器人注重“投早投小”,优必选希望通过再融资整合上下游供应链,两种策略背后核心诉求虽各有侧重,但二者最终殊途同归:均是以自身为核心支点,构建覆盖产业链关键节点的协作体系,巩固自身在产业生态中的“生态位”。田丰分析,智元机器人以通用人形机器人为目标,通过投资早期科创企业,广播种才有可能尽早掌握具有颠覆性潜力的新技术,就像Google 4亿美元投资收购DeepMind一样;而优必选则专注深耕制造业能解决生产线问题的工业人形机器人,需要针对工业高精准度、耐久性、长续航等专用需求定制核心零部件,所以投融资整合上下游供应链成为其提升核心竞争力的必由之路。对于智元机器人而言,其大幅向外投资的背后原因在于,智元认为具身智能的突破并非单一技术的跃升,而是得益于生态协同。在8月举办的智元机器人首届合作伙伴大会上,智元机器人董事长兼CEO邓泰华表示,生态共建是具身智能产业规模化的核心驱动力,智元机器人也将其明确列为公司核心战略之一。他坦言,智元本身并不是财务投资,在这个过程中,公司也一直在积累投资的产业经验,包括系统化体系的建设,在这个基础上打算进一步增强产业生态建设。与此同时,作为具身智能领域的明星公司,智元在资本方面“家底丰厚”,这也是智元可以“应投尽投”的原因。据邓泰华透露,即便是在无任何营收情况下,智元机器人现有现金流也能支撑三年,成立至今,智元获得了顶级财务投资和产业投资方的支持。“基本处于想融资就可以融的状态,但核心还是基于业务能力的规划开展。”8月1日,智元机器人获得国际集团战略入股,本次投资由LG电子(LG Electronics)、韩国未来资产集团(Mirae Asset)联合领投。根据公开信息,这是LG电子在具身智能领域全球首次对外布局;7月15日,智元机器人获得百年跨国企业正大集团旗下正大机器人的战略投资,具体融资金额未对外披露。在田丰看来,目前人形机器人产业链的链主企业尚未出现,链主应是全产业链依赖的关键环节,例如机器人芯片、机器人OS(大小脑)、机器人协同网络,仅靠硬件优势容易被竞争对手模仿,而软硬一体的核心技术能力,则能加深护城河。在担忧中快进前有接二连三数亿元级规模的人形机器人订单,现有“高举高打”的产业链投资节奏,人形机器人产业展现出活力迸发的行业生态。不过,关于行业炒作、众多“泡沫”、大量产品同质化的讨论声一直持续不断。11月27日,国家发改委新闻发言人李超表示,具身智能产业规模实现跨越式发展的同时,也要着力防范重复度高的产品“扎堆”上市等风险。“当前人形机器人在技术路线、商业化模式、应用场景等方面尚未完全成熟,随着新兴资本加速入场,中国目前已有超150家人形机器人企业,且数量不断增加,其中半数以上为初创或‘跨行’入局。这对鼓励创新来讲是一件好事,但也要着力防范重复度高的产品‘扎堆’上市、研发空间被压缩等风险。”李超指出。据不完全统计,截至10月,2025年全球共发布超130款人形机器人整机新品;同时,人形机器人行业融资事件超160笔,总金额超400亿元。虽然大多数人形机器人新品均有场景适配特色与形态,但每一次新品的发布并不意味着新的一轮技术更迭,反而面临着技术路线趋同、产品功能相似等问题。例如,众多人形机器人本体厂商都遵循“整机集成+通用大模型”的路径开发产品,导致产品同质化程度较高。面对担忧,相关部门在行动。国家发改委相关负责人表示,将结合“十五五”相关专项规划的编制工作,推动具身智能产业健康规范发展。其中重点提及,加快关键核心技术攻关,支持企业、高校、科研机构等围绕“大小脑”模型协同、云侧与端侧算力适配、仿真与真机数据融合等技术进行攻关,解决产业卡点堵点问题;推动训练与中试平台等基础设施建设,促进全国范围内具身智能技术、产业资源整合和开放共享,加速具身智能体在真实场景中落地应用。田丰认为,向外投资也是攻坚研发技术问题的一种途径。不过他提示,核心技术竞争力是买不到的,应重视生态配套和基础科研。“快速取得‘技术代差’,形成‘领先技术—大客户场景—规模化量产—营收加速度’,才能拿到2026年晋级赛的入场券。” -
Robotaxi赛道杀入一条巨鲶 作者 | 王小娟 编辑 | 柴旭晨曹操出行在Robotaxi的野心更大了。12月3日,曹操出行在Robotaxi方面宣布战略升级。CEO龚昕宣布了 “十年百城千亿”战略目标:未来十年在全球设立五大运营中心,将Robotaxi服务推广至一百座城市,累计实现千亿的总交易价值。具体而言,曹操出行首次完整阐述了Robotaxi的“三步走”战略:初期为技术验证与小规模测试运营;当前阶段将完成从主驾安全员到无人化运营的过渡,并探索有人驾驶和无人驾驶混合运营;未来将以Robotaxi完全定制车型在全球范围商业化运营。龚昕表示,在Robotaxi2.0阶段,曹操出行将进一步提升大规模车队的自动化运营能力,上线远程安全服务平台,并全面应用数字化资产管理系统,将运营优势与智能座舱、智能驾驶技术深度融合,实现Robotaxi无人化运营闭环。当前,曹操出行将其战略定位为“智能定制车+智能驾驶技术+智能运营”三位一体发展模式。这一模式整合了吉利控股集团的整车研发与制造能力、曹操出行自身的运营平台数据积累,以及生态伙伴的智能驾驶技术,形成了Robotaxi全要素闭环。同时,曹操出行已经开始实践面向未来的城市交通枢纽,全球首个 “绿色智能通行岛”正式启用。吉利控股集团安聪慧表示:“曹操出行不仅是吉利控股旗下的科技出行平台,更是实现Robotaxi商业化运营最重要的载体。”这里的绿色智能通行岛不是简单的充电站或停车场,而是对未来城市出行基础设施的前瞻性构建。这一枢纽集自动换电、自动清洁、车辆内务整理、智能调度、自动结算等功能于一体。值得关注的是,通行岛预留了eVTOL起降坪和充电接口,为未来“空地一体化”交通网络打下基础。曹操出行已为此制定了可复制的建设标准,计划在未来城市推广。深圳越疆科技具身智能人形机器人Atom已作为首批“智能员工”入驻“绿色智能通行岛”,承担迎宾接待、Robotaxi运维等角色。这体现了通行岛在自动化运维方面的创新。绿色智能通行岛将实现Robotaxi与沃飞长空eVTOL的无缝接驳,并由时空道宇低轨卫星网络提供全域通信覆盖以及高精度定位数据播发,共同构建 “天地空一体化”出行蓝图。值得一提的是,近日,曹操出行和千里智驾签署战略合作协议,双方将深化在Robotaxi领域的合作,共同加速智能驾驶技术的规模化应用与商业化落地,这也将进一步提升曹操出行在Robotaxi领域的竞争力。当前,Robotaxi市场正从“技术可行性验证”阶段转向“可复制的商业化扩张”阶段。行业数据显示,Robotaxi的商业化拐点已至,开始进入赚钱阶段。另外,主要玩家也在加速全球布局。Waymo目前在美国四个城市运营着约1500辆车的车队,计划到2026年再增加2000辆。曹操出行等玩家也在阿布扎比有所布局。可见,Robotaxi行业竞争已超越单纯的算法或硬件层面,进入智能定制车、驾驶技术与运营体系的全要素较量阶段。高盛预测,到2035年,中国Robotaxi市场规模将达到470亿美元。龚昕预计,2035年中国将有190万辆Robotaxi参与运营,市场规模超3200亿元。成本控制成为盈利关键。曹操出行通过定制车+车服解决方案,与市场典型纯电动车相比,其定制车平均TCO(总拥有成本)降低36.4%。这种成本优化能力是规模化商业化的关键。盈利时间表也逐渐清晰。小马智行CEO彭军曾表示,“盈利时点大概是2028年、2029年”。全球范围内,已有超过1500辆Robotaxi在不同城市的街头提供无人驾驶服务。技术、政策和市场三股力量正在推动Robotaxi从科幻走向现实。随着传统车企、科技公司和出行平台的集体加码,一场关于未来出行主导权的竞争已经拉开帷幕。 -
“人工智能+”区县发展与治理论坛成功举办 12月1日,由中国互联网协会主办,河北省互联网协会、河南省互联网协会、联通数据智能有限公司协办的2025“人工智能+”产业生态大会分论坛——人工智能+区县发展与治理论坛在北京中关村成功举办。本次论坛在河北省互联网协会的积极协办与下,组织省内20多个特色重点区县组团参会,并在论坛上分享一线实践经验,为大会提供了丰富的县域样本。据介绍,论坛汇聚政企学研各界代表,共同探索人工智能赋能区县发展及治理的创新路径,为推动我国“十五五”期间区县经济高质量发展和治理体系现代化凝聚智慧、贡献方案。论坛当天河北省通信管理局副局长宋茂恩、河北省互联网协会秘书长郭伟、中国互联网协会副理事长兼常务副秘书长陈佳春、中国互联网协会创发部主任周淑妍,以及人工智能领域的专家学者、行业精英和省内20多个特色重点区县相关负责人出席活动。 图为河北省邯郸市大名县常务副县长王培发言。河北省邯郸市大名县常务副县长王培在实践分享环节中介绍了AI赋能大名县治理与发展的认识和经验。“我们的AI政务助手‘郑小明’能让AI在具体场景中发挥作用,它不仅能7x24小时‘秒问秒答’,更能‘替群众想’,主动提醒、提前预警,实时提醒群众补正材料,提前30天推送企业经营许可证续期指南。‘郑小明’上线以来,累计接待咨询超2.3万条,全县政务服务效率提升70%以上。”王培说,大名县立足实际,将AI视为区县高质量发展的机遇,探索出重视数据底座打造、聚焦场景应用、推动产业赋能、强化人才机制保障的四轮驱动AI落地发展之路。 图为河北省邯郸市大名县政协副主席高蕾发言。在随后以“破局与共生:‘人工智能 + 区县治理与发展’ 的挑战、机遇与路径”为主题的圆桌讨论中,河北省邯郸市大名县政协副主席高蕾在谈到“AI+区县”的人才短板时表示,为了解决乡镇一级缺少专业AI技术人员的问题,大名县构建县、乡、村三级AI人才体系,联合中国互联网协会、北京工商大学等机构,对300名干部开展AI实操培训和沉浸式研学,在乡镇培育23名AI指导员,强化人才要素保障。区县作为国家治理体系的基础单元和经济社会发展的关键载体,承担着“经济发展主战场”与“社会治理最前沿”的双重使命。随着“人工智能+”行动的逐步深入,人工智能技术正以前所未有的速度融入区县发展的各个领域,不仅为区县产业转型升级注入新动能,也为区县治理现代化提供新工具。县域经济是全省发展的重要基石,河北省共有167个县级行政区划,截至目前,河北省产业集群包含县域集群共333个,其中国家级中小企业特色产业集群24个,位列全国榜首,目前正在集中力量打造107个省级重点特色产业集群,以“共享智造”赋能为突破,县域经济活力迸发。 图为2025“人工智能+”产业生态大会河北省AI赋能区县发展与治理成果展现场。大会期间,河北省AI赋能区县发展与治理成果展聚集了来自邯郸市大名县、衡水市景县、石家庄行唐县等具有代表性的区县特色产业项目,吸引了众多参会者驻足观摩、交流洽谈。(河北新闻网)