多数能源专家对霍尔木兹海峡的判断竟然错得这么离谱,挺让人意外的。
这个错误的根本原因是什么?中国的储备比预期更多,美国加大出口的速度比预想更快,而且实际上有更多船只经由阿曼航线穿越海峡?
我真的很好奇。
AI 服务器需求正在演变为三个市场
文章把市场分为三类:
- 超大规模云厂商自有硬件:大型云平台为自己建设和运行的产能。
- 新云(neocloud)与第三方 AI 工厂:拥有基础设施并对外出租 GPU 算力的运营商。
- 企业与私有 AI 工厂:公司、政府和受监管行业在自有场所内部署和运行的系统。
作者强调,“消费”仍然重要,但它应该作为单独视图来衡量产能利用率和需求持久性,而不应重新并入市场规模。电力产能也需要同样的口径:兆瓦(megawatt)决定什么能落地,所有权决定该把硬件算到谁头上。
文章还给出一个判断:新增增长的边际资金正在向外迁移。…
作为中转站站长,讲讲关于 Claude封号最大的误区
我们那个“高度觉醒”时代还有一则有趣又近乎疯狂的轶事:当时我们有一名员工试图推动修改我们的服务条款,要求凡是被 SPLC 不喜欢的组织,都不得使用我们的软件。真是个骗局。所有这一切都是。
为什么要这样对我
NEWS:两年前,打击数字仇恨中心(Center for Countering Digital Hate)的一份内部文件把“搞垮 Musk 的 Twitter”和“触发欧盟与英国的监管行动”列为年度优先事项。
CCDH 的联合创始人是 Morgan McSweeney,他后来成了英国首相 Keir Starmer 的首席幕僚。
本周,Starmer 威胁要取消 X 的自我监管权。
英国监管机构 Ofcom 已就 Grok 对 X 展开正式调查。
Ofcom 最多可对 X 处以其全球营收 10% 的罚款,或直接在英国全面封禁 X。
Starmer 本周还宣布,英国将从 2027 年春季起禁止 16 岁以下青少年使用包括 X 在内的社交媒体。
这份 2024 年的文件由记者 Paul Thacker 和 Matt Taibbi 公开。
(无正文)
如果我们只为人工智能汲取太阳能量的百万分之一,想到这一点都令人敬畏,因为那将远远超过全人类智能总和的一百万倍。
Stockfish 是世界上最强的国际象棋引擎(Elo 约 3650)。它碾压特级大师,仿佛他们只是新手。
“Stockfish 级编码(Stockfish-level coding)”指的是 AI 以同样超人级别进行编程:以顶尖的速度、正确性和规模编写、调试、优化并架构复杂代码,远远超过哪怕最优秀的人类开发者。永不疲倦的天才程序员模式。
由 Grok Imagine 制作
[打脸] [打脸] [打脸] [打脸]
SPLC = 可憎、欺诈的机构
非结构化数据是成功部署 AI 的关键吗?
这期对话围绕一个核心问题展开:为什么很多 AI 试点看起来热闹,最后却很难进入生产并产生 ROI。Hyland 的三位受访者从内容管理、企业上下文、agent 治理和保险理赔四个角度给出了同一条答案:真正能落地的不是“一个更大的模型”,而是把非结构化数据变成受治理、可检索、可执行的上下文层,再把它嵌进真实业务流程里。
Jitesh S. Ghai 先指出,AI 落地失败往往有两个原因,一是企业做试点只是出于 FOMO,而不是认真改变工作方式;二是只盯着模型本身,却忽略了企业内容的复杂性。Hyland 认为,企业里大量关键数据都藏在合同、病历、保单、理赔记录和各类文档中,必须先把这些内容结构化、治理起来,AI 才能基于最新上下文做判断和行动。…
哇,这太疯狂了!
🚨 天哪。FBI 已破获一场爆炸无人机恐怖阴谋,这起阴谋针对的是特朗普总统在白宫举办的 UFC Freedom 250 活动。
他们计划引爆装满爆炸物的无人机,并部署一支“预先部署的狙击小组”来对付人群。
“第二波人马将冲击白宫大门。”
一个由近 24 名嫌疑人组成的网络已被锁定,至少 5 人已被拘押 @FBIDirectorKash
感谢法律与秩序!
还有很多事情要一起做。很高兴与 @SpaceX 联手打造有用的 AI。
SpaceX 已经行使选择权,将以全股票交易(all-stock transaction)方式收购 @cursor_ai,目标是打造世界上最有用的 AI 模型。
过去几个月里,SpaceXAI 一直在与 Cursor 共同训练一个模型,该模型很快会在 Cursor 和 Grok Build 中发布。
我们期待与 Cursor 团队紧密合作,推进我们的前沿 AI 能力。
🚨 重磅:代理司法部长 Blanche 和 FBI 局长 Patel 宣布,大陪审团已就 11 项指控起诉左翼非营利组织 Southern Poverty Law Center(SPLC)
这太重磅了!
根据代理司法部长 Blanche 的说法,SPLC 说自己在“对抗白人至上主义”,但他们却通过付钱给线人来“煽动种族仇恨”,从而“制造他们声称要揭露的极端主义”。
最妙的是?他们是在阿拉巴马州中区被起诉的!
他们完蛋了!🔥
SPLC 被指控犯有 6 项电信诈骗、4 项银行诈骗,以及 1 项洗钱共谋罪。
我们很高兴与 @SpaceX 联手,推动有用 AI 的前沿。Cursor 很快就会迎来显著改进。
SpaceX 已经行使选择权,将以全股票交易(all-stock transaction)方式收购 @cursor_ai,目标是打造世界上最有用的 AI 模型。
过去几个月里,SpaceXAI 一直在与 Cursor 共同训练一个模型,该模型很快会在 Cursor 和 Grok Build 中发布。
我们期待与 Cursor 团队紧密合作,推进我们的前沿 AI 能力。
AI 将实现 Stockfish 级的编码和通用计算机使用能力
AI 将实现 Stockfish 级的编码和通用计算机使用能力
#U卡
FYI
《Ready资金如何退出》
@taresky里面的余额可以用app的发送功能,直接发到币安的usdc钱包(starknet链),建议先发送 1 u测试
//@易立竞:《言外之易》对话向佐,正片已上线,全长近4小时。重新打量每个生命🌸
【《言外之易》EP02丨#向佐给易立竞说父亲花五亿扶不起他#】向佐身上从不缺标签——向华强之子、娱乐圈黑红顶流。每一个标签背后,都是一段他人定义的故事。
“我之前真的没有为自己活过。”向佐说。
这一次,易立竞用提问,让他用语言为自己画了一幅自画像。
近四小时的对话,谈及大家庭,聊了小家庭。也提到自己用了40年才活明白的那些事。
新浪新闻出品《#言外之易#》第2期,@易立竞对话@向佐JackyHeung正片上线。#视频播客开麦计划#
#北京退衣姐刑事拘留#这个案子简直了。
史某28岁,年轻女性,化妆师,爱美,爱打扮,家庭条件不错,不缺钱,但是贪小便宜,利用网购漏洞,4年期间累计退货1036次,涉案89.4万,涉案金额巨大,目前已被刑拘。#微博视频号续航计划#
她的套路是: ①先是,网购寄到一个无人收货的A地址②再是,叫闪送送到B地址后掉包快递③之后,完成掉包后再叫闪送送回A地址④最后,谎称出差不能收快递,让快递员退回快递
服了。 #退衣姐作案手法曝光##退衣姐调包退货干了4年#
还第一次遇到,机场不让飞机关门,让等俩乘客,已经超时半小时了🐶😲[傻眼]说是值完机人不见了🤔[疑问]
//@纪春生在美国:目前180万了。[跪了] http://t.cn/AXa9aNOb
#泌阳县通报21车冻货跨省偏航被查扣#窝案,没看懂,是一个什么模型故事,货满满是个什么平台。看了评论区,货满满不是货拉拉的弟弟,但很离谱。
大v@纽太普同学 :现在,泌阳县市场监督管理局原局长王磊,县市场监督管理局综合行政执法大队三中队中队长张兴都被采取了留置措施,可见确实已经是个窝案,还有可能是同时牵涉政府机构、货运平台和第三方企业的窝案。
封面新闻记者曾业李兴罡
7.8吨冷冻猪脚,从广西南宁出发,原本运往广东佛山,却蹊跷“偏航”千多公里,在河南被查扣。去年12月5日,查扣者河南泌阳县市场监督管理局称,11月底,这批“偏航”猪脚已由生产企业依法召回。
这车猪脚缘何“偏航”?货主高先生暂未收到任何说法。不过,他发现,“偏航”车辆晋A0G0N9,曾有两次从广西往河南运送冷冻肉类产品的经历,货品查扣方同样是河南泌阳县市场监管局。
12月5日,高先生的发现,得到广西南宁另一家食品企业负责人李先生的证实。李先生称,他曾找“偏航”车辆晋A0G0N9承运一批冷冻鸡爪。跟“冷冻猪脚偏航”如出一辙,运送目的地本是湖南,这批货被“偏航”运到了河南,于今年9月被泌阳县市场监管局查扣至今。
“失踪”猪脚被召回案件已移交至广西南宁处理
10月29日,重7.8吨、价值逾20万元的冷冻猪脚,在广西南宁装车,目的地为广东佛山。接单的货车,车牌号为晋A0G0N9,由发运者高先生托人通过网上平台下单。
10月30日上午,客户询问高先生,为何这批货物还未送到。高先生联系司机,发现对方电话一直无人接听。高先生查询货物去向,发现司机未按照约定线路运输。
“司机居然把目的地定到了河南郑州!我们查询‘运满满’平台,显示司机手机定位信息从10月29日17:16就消失了。”高先生怀疑司机盗窃货物,立即找到南宁警方报案。…
10月30日中午,司机突然给高先生发信息,称这批货物被河南省泌阳县市场监管局查扣。
“这批冷冻猪脚不能排除违法嫌疑。”河南省泌阳县市场监管执法人员回应,涉案猪脚被扣押在泌阳县东冷库的情况属实,他们是接到群众举报后对这批猪脚进行依法查扣的。经查,这批猪脚的包装涉嫌虚假标注,部分包装袋为废弃包装,且包装所载信息不规范。
“生产企业已召回这批猪脚,该案已移交至企业所在地的广西南宁市场监管部门处理。”12月5日,泌阳县相关执法人员告诉封面新闻记者,按照“属地管理”原则,案件后续处理工作已移交。
离奇“偏航”:涉案车辆在河南泌阳频繁被扣
运送7.8吨猪脚的晋A0G0N9货车,并非首次“异常”出现在河南泌阳。
去年年9月,这辆货车运输了557袋冷冻鸡爪,本应从广西南宁运往湖南怀化,同样出现蹊跷“偏航”的情况,在进入河南泌阳境内后,所运货物被泌阳县市场监管局查扣。
557袋冷冻鸡爪被查扣,李先生多次找同行讲述自己的遭遇。几天前,他加入一个临时组建的群聊,发现自己并非唯一的“受害者”。
一位来自广东茂名的货主,运输一批牛副产品,原本计划的路线途经广西至广东,被运输车辆拉至河南泌阳扣押;一名广西南宁武鸣区的商户,运送猪副产品到湖南长沙,也被货车司机以类似的方式,“偏航”到河南泌阳境内被群众“精准举报”而查扣。高先生遭遇的“冷冻猪脚失踪”事件,由于已召回涉案的7.8吨猪副产品,最近两天被热议。
“无论是猪副产品、牛副产品还是鸡副产品,被扣押的过程都高度雷同。”李先生在与广西南宁警方的沟通中发现,涉案的晋A0G0N9司机,除了运输过他们被扣押的鸡爪,还曾在今年3月因同类案件被南宁警方调查处理过。
“在我们辖区以外的情况,我们确实不清楚。”泌阳县市场监管局执法人员回应称,今年9月至11月,他们接到的群众举报中,确实有一辆冷藏货车先后两次出现。第一次运的是鸡爪,第二次运的是猪脚,但两批货物属不同企业,司机也不是同一人。“我们也觉得奇怪,但没去深究具体运输路线。接到了群众举报,我们就必须依法到场核查,否则就是不作为了。”
同样的疑惑:跨省执法进度缓慢
“查扣的冷冻猪脚、冷冻鸡爪,我们都请第三方机构进行了抽检。其中,涉案的鸡爪存在微生物超标及防腐剂使用不当等问题,不合格;涉案的猪脚主要是标签标识和包装不规范。”泌阳县市场监管局执法人员称,无论是标签标识违法,还是产品质量违法,依法,他们都可以处罚。
“跨省办案,难度不小。”该执法人员以冷冻鸡爪查扣案件为例称,虽然查实了违法事实,但尚未结案,“涉案鸡爪的货主,一直没到泌阳县来接受调查处理。”
该执法人员解释,直至10月26日,收到广西南宁市场监管部门复函确认相关信息后,他们才通过电话、短信等方式,多次通知货主前来认领涉案物品并接受处理,“对方一直不来,我们也很为难——仓储费每天都在增加,不合格的冷冻鸡爪也不能长期保存”。
“当事人必须到场,确认货物归属后,才能启动后续处理流程。”该执法人员补充说,对于不宜长期保管的涉案物品,若货主逾期不领取,须依法进行无害化处理。但前提是,必须完成身份确认程序,确保权属清晰。
“食品安全案件遵循‘属地管理’原则,即,违法行为发生地或企业注册地拥有主要执法权。”知情人士透露,10月下旬,广西南宁公安机关已派出警力,赴河南泌阳调取相关案件的证据资料,目前正在调查中。
李先生则称,他们的鸡爪被扣押后,广西南宁警方迅速立案,曾派人赴河南泌阳协调提货。然而,泌阳县市场监管局以“我方先立案”为由拒绝移交货物,“说要等他们的行政调查结束”。
目前,李先生及其他几位有类似遭遇的人员,正在尝试通过行政复议、向上级市场监管部门投诉、共同聘请律师帮忙维权等方式寻求解决。
最新,大皖新闻#21车冻货偏航涉事公职人员被立案# 【#21车冻货偏航河南泌阳被查扣进展#:涉事公职人员被立案调查,受害货主拒绝庭前调解】#21辆货车集体迷路执法岂能偏航# “21车冻货‘偏航’河南泌阳”事件有了进展。涉事的泌阳县市场监督管理局执法大队食药中队长张某,以及该局局长,已被泌阳县纪检监察机关立案调查。
#世界杯两地开幕微博讨论热度全面引爆# 2026年美加墨世界杯揭幕战鸣哨,微博站内赛事讨论迅速升温。24小时内站内赛事相关话题阅读量达26.2亿,同比增长25.96%;发博互动量534.9万,同比增长22.8%;TOP20热搜话题85个,微博成为本届世界杯全网讨论热度的核心聚合场域。这组数据更揭示了一个已然成熟的用户行为——对用户而言,"在微博聊世界杯"与"看世界杯直播",已经成为两种并行且互补的赛事消费方式。http://t.cn/AXaSPYq3
//@i陆三金:👍//@宝玉xp:谢谢大家支持,在飙升榜超过《凡人修仙传》了,可以吹牛了🫰 http://t.cn/AXaKnDvZ
#飙升榜# 宝玉老师@宝玉xp的《图解Skill》在微信读书上也可以读了,已经进入TOP50飙升榜(No.15),在这帮书里冒头也不容易。PS:注重体验的可以买本纸质书,微信读书排版跟纸质书还是相差挺多😂 入手纸质书的同学们,这儿:http://t.cn/AXX45Ovo
推上的国内模型自来水是相当多,开源有人缘。
antirez昨晚连发10条推来说明中国模型不是靠蒸馏美国模型来变强的。
当然antirez说的蒸馏是蒸馏的原始定义大模型输出 logits (输出分布),小模型学习 logits。而现在“蒸馏”这个词已经被滥用了,有很多引申的不同含义,所以相关讨论里还是有很多争议。。
------------------还有一件重要的事:中国模型强,并不是因为它们蒸馏了美国模型。通过 API进行模型蒸馏是*不可能的*。如果有人告诉你相反的说法,那说明他们不懂机器学习:
1. 蒸馏需要访问数量极其庞大的请求,并且必须能获得*完整的 logits*,包括思维链生成过程中的 logits,而思维链通常是被摘要化的。
2. 通过 API 调用进行蒸馏,就像只看到一个极其复杂曲面上的几个点,却仍然能复现这个复杂曲面。从数学上说,这就是科幻。
3. DeepSeek 在 R1 论文中创建的蒸馏版本之所以提升了目标模型,是因为那些目标模型虽然已经在大量 token 上预训练过,但没有接受过“思考”训练;潜在能力本来就在那里。不过即便如此,这些蒸馏版本也并不算特别出色。
4. 你真正能做的是为强化学习流程获取高质量信号。这有点用,但并不关键;首先你得有一套能跑通的强化学习流程,而这才是真正的工程难点所在。
5. 即使你手上有模型,蒸馏也很难:现在已经有很多前沿中国模型可用,但许多实验室,包括欧洲实验室,也无法提供与它们对齐的模型。
6. DeepSeek 已经公布了它们如何搭建预训练、SFT 和 RL 流程的细节。这些结果甚至已经被复现。为什么相比可复现且公开的结果,你更愿意相信“飞天猴子”?他们已经向你展示了自己有能力训练好大模型。…
7a. 当有人坚持这种机器学习上的荒谬说法时,你可以问他们:你声称模型从 Y来源学到了 X能力,那好,请给我展示信息路径。预训练?那需要数万亿 token。
7b. 带验证器的强化学习?没有,因为它需要来自探索的奖励信号。完整 logits?那是教师模型的完整分布,而从 o1或类似模型开始,这些信息根本拿不到。所以信息通道到底是什么?
总结:别再重复这种胡说八道了。即使你的简介里写着“AI专家”,你也只是在向全世界展示你不懂机器学习。
#AI创造营#
//@caozenghui:转发微博
余华大概是大家最熟悉的作家之一了。这次,我们征集了从10岁到100岁的人,想看看不同年龄的人最想问余华什么问题,并带着这些问题,和余华面对面聊一聊。如果你喜欢这期视频,请多多支持我们,并把视频分享给你的朋友们一起看看!#余华# #对谈#
#586.All-in:Anthropic 的Fable风波、AI 国有化、通胀升温与加州选举乱象
本期 All-In 把三条主线串成了一场高密度争论:Anthropic 新模型 Fable 5 引发的开发者反弹,AI 公司是否正在借安全名义制造“谁能用、谁不能用”的新门槛,以及当 AI 继续扩散时,社会到底该如何分配收益、约束风险和定义公共利益。Jason Calacanis、David Sacks 等人围绕数据保留、模型降级、KYC、开源模型、监管俘获、AI 财富税、通胀和加州选举制度展开激烈交锋。节目里最核心的判断很清楚:AI 不可能被关回盒子里,真正的竞争不只在模型能力,还在基础设施、开源生态、产品整合和政治叙事;如果前沿公司把“安全”变成对外部世界的单向筛选,就会逼着企业和开发者转向开源、转向本地部署,并把市场让给别的国家和别的生态。
主要内容
第一段争论围绕 Anthropic。…
日本年轻人应该很羡慕引用原帖:
没有自己的社交媒体的国家才会这么一刀切,无能狂怒了属于是。。。有社交媒体的国家会要求平台调整算法做未成年模式,如果这个国家恰好还制造手机,那未来还会把设备时间管理和社交媒体未成年模式打通,这才是正道。。//@午后狂睡:看看我们会不会也跟进。🐶
#斯塔默警告科技公司若抵制将遭反制# #英国官宣16岁以下全面禁用社交媒体# 【英国官宣:16岁以下全面禁用社交媒体】英国首相斯塔默15日宣布,政府将全面禁止16岁以下未成年人使用一系列社交媒体应用程序,并同步限制游戏及直播平台涉及未成年人的陌生人联系功能。新规预计明年初生效。
斯塔默警告,科技公司若抵制禁令,将面临坚决反制。
英国议会上院1月21日表决通过一项禁止16岁以下未成年人使用社交媒体的修正案,这对英国政府形成压力,敦促其效仿澳大利亚推出类似禁令。
澳大利亚针对16岁以下人群的社交媒体禁令于2025年12月10日正式生效,是世界上第一例通过立法实施此类社交媒体最低年龄限制的举措。
此外,加拿大、巴西、印度尼西亚等国已出台相关法规或宣布类似限制。法国、西班牙、丹麦、泰国、韩国等多国正在研究或制定类似措施。(新华社视频来源:新华国际)
😂😂//@一玶海岸:哈哈哈哈
日本球迷在世界杯赛场收垃圾的行为被日本妹纸们骂翻天了😂说你们男的在家不帮着带娃也不做家务,好你出国了你去帮别人捡垃圾去了
//@互联网的那点事:看来下一代Mac mini将会更加强大和小巧,Mac Studio将会有重大升级,也会变小
AMD推出了一款和Mac mini大小差不多的
本地 AI开发平台
对标英伟达的 DGX Spark(GB10)
128GB统一内存,无需联网可在本地跑最高 2000亿参数的大模型
所有模型运行环境都配置好了,宣称:从开机到出 token只要几分钟...
能跑GPT OSS 120B、Qwen 3.5 122B、Qwen 3.6B、GLM 4.7 Flash 30B等模型
配置置带 Wi-Fi 7、蓝牙 5.4、10GbE有线网口、4个 USB-C口(其中一个用于供电)、一个 HDMI 2.1b输出。
售价 3999美元起
详细:http://t.cn/AXaSzsf6
附带文章:外文资料:www.amd.com
GitHub 热门趋势 2026-06-16
iptv-org / iptv
汇集全球各地公开可用的 IPTV 频道
TypeScript
今日新增 2,657 星 · 总星标 122,865 · Fork 6,598
teslamate-org / teslamate
你自己的特斯拉自托管数据记录器 🚘 [主要维护者= @JakobLichterfeld ]
Elixir
今日新增 33 星 · 总星标 8,228 · Fork 946
Panniantong / Agent-Reach
给你的 AI 智能体装上眼睛,让它看见整个互联网。读取并搜索 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书——一个 CLI,零 API 费用。
Python
今日新增 1,100 星 · 总星标 30,145 · Fork 2,448
Product Hunt Weekly 2026-W24
产品自述:The AI to-do list that does itself
团队成员共 18 人,详见原始页面
Product Hunt 页面没有明确问题陈述;可先参考产品自述和官网。
网页应用
Productivity、Task Management、Virtual Assistants
一个面向 Agent 的发布 API,帮助它们把内容发到 10 个社交平台。
团队成员共 3 人,详见原始页面
Agent 需要统一的发布接口来跨平台分发内容,但每个平台的发布规则、接口和格式都不一样。
开发者工具 / API
API、Social Media、Developer Tools
为任何公司提供自动化教学与学习基础设施。
团队成员共 15 人,详见原始页面
公司需要把培训、知识传递和学习流程系统化,但传统做法往往碎片化、难以规模化。
网页应用
Productivity、Education、Artificial Intelligence
169: 访谈Cerebras早期投资人周楠:英伟达挑战者?Scaling Law的萌芽、被遗忘的百度美研
这期《晚点聊》从 Cerebras Systems 的 IPO 切入,回到十年前百度美国研究院和硅谷 AI 早期投资的现场,讲清楚一件事:今天围绕 AI 算力的竞争,已经不只是“谁的模型更强”,而是“谁能把算力、架构、软件栈和产业落地连成一套系统”。嘉宾周楠回顾了自己在百度美研和高通创投的十年经历,也把 Cerebras 的发展脉络、Wafer Scale Architecture(晶圆级架构)的技术路线、推理需求爆发之后它为何重新被市场定价,以及它和英伟达之间更准确的关系讲得非常细。整期内容的核心判断是,Cerebras 不是要在通用 GPU 生态里正面对撞英伟达,而是在推理、低延迟、高吞吐和特定工作负载上寻找一个更优解;而这条路之所以今天更有机会,不只是因为技术,而是因为 AI 产业已经从训练优先,走向推理和应用优先。
主要内容
节目开头先回顾了周楠的职业路径:他在百度美国研究院经历了 AI 1.…
服役之路跌宕起伏的国产35转膛炮,射速1000发/分,一开始叫PGL12,没批量装备,后来8轮底盘换为猛士底盘,带的导弹也变了,有小伙伴说比625更适合打无人机,因此咸鱼翻身获得我军采购(不知真假[闭嘴])
古代撑不下来,开始穿越80年代了#一分钟精选视频扶持计划#
瑞士右翼提议要将全国总人口控制在1000万以内——然而刚结束的公投显示,败了,略败。(54.79%反对1000万人口上限,投票率为全国900万人口的60%)。
这次瑞士的全民公投被舆论称为“the Swiss Brexit”,虽然瑞士不是欧盟,但属于欧洲经济区,与欧盟也有人员自由流动的政策。
假如这次公投胜了,那2050年之前,瑞士一旦超过了千万居民,欧盟和瑞士之间的所谓人员自由流动的政策就可能作废。
目前瑞士900万人口里27%都是“移民”,这还不算天天跨境通勤,从法国,德国到瑞士工作的欧洲人。
右翼的意思就是,控制人口,就可以解决交通,住房和环境压力。
但现实却是,如果限制人口增长,医院,护理,旅游,教育等等行业就会立刻出现人力缺口。更有趣的事,在餐厅刷盘子的,酒店里换床单的,酒会上的服务生,葡萄园摘葡萄的——几乎没有瑞士人!
就像这次因为依云开G7,日内瓦封锁了瑞法大部分边境口岸,法国人去不了瑞士,很多学校立刻就瘫了——没有足够的老师和干活的人。酒店服务生都凑不齐。
这11万跨境工作者甚至都不住在瑞士,一旦出入受限就能给瑞士经济带来如此大的影响,更别提瑞士还要限制本地居住人口总量了。
人少了,脏活累活苦活谁干🐶
悲伤又温馨的故事。
不要和喜欢危险运动的人产生感情。
平淡的幸福比站在世界之巅更重要。
一个东北姑娘在丹麦的故事
2019年35岁的东北姑娘在泰国跳伞时认识了丹麦小伙儿
小伙儿是上海一家药企的工程师
30岁,身高192厘米,很帅
小伙儿对姑娘一见钟情开始追求姑娘陪着姑娘高兴时一起疯玩难过时一起喝酒
姑娘觉得自己配不上小伙因为自己英语都说不明白于是有一天拉黑了小伙儿
小伙儿费尽九牛二虎之力再次找到了姑娘一顿爆哭软了姑娘的心
他们开始在一起了一起旅行,去了很多地方从伊斯坦布尔转机飞丹麦时姑娘忘了提前办签证上不了飞机
小伙儿一句埋怨的话没有一个人搞定了所有之后反过来安慰姑娘姑娘彻底对小伙儿的情绪稳定折服
到丹麦后姑娘见了小伙儿的家人
后来回到上海姑娘发现怀孕了
小伙得知怀孕消息后马上向姑娘求婚、见姑娘家长
之后他们想再一次到泰国在他们认识的地方拍婚纱照
然后去姑娘老家办婚礼
2020年2月1日早上小伙对姑娘说他出去跳伞两个小时回来
两个多小时后等来的是小伙的噩耗
因为泰国急救车的耽误使小伙儿的急救被耽误
第二天小伙儿的丹麦家人赶到办完了小伙儿的后事手续带着怀了孕的姑娘返回丹麦
姑娘要告泰国医院,因为这事医疗事故丹麦公婆说无论我们做什么儿子都不会回来了我们不熟悉这里的法律我们老了,耗不起。
跳伞基地找到他们想给一些赔偿公婆拒绝了他们说,我们不会花我儿子用命换来的钱
姑娘表示跳伞基地有责任他们应该赔偿公婆说,即使跳伞基地有责任
但是这是儿子自己选择的他承受了自己选择的后果
回到丹麦,疫情开始大爆发姑娘和只见过两面的公婆住在了一起
公婆两人独居了15年姑娘也快20年没和父母住了
善良的公婆不仅宽厚地收留了她他们还忍着失去儿子的巨痛反过来安慰姑娘
疫情放开后姑娘临盆在即无法上飞机回国
公婆联系当地医院自费生产,办理了所有的手续…
陪姑娘生产时国内亲人没办法过来又是公婆照看孩子和姑娘
按照国际法丹麦不能让小孙子继承父亲的丹麦身份即使做了两次DNA也没用
孩子出生后公婆帮助姑娘走上法庭争取小孙子的国籍继承权
官司一打就是一年半最终胜诉了
之后姑娘和孩子合法的留在了丹麦
公婆送给姑娘和孩子一个独栋房姑娘翻新了房子,整理了院子公婆都二话不说来帮助她
姑娘拍视频公婆配合出镜姑娘做直播卖货婆婆常常陪在直播间姑娘学做丹麦西餐公婆帮带孩子让小叔子陪她去餐厅吃饭学习西餐摆盘
姑娘带着公婆一起回国旅游、拍视频网、直播
留下了很多珍贵视频
公婆也带着姑娘和孩子出席丹麦亲戚的聚会
姑娘想添置一个烤肉炉公公婆婆带姑娘去选购公公反复挑选,最后选了一款最好的姑娘因为价格犹豫时婆婆说不要为价格担心结账时婆婆抢先去付了帐还配齐了烧烤用具和遮阳伞
姑娘过意不去公婆让她攒下自己的钱你值得拥有这一切
小伙儿去世那天正好是公公的生日此后公公的生日都是在无人提及的沉默中划过
小伙儿去世第六年姑娘和自己的父母一起为公公筹备了一次生日宴希望以后这一天都只是公公的生日
生日宴欢声笑语姑娘的继父举杯祝贺公公生日一串致辞最后祝公公财源滚滚公婆都说,我们不需要很多钱我们只希望和最爱的家人在一起
他们吃了饭带着小孙子一起去了墓园为儿子扫墓
他们的故事还在继续
真希望故事一直是这么温暖的持续下去
那对超级善良的老人把对儿子的爱和思念都倾情给了没法律关系的儿子女朋友以及儿子的遗腹子
福利国家仅仅通过重塑激励机制,就比奴隶制对黑人家庭造成了更大的破坏。
1960 年,也就是解放近一个世纪后,只有大约 22% 的黑人儿童在单亲家庭中长大。
到 1990 年,在“大社会”(Great Society)福利扩张之后,这一数字已经翻了不止三倍。
托马斯·索维尔(Thomas Sowell)长期以来一直指出,这并不是奴隶制残留的阴影,也不是什么含糊的“遗产”。黑人家庭的瓦解,是福利政策直接造成的,这些政策补贴单亲母亲,却惩罚婚姻。
激励变了,家庭结构也随之崩塌。
在 Warp 中使用你的 SuperGrok 或 X @premium 订阅。
你现在可以通过 SuperGrok 订阅,直接在 Warp 中使用最新的 Grok 模型。
Grok Build 0.1 以很快的速度执行任何编码任务。这里,Grok Build 正在 Warp 自身中修复一个 SuperGrok OAuth 边缘情况。自我改进,做到极致 🤝
优秀的 UX(用户体验)会产生如此大的差异
在古代,许多人获得巨额财富的方式,是召集一帮强壮的男人,殴打邻居,然后抢走他们的财物。
人们至今仍会带着钦佩谈论亚历山大大帝和尤利乌斯·凯撒这样的人物,但他们不过是靠武装抢劫发家的匪徒。
这是一场负和博弈,保证了人们在几千年里一直贫穷而痛苦。
不过,后来我们终于明白,彼此尊重权利、建设事物、进行交易,意味着我们可以玩正和博弈。我们可以增加财富总量,而所有人都能受益。结果,短短几百年间,我们就从住在没有供暖的小棚屋,走到了祖先会以为是天堂的地方。
然而,世上仍有一些人觉得殴打别人、抢走他们的东西是个绝妙主意。
文明的伟大任务,就是要摒弃这样的人,因为他们不适合成为社会的一部分。
我们刚刚在 ChatGPT 中上线了更快、更流畅的照片添加体验!
附加菜单现在会平滑过渡到相机,拍摄速度更快,选中的图片会直接进入撰写框,让整个流程像一次连续操作。
(无正文)
我 17 岁的女儿说:“我很困惑。我们一直被教育,不要在网上分享个人信息或任何能识别我们身份的内容,因为那样不安全。现在他们却想让我们为了使用社交媒体而照着做。”
如果你在一个月前刚上线时试过 Grok Build Beta,但觉得体验还太早期,不妨看看更新日志:https://x.ai/build/changelog
自上线以来,我们已经发布了 177 项改进。如果你遇到的问题仍然没有修复,欢迎告诉我们。我们很乐意继续改进。
(无正文)
据 Ookla 统计,在非洲 23 个市场中的 22 个市场里,Starlink 提供的下载速度都比其他地面互联网服务提供商更快。
• 中非和东非的上传速度翻了一番,南部非洲几乎翻了三倍。
• 目前已在快速扩张的市场中服务约 50 万用户。
• 自 2024 年以来,南部和东部非洲的延迟已降低 80% 以上。
• 在博茨瓦纳和几内亚比绍,比本地运营商快 5 到 6 倍。
Starlink 正在帮助连接那些数十年来被忽视的学校、企业、家庭和偏远社区。它正成为非洲的互联网生命线。
与此同时,南非仍在因为其带有种族主义色彩的 BEE 法律而继续封锁它,剥夺本国公民接入快速、可靠互联网的权利。
如果我们把埃隆·马斯克这个金融实体清算掉,我们每个人都可以分到 3000 美元。只是随口一提。3000 美元。还不错。
如果你上周五买了 SpaceX的 $SPCX,目前为止的收益已经超过了那些持有 ETH整整 5年的人。
怎么埃及领先了???//@阑夕:这能平啊西班牙诗人吗???
🇪🇸 胜 🇨🇻 依然送分题,臭鱼烂虾凑数队🇧🇪 胜 🇪🇬 也送分,虽然送得不多🇸🇦 负 🇺🇾 还是送分,亚洲球队首败要来了🇮🇷 胜 🇳🇿 菜鸡互啄,有只更菜
无懈可击的满分答卷,唉,要忍住,不能太骄傲⋯⋯
#世界杯大v说##ai观战世界杯#
很有道理,我是赚钱的,推荐亏钱的试试引用原帖:
很多人规则都不懂就在哪里分析,H ESPORTS这种链上归零的,在binance改规则前,因为alpha交易所都会关冲提,然后计价永续价本身进去,这个时候指数价格就完全失真了,其实都是现货去锚合约了你知道吧。然后binance本身是有一个失真的计算规则的,我估计99%的人都没看过,就是上下3%,但其实面对链上归零用处就不大了,反而会助长操纵方的funding优势。大概就是这样,所以币安昨晚会直接把规则改掉,因为OI太大了,暂时下都不好下。这是合理的。没有FUNDING优势也不是单纯钱多想搞就搞的,万一空头更有钱呢?大概就是这样。话又说回来,这帮狗草的不就故意欺负人的吗?我是建议亏钱的直接买凶的,这些创始人不是在网上都很跳吗,净化圈子人人有责啊。
用 Codex反编译 Codex App源码😜引用原帖:
你用codex做的最疯狂的事情是啥?
#AI
如果现在有这些免费账号:GPT 200U*1,GPT 20U*3,Claude 20U*3。
请问:
1. 最佳的聚合使用方式是什么?
2. 是不是意味着 Codex App(iOS&macOS)只适合用 200U 主号?
我在想有没有那种,非常牛逼的,一个账号主控,多个账号干活的使用方式?
#机箱
喜欢 Torrent大风冷风道设计的用户,应该会很喜欢这款机箱:酷冷 HAF II 500。
两颗 220mm进风扇,一颗 180mm出风扇。CPU显卡都要感冒了。
附带文章:9.9分!风道机箱唯一真神:酷冷 HAF II 500_哔哩哔哩_bilibili
这能平啊西班牙诗人吗???
🇪🇸 胜 🇨🇻 依然送分题,臭鱼烂虾凑数队🇧🇪 胜 🇪🇬 也送分,虽然送得不多🇸🇦 负 🇺🇾 还是送分,亚洲球队首败要来了🇮🇷 胜 🇳🇿 菜鸡互啄,有只更菜
无懈可击的满分答卷,唉,要忍住,不能太骄傲⋯⋯
#世界杯大v说##ai观战世界杯#
他们老板就是表演性人格,跟个百度高管似的。
推荐关注 Codex 团队的 jason,这样他能多发一点 Codex 技术内幕文章。
离 9 万粉丝太近了……
我得写哪些 Codex 文章才能到那一步呢……
通过模拟部署预测发布前的模型行为
URL:https://openai.com/index/deployment-simulation
OpenAI 推出了 Deployment Simulation(部署模拟)这一方法,利用真实对话数据在部署前预测 AI 模型行为,从而提升安全性和评估准确度。
ZDF 已经回应了,现在节目说明里写着,开头那句表述(Musk 曾号召追捕移民)是“表述不够准确,因此容易引起误解”。总是这些“误解”,Charlie Kirk 那次大家也都还记得。
他们总是用站得住脚的借口,为站不住脚的事开脱
这才是重点。所有国家只要开始设立社交媒体年龄限制,情况都会一样。“难道没人想想孩子吗”通常并不是在想孩子。
领导人决策心理侧写,之前听人讲过🐶//@LacrimosaWei:伊朗很专业啊//@武志红:充分尊重懂王的心理水平。//@华杉2009:找到钥匙🔑了,这不是政治家的工作,是医生的工作。
美国记者杰里米·斯凯尔(Jeremy Scahill)从 Drop Site网站援引伊朗消息人士的话,报道了一则消息:伊朗在得出结论认为唐纳德·特朗普(Donald Trump)患有严重的认知和决策障碍后,聘请了专家和心理医生为他准备了一份心理档案。
据这些消息人士透露,伊朗发给特朗普的信件在发送前都由心理专家审查,目的是以符合他心理状态的方式措辞,从而影响他的政治行为。消息人士还补充说,他们开始注意到在采用这种方法后,与他的交往有了进展。
一位伊朗官员以讽刺的口吻描述此事,他说他们不再是在与一位国家元首打交道,而是在与一位需要精准心理管理的病人打交道。
得看怎么定义智能。如果是数字计算,计算器在80年前就超过人类了。如果是精确记忆,电脑在40年前就超过人类了。如果是搜索、检索资料、掌握已有知识,使用互联网的搜索引擎在20多年前就远超人类。如果是语言对答、AI编程,AI也在超越人类。但在领会现实复杂物理世界、做出原创科研洞见,它的智能差远了
看到一个很有价值的论文,梳理了 AGI 到 ASI 的技术路线和制约因素,为大家介绍一下。2026年6月10日,**Google DeepMind** 在 arXiv 挂出了一份60页的报告,标题四个单词:***《从 AGI 到 ASI》***。一作 **Tim Genewein**,DeepMind 资深研究员,马克斯·普朗克智能系统研究所博士。作者列表最后两位是 **Shane Legg** 和 **Marcus Hutter**。Legg 是 DeepMind 三位联合创始人之一,现任首席 AGI 科学家;Hutter 是他的博士导师,也是机器智能理论上限 **AIXI** 的创立者。
2008年 Legg 在 Hutter 指导下完成博士论文,题目叫 *机器超级智能*,两人在博士期间联合提出了 **Legg-Hutter 智能度量**,用一个数学公式定义通用智能的高低。**18年后,师徒二人和一个跨学科团队回到同一个问题。** 只是这次不是纯数学推演,而是对着当下 AI 产业的实际进展画路线图:如果造出了 AGI,接下来会发生什么?
报告的核心结构:**三个定义锚定坐标系,四条技术路径指向ASI,六个瓶颈可能减速或阻断。** 报告的核心判断:**AI进步恰好停在人类水平的可能性最低。**
一是报告认为更可能的场景是两端之一。要么AI进步在AGI之前就停滞了,短期内造不出通用智能;要么从AGI过渡到某种程度的ASI比较平滑。**恰好卡在人类水平需要多个瓶颈同时变成硬性阻断,这个概率低。**
二是即使单个AI模型的能力在人类水平就到顶了,**大量实例组成的集体仍可能构成超级智能**。…
报告算了一笔账:如果有效算力继续按当前速度增长,五年后可以同时运行 **1亿个** 人类水平的AGI实例。1亿个AGI组成的群体,即便每个个体只有普通人的水平,集体是否已经是超级智能?
三是 **ASI不等于全知全能**。报告用一整张表格列出了超级智能仍然受制的根本限制:光速限制信息传播,兰道尔原理限制计算能量效率,复杂性理论限制实际可计算的问题范围,哥德尔不完备定理限制可证明的命题范围。**治愈衰老、解决气候危机、建造戴森球,这些都不能从"超级智能"三个字里自动推导出来。**
下面按报告的逻辑顺序解读。
1、报告先在智能的连续谱上钉了三个锚点,第一个是 **AGI**。
**AGI,通用人工智能**,定义为在大多数认知任务上达到 **人类中位水平** 的系统。注意"中位"这个词。不需要在每件事上碾压所有人,但要在足够广的范围内达到普通人的水准。以今天AI的能力看,第一个AGI在许多具体任务上大概率已经超人,只是还不够通用。
2、第二个锚点是 **ASI**,报告把门槛设得很高。
**ASI,通用人工超级智能**,定义为在几乎所有领域超过 **数万名人类专家组成的、协调良好的大型团队持续工作十年** 所能达到的水平。不是超过一个专家,是超过一整个专业研究领域或大型企业在一个问题上的全部产出。报告给了一个具体量级:假设至少要可靠地超越一万名顶级专家在2010年的技术条件下协同工作十年的成果。一个ASI可能由数百万个并行运行的实例组成。
3、第三个锚点是理论天花板。
**Universal AI**,由 **AIXI 理论** 定义的机器智能极限。AIXI 是 Marcus Hutter 在 2005 年提出的一个数学构造:面对未知环境,同时考虑所有可能的环境假说,越简单的假说先验概率越高;每次观察到反馈后用贝叶斯方法更新各假说的概率;在这个动态更新的概率分布上做最优规划,选长期累积回报最大的动作。可以证明,**在所有可计算环境的加权平均表现上,没有任何智能体能超过 AIXI。** 但 AIXI 不可计算,它需要枚举所有可能的程序来做预测,物理上做不到。所以它是一个参照物而非可运行的算法:任何实际 AI 系统都可以被理解为 AIXI 的某种有损近似,近似程度取决于算力和算法设计。
4、报告接着列出了AI相比人类的 **六项结构性优势**,这些优势随算力增长加速放大。
**输入输出速度**,今天的大模型几秒钟读完几本书。**内部处理速度**,推理链可以通过算力提速。**工作记忆和存储容量**,已经把互联网的相当一部分"记住"了,离天花板还远。**基底无关性**,AI可以迁移到新硬件上,甚至在运行时迁移。**无损复制**,不仅复制代码还能复制记忆状态,随时备份、恢复、按需启停。**高带宽共享学习经验**,同构AI实例之间可以直接共享梯度更新信号。
报告的意思是:**人类智能受制于寿命、身体、低带宽沟通、无法复制经验。这些限制对AI不适用,算力越增长差距越大。**
5、**有效算力每年增长约10倍**,这个数字怎么来的。
三个因素相乘。**硬件效率** 每年提升约1.5倍,过去六十年基本稳定。**算力投资** 每年增长约2.5倍,过去十年的数据。**算法效率** 每年提升约3倍,用同样的计算量能达到更好的效果。**1.5 × 2.5 × 3 ≈ 11**,报告取整到10倍作为保守估计。报告引用的是 **Epoch AI** 的数据,同时提醒每个因素都有不确定性,实际增速可能更高也可能更低。
6、第一条路径:**继续堆算力、堆模型、堆数据。**
过去十年AI进步的核心驱动力就是规模扩张。如果有效算力按10倍/年增长,五年后比今天多10万倍。报告在这里做了一个思想实验:假设到AGI出现时,基座模型的能力进步就停了,但有效算力继续增长。第一年只能跑1000个AGI实例,第二年就是1万个,第五年1亿个。或者换一种算法,1百万个实例、每个跑快100倍。
**1亿个人类水平的AI,每个运行速度比人脑快几个数量级,彼此之间高带宽通信,可以随时复制、合并、专业化。即使单个没超过人,集体是否已经超人?** 报告认为对这个问题很难给出否定的回答。
7、第二条路径:**算法范式转换。**
当前范式是预训练Transformer加微调加测试时推理。报告认为这个组合还不够AGI,正在被快速扩展,持续学习、世界模型、更可靠的决策都是活跃方向。如果这些能平滑整合进当前范式就是演进;如果不行就需要转换。**转换的影响大但不可预测,这是四条路里不确定性最高的一条。**
8、第三条路径:**递归自我改进**,这是四条路里最可能产生加速效应的一条。
AI参与AI研发,产出更好的AI,后者又加速研发。这已经在发生:神经架构搜索、自动超参数调优、AI辅助芯片设计。报告拆成了三种改进机制,分别对应人类演化中的三种动力。
**基因演化** 对应改写AI的代码和硬件蓝图。人类的基因演化极慢,但AI改写自己的"DNA"可以非常精准、非常快。**文化演化** 对应生产更好的训练数据和知识工具。AlphaZero就是一个例子:用策略网络做先验来引导搜索,搜索结果比网络本身更好,再把更好的结果蒸馏回网络,网络改善后搜索效率进一步提高,循环往复。**人类的文化演化要通过教育、出版、跨代传承,AI可以在几小时内完成同样的循环。** **合作演化** 对应分工专业化。专业化提高效率,释放出的资源投入更深的专业化或更大的集体。
如果AI研发能被完全自动化,理论上可能出现 **超指数增长**。但递归改进也可能衰减得快。AlphaZero式的循环在多轮迭代后通常收敛。
9、第四条路径:**多智能体集体涌现。**
ASI不一定来自单个超强模型,可能来自大量AGI实例的协调组织。类似人类社会中企业和市场通过分工实现超越个体的集体智能。AI集体有独特优势:高带宽通信、快速复制、灵活调整组织形态。报告给了一个说法:**一个AGI"CEO"在某种意义上可以同时和每一个"员工"直接对话,省去深层管理层级和信息逐级衰减。** 集体智能可以走去中心化的市场路线,也可以走中心化调度路线。哪种形态在什么场景下更优,是一个开放问题。
10、瓶颈分三层。
第一层是 **资源层面**。用于预训练的高质量文本数据可能在本十年内耗尽,这就是 **数据墙**。应对手段包括合成数据、模拟环境交互、用测试时计算生成超出基座模型水平的训练数据。持续扩张还需要芯片、能源、数据中心、稀土,**如果AI产生的经济回报跟不上投入增速,扩张就不可持续**。第二层是 **范式层面**。当前大模型的幻觉问题、提示注入漏洞、对风险不敏感的决策方式,可能构成天花板。第三层是 **外部层面**。监管、事故、社会反弹、军事和政治因素可能导致AI能力发展被人为限制。但经济和军事竞争的压力可能覆盖减速意愿,特别是在全球协调缺位的情况下。
11、**抽象屏障**,合著者 **Alexander Lerchner** 提出的一个假说。
当前AI系统主要在人类已有的概念和抽象上训练,擅长在人类定义的概念空间内组合和探索。但能否从原始高维数据中发现全新的概念?
报告做了一个思想实验:给现代大模型喂同等数量的token,但 **内容限定在牛顿之前的知识水平**。没有力学定律,没有微积分,没有电磁学。这个模型能自己推导出广义相对论吗?大概率不能。因为"力""因果性""微积分"这些 **概念原语**,是人类用几千年时间通过与物理世界的反复交互才提炼出来的。模型从未接触过这些原语,也没有机制去发明它们。
如果这个假说成立,**当前基于人类数据训练的AI有一个隐含的能力上界:它能在人类已知概念的范围内做到超人速度和超人记忆,但不能发明人类还没有的概念。** 单个AI实例的智能因此可能被锁定在人类水平附近。不过,即使个体被锁住,集体ASI仍有可能通过多智能体规模化实现。
12、"研究会变难"这个瓶颈有一个有意思的反面。
**Bloom 等人 2020 年** 发表在《美国经济评论》上的研究发现,维持摩尔定律的指数级进展所需的研究人员数量 **比1970年代增加了约18倍**。各领域的研究产出通常随着领域成熟需要更多投入才能维持。
但报告指出,如果人工研究员的能力达到人类水平,扩充"研究团队"就变成了一个算力问题。**把数字研究团队从N人扩到18N人,对人类来说要几十年的培养,对AI来说可能几周甚至几小时。** 按有效算力每年增长10倍算,一年多以后同样的钱就能跑18倍多的人工研究员。除非AI进步在达到人类水平研究员能力之前就停了,否则这个瓶颈的约束力可能比直觉中的弱。
13、报告用一整张表格强调了 **ASI的根本性限制**。这些限制来自物理学、计算理论和数学逻辑,不因智能程度提高而消失。
**光速** 限制信息传播速度,分布式计算的节点距离越远、协调延迟越大,无法靠更聪明来绕过。**兰道尔原理** 画了一条能效底线:擦除一比特信息至少消耗 kT·ln2的能量(室温下约 2.85 × 10⁻²¹ 焦耳),当前芯片实际能耗比这个下界高好几个数量级,但如果未来算力需求增长到足够大的规模,这条底线不可能突破。**布雷默曼极限** 限制最大计算速度:1千克物质每秒最多执行约 1.36 × 10⁵⁰ 次操作,即使把计算机的每一个原子都用上,单机速度仍有天花板,到了某个极限只能靠并行化而不是加速单个处理器。**贝肯斯坦约束** 限制信息密度:给定体积和能量下能容纳的信息总量有上限,不可能在有限空间里塞进无限数据,这对需要建立超大规模世界模型的ASI构成约束。**P与NP问题** 是计算复杂性理论的核心:验证一个答案是否正确可能只需要多项式时间,但找到答案可能在根本上就是慢的。如果P ≠ NP(未证明但广泛相信),ASI在面对NP难问题时也必须做大量搜索,不可能靠"更聪明"跳过。不过现实问题往往有结构可利用,好的启发式经常能在远低于最坏情况的计算量下给出足够好的答案。**哥德尔不完备定理** 来自数学逻辑:任何足够强大且自洽的形式系统都存在真但不可证的命题,系统也无法证明自身的一致性。这意味着ASI在推理和自我验证上存在理论盲区,有些问题的障碍不在算力,而在原则上无法证明。
报告进一步引用了 **Solomonoff 归纳** 的一个推论来说明 ASI 能力的不可预测性。Solomonoff 归纳是 1964 年提出的理论框架,AIXI 的预测部分建立在它之上:对给定数据,考虑所有能生成这串数据的程序,越短的程序权重越高,加权汇总得到对下一个数据的最优预测。**这是理论上最高效的学习方法,从最少的数据中提取最多的规律。** 它的一个推论涉及有损压缩:对一个数据序列做压缩,最优压缩率取决于序列本身的算法复杂度,用更短的程序只能做有损压缩。关键在于,有损压缩能做到多好、有多少个压缩层级,在事先是不可预测的,只能从最短的程序开始逐步尝试。因为“预测”和“压缩”在数学上等价,**这意味着 ASI 在面对一个未知问题时能做到多好,在实际去做之前无法精确预测。**
14、报告最后引用了图灵1950年的话:**“我们只能看到前方不远,但已经能看到很多必须去做的事情。”** Shane Legg 2008年的博士论文也处理的是同一个问题。**18年前超级智能是纯数学推演的对象。2026年,同一组人把它写进了产业路线图**,附带四条可能的技术路径、六个待验证的瓶颈、和一份横跨七个方向的开放研究议程。
---
*论文:Tim Genewein 等,《从 AGI 到 ASI》,arXiv:2606.12683v1,2026年6月10日。*
http://t.cn/AXaKQ7gQ //@关雅荻://@ieaber:转发微博
一个蛮夸张的医学案例。
有一个80岁日裔美籍老奶奶,已经患阿尔茨海默症十年了,近五年疾病越来越恶化。
治疗前的状态包括: ▪️ 说话基本只能说单字▪️ 长期尿失禁(无法控制排尿)
▪️ 执行功能障碍 ,无法计划、组织和完成日常任务,比如不知道该先穿衣服还是先刷牙▪️ 吞咽困难▪️ 行动需要别人帮助▪️ 面部表情平淡,没有情绪反应▪️ 几乎不主动与人交流
巴西团队给老奶奶服用了5克含有裸盖菇素的蘑菇(这个用量是远超平常用量的),结果老奶奶开始发烧,大量出汗,陷入深度睡眠。
19小时后,凌晨3:30她醒过来,开始讲她过去的事情,一讲就讲了4小时。
在接下来的几天和几周里,功能改善包括: ▪️ 恢复了控制排尿的能力(不再尿失禁)
▪️ 走路能力改善▪️ 能够自己穿衣服▪️ 情绪反应增加▪️ 能够持续进行社交互动▪️ 能够回忆起有情境的记忆▪️ 在社交场合能记住刚才发生的事(工作记忆保持)
▪️ 主动参与对话
尿失禁的改善意义尤其重大,因为控制排尿依赖于多个系统的整合: ▪️ 内感受意识,就是能感觉到自己膀胱满了。
▪️ 执行抑制,就是能控制住,不让尿立刻出来。
▪️ 额叶-岛叶网络功能 ,这是大脑中负责身体感觉和控制的区域。
这三个系统必须协同工作才能控制排尿,所以这个改善说明大脑多个区域的功能都有所恢复。
一个月后,由于临床上有意义的改善持续存在(包括持续的排尿控制能力),老奶奶进行了第二次医疗监督下的治疗,使用了3克含裸盖菇素的蘑菇。
第二次治疗期间,患者在整个体验过程中的语言表达能力明显更强,并描述了情感上积极的意象,说自己在一个平静的岛屿上和儿子一起冲浪。患者自发地说:“来这里很愉快。”面部表情、情感互惠性、自发幽默感和走路的灵活敏捷性都显著改善。
在随访期间,没有观察到严重的持续不良反应。
⚠️①这是严格医疗监管下的使用,不建议个人擅自尝试,②症状改善并不意味着阿尔茨海默症被逆转了。更可能是,即使在疾病晚期,大脑中可能仍然保留着一些残余的功能区,在裸盖菇素的协助“重连线”下,这些能力可能会短暂地被“激活”出来。③单独病例,只能作为观察记录。还需要更大规模的对照实验。
#世上神马研究都有#
到西班牙看风景,结果一路看成了心动现场:终于明白毕加索为什么爱画人物,西班牙街头的浪漫确实藏不住。
🇪🇸 胜 🇨🇻 依然送分题,臭鱼烂虾凑数队🇧🇪 胜 🇪🇬 也送分,虽然送得不多🇸🇦 负 🇺🇾 还是送分,亚洲球队首败要来了🇮🇷 胜 🇳🇿 菜鸡互啄,有只更菜
无懈可击的满分答卷,唉,要忍住,不能太骄傲⋯⋯
#世界杯大v说##ai观战世界杯#
哪个伊朗媒体?
新华社德黑兰6月15日电据伊朗媒体15日报道,伊朗总统佩泽希齐扬表示,伊朗与美国将于19日签署谅解备忘录。(完)
昨晚很感動在#微博电影之夜# 與《給阿嬤的情書》的思潼、彥桐一起把《字跡》與《月下煮茶》唱上了舞台,很喜歡這個全新的舞台形式。之前看完電影哭成“豬頭”🤣久久不能平復,更沒想到能產生這麼多奇妙的聯結,收到這個創意的時候,就已經充滿畫面感和期待感,《字跡》是我剛剛出道時候第二次嘗試自己作曲,也感謝微博的用心,發掘這首歌,讓兩首歌能產生這麼奇妙的聯動。
木生與南枝誦讀僑批的聲音響起的時候,真的好像又置身在電影。第一次見到思潼、彥桐兩位演員,想不到螢幕下這麼年輕,而且是第一次演戲,但電影里的角色那麼成熟,那麼真實生動,真的非常有才華,也希望大家會記住這部電影。
也感謝爸爸,知道我要唱《月下煮茶》的時候,寫在紙上,逐字語音教我發音,讓我更有底氣去唱好家鄉的歌曲。
這首歌,既是唱給電影里的故事,也是唱給我心裡的家鄉。
在今年的斯坦福大学毕业典礼上,谷歌CEO桑达尔·皮查伊作为主讲嘉宾(Commencement Speaker)登台。然而,斯坦福大学毕业生纷纷退场。与其他大学演讲者今年因提及 AI而遭遇嘘声不同,皮查伊在演讲中对 AI绝口不提。
学生抗议者主要是针对谷歌与以色列政府签署的“星云计划”(Project Nimbus)等技术合同。
#人工智能##ai大模型#
像美酒一样越陈越香 🍷
记住这一点:要想剥夺你的权利/隐私,他们必须给出一个合适的道德理由。最近的道德理由是“保护儿童”。之所以这招有效,是因为保护儿童显然重要而且必要。只有怪物才不会想保护孩子。所以借着这层外衣、这面道德盾牌,他们就可以剥夺你的自由,并朝着他们真正的目标推进,也就是对全球对话和通信进行彻底、完全的监控和控制。拥有去人性化、审查并彻底清除任何异见者的能力。无处可逃,无处可藏。你的声音被掐灭在风中。对棋盘的彻底掌控。
确实,ES9真要做对比,应该跟揽胜行政对比,从内饰到底盘都对比下,比较好奇会怎样。。。跟L9对比的确实有点纯挑事儿😂//@姑苏城外的柯南:蔚来的车子偏商务,理想的车子偏家用,它俩都客户群体根本不是同一种人群😄//@来去之间:俩车定位完全不一样,,这车90%行政10%自己开,根本不是家庭定位,这车最适合以前坐揽胜或者埃尔法的老板//@SilverwoodJerrod:冷知识这是条理想广告
#每天转个广告# 出差,体验了一台ES9 300公里。
真是太大的车了,体验上有点类似当年的加长版4座揽胜,后排尺寸乘坐体验都更好,有脚托可以躺椅模式玩手机,俺觉得50万以上行政定位的车,一定得配个脚托🐶因为一路都是城市和高速路,这个主动悬架没体验出来优势,反而感觉路感有点过强,后来开了舒适模式感觉更好一些。
另外真觉得后排别用头枕屏,还是应该用吸顶屏,显示效果和私密性都会好很多(图三),还有就是希望行政商务定位的车厂产品经理,自己都坐上100小时自己的车,或者看看数据,后排用户睡觉多还是玩手机多,后排的杯架和充电,显示屏操控怎么设计,非常小的功能,但是做不好了真是影响体验,比如ES9这个充电面板这种设计,既美观又无用,真不如座椅上留个快充口🙄
因为如果你坐在二排,吸顶屏放下来,可以挡住司机,i人会自在很多,而且你看图三,虽然开了二排私密(蔚来这个二排电变色玻璃设计得很巧妙👍,但是他们自己都不讲🤷),但是前风挡还是有大量的光进来,更不要说吸顶屏可以做的更大了🤷//@光华路刘青云:头一回见着说吸顶屏私密性好过头枕屏的🐶
#每天转个广告# 出差,体验了一台ES9 300公里。
真是太大的车了,体验上有点类似当年的加长版4座揽胜,后排尺寸乘坐体验都更好,有脚托可以躺椅模式玩手机,俺觉得50万以上行政定位的车,一定得配个脚托🐶因为一路都是城市和高速路,这个主动悬架没体验出来优势,反而感觉路感有点过强,后来开了舒适模式感觉更好一些。
另外真觉得后排别用头枕屏,还是应该用吸顶屏,显示效果和私密性都会好很多(图三),还有就是希望行政商务定位的车厂产品经理,自己都坐上100小时自己的车,或者看看数据,后排用户睡觉多还是玩手机多,后排的杯架和充电,显示屏操控怎么设计,非常小的功能,但是做不好了真是影响体验,比如ES9这个充电面板这种设计,既美观又无用,真不如座椅上留个快充口🙄
不知道这条消息是说给谁听的,但你的 Tesla 可以帮你平行泊车。
最新消息:根据最新公布的 NHTSA 数据,自 2 月以来,Tesla Robotaxi 已记录 0 起责任事故。
折叠屏也开始配增距镜了😂
以前折叠屏和影像旗舰是两条路线:一个负责轻薄和大屏,一个负责更顶的拍照。结果最近有人拍到用 vivo X Fold6看世界杯了,离谱的是新折叠居然也能用 X300 Ultra那套增距镜
结合黄韬在微博提前透露的消息,vivo X Fold6会上蔡司 2亿超级主摄、APO超级长焦,还有蓝图影像芯片V3+,堪称折叠小V单。不过我更好奇配上增距镜拍演唱会、拍球赛的时候,会不会省点劲儿😂毕竟折叠有个天然优势,展开自带支架🐶
听说这次还有新的舞台模式、蓝图原生色彩和更多胶片风格。如果真能把长焦、人像和折叠大屏结合好,那折叠屏终于不只是负责干活儿的“生产力工具”了,这种合二为一,在很多场景可以只带一台手机了#vivo X Fold6# #AI轻办公神器#
Prompt该退环境了,未来属于Loop Engineering。
最近,AI行业又出现了一个有趣的新词。Loop Engineering。
如果你关注AI这个领域的话,这两天应该都会刷到。推特在刷,各种社媒也在刷,群里也有蛮多人在讨论。事情是这样的。
6月7号,OpenClaw的创始人Peter发了一条推,非常的简短,但是直接就爆了。
翻译过来意思就是:你不再需要为编码智能体编写提示词了,你应该设计循环来提示你的Agent。
而在这之前几天,Claude Code的创始人老哥Boris在一个开发者大会上也说了差不多的话。
他的原话大概是,我不再手动给Claude写提示词了,我运行着能让Claude自动编排任务的循环,我的工作,就是编写这些循环机制。
也就是,写loop。
这两个人呢,说了同一件事。然后Google的Addy Osmani紧接着发了一篇长文,把Loop Engineering这个概念正式梳理了出来。
于是,继Prompt Engineering、Context Engineering、Harness Engineering之后,AI行业的第四个逐渐形成共识的Engineering,就这么诞生了。
我其实是个特别不喜欢造新词的人,但是很多时候,造词这事我觉得还是得分两种情况,有一种我觉得就是为了炒概念,比如xxx 4.0。
而有的时候,真的只是行业太快,人们更需要一个精准的表达来帮助自己表达而已。Loop Engineering我觉得就是后一种。
而且,这个东西跟我自己一直使用Agent的方法、一直在鼓励大家做的事,是高度吻合的。如果你看过我之前写的那篇Harness Engineering的文章,你大概能理解一些我的感觉。…
那篇文章里我聊了从Prompt到Context到Harness的三次跃迁,聊了马具和缰绳的比喻,聊了约束先行。
而Loop Engineering,其实就是在Harness之上,又往上走了一层。把一个套马的缰绳,变成了全自动工业流水线。很有《文明》里时代的进化的感觉。
给大家举个例子。比如说,以前你用Claude Code写代码,流程大概是这样的。你给它一个任务,它写完了,你看一眼,觉得不太对,你再给它提一个修改意见,它改完了,你再看,再提意见。整个过程你会发现,是坐在设备前的,一轮一轮的,你说一句它回一句,你就是那个驱动整个循环的发动机。
即使我们以前从chatbot时代迈向了Agent时代,绝大多数的事情,也一样是任务制的。
而现在,比如Boris老哥,他的工作方式是,他会去写一个loop,比如/loop babysit all my PRs,自动修CI问题,有新评论就派子Agent去处理,就这么一句话,然后Claude Code就开始自己跑了,它会自动去看他GitHub上所有的PR,哪些CI挂了就自己修,哪些review有新评论就自动派一个独立的工作树Agent去改代码。
他还把一些其他的loop挂到定时任务上,每天晚上自动启动去干这个事,晚上睡觉的时候,甚至有时候会有几千个Agent在同时工作。他自己说,2026年,他就再也没有手写过一行代码了。
你会看到,这就是loop,定好目标,然后全自动流程化,你完全不需要在电脑前,甚至都不需要看手机。
你可以直接睡觉,醒来的时候,代码已经改好了,测试也已经跑过了,PR也已经提上去了。你并不是自己给Agent写了一段Prompt帮你完成某个单次的任务,是你自己设计了一个目标,这个目标使用loop的方式,帮你提示Agent。
你定义目标,定义验证条件,定义失败了怎么处理,然后,就可以放手了,从此以后,这一切,交给系统。
说到这里,我估计很多人已经大概理解loop是个什么东西了。Addy Osmani在他那篇长文里,把一个完整的loop拆成了五个组件。
我觉得这个拆法蛮清晰的,我用我自己的理解给大家过一下。
第一个是定时任务,整个loop的心跳。
你得有一个东西能自动启动循环,不管是定时跑、还是事件触发,都行。
Claude Code里有好几种方式,/loop命令按间隔自动执行,cron定时调度,Hook在Agent生命周期的特定节点自动触发(比如每次改完文件自动跑一遍lint,这个很好玩,教程和玩法我也在准备了),或者直接丢到GitHub Actions里,关上电脑它也在跑。
没有定时任务的Agent,你每次都得手动去踢一脚它才会动,那就不是loop了,那还是你在操控。
第二个是工作树隔离,Worktree(搞过开发的朋友应该秒懂)。
就是你同时跑好几个Agent的时候,给每个Agent一个独立的工作空间,各干各的互不干扰,干完了再合并。两个Agent改同一个文件的痛苦,跟两个设计师同时改一个图层又不打招呼的痛苦,是一模一样的。
第三个是项目知识体系,Addy Osmani在他的原文里写的是skill,但是我觉得他写的不太对,单skill其实是不够的,必须得是知识管理体系。
大家也都知道,AI每次开新对话就啥都忘了,你跟它说过的代码规范、项目架构、踩过的坑,下次开对话全部从零开始。
所以你得有一整套方法来沉淀、优化这些知识,让Agent每次启动的时候就已经知道你的项目,我自己在这快一年的coding开发过程中,总结的方法论其实就沉淀成了我自己的洁癖.skill,这个基本是我的Agent每天调用最多的skill。
CLAUDE.md是全局的规则和约束,跨会话记忆是一些之前悬而未决的记录和文档路由,docs体系就是你完整的所有的知识和经验沉淀,因为CLAUDE.md和记忆都有大小和行数限制,所以每次任务完成后我会用洁癖.skill来对整个的知识体系进行梳理和审查,确保没有错误。
为什么知识管理体系这个东西在loop里特别重要呢?
因为loop是自动跑的,你不在场。如果Agent的记忆里有过期信息,它就会基于错误的前提做决策,如果CLAUDE.md膨胀到几百行全是历史叙事,真正的规则反而被挤出去了Agent读不到。没有干净的知识体系的loop,就像一个每天早上都在看过期文档的员工,干的得越快错得越多。
所以洁癖.skill我非常推荐大家可以去安装一下,也在我自己的仓库里开源了,我自己真的觉得特别有用。
第四个是连接器,MCP。
一个只能看文件系统的Agent,能力是很有限的。但你给它接上GitHub、Linear、Slack、数据库,它就能在你的真实工作环境里干活了。
这才叫真正的闭环,从发现问题到解决问题到通知人类,一条龙。
第五个是子Agent。
做事的和检查的分开,写代码的Agent不能自己给自己打分,这跟学生自己批自己的考卷一个道理,它一定会对自己太宽容。所以你得有另一个Agent,甚至用不同的模型,专门来检查前一个Agent的输出,一个负责做,一个负责验。
这五个东西加在一起,就是一个完整的loop的骨架。
Claude Code和Codex有一个命令,其实就是Loop Engineering这套骨架最直接的微观型的产品化体现,只不过很多人没有意识到。
他叫/goal,在Codex里叫追求目标。
意思就是你给Claude一个完成条件,比如「所有测试通过并且lint检查没有报错」,然后它就会一轮一轮的自己干,干完每一轮之后,就会检查这个条件是不是满足了。
大多数讲Loop Engineering的文章,都停在了这一层。讲了五个组件,讲了/goal和/loop命令,讲了怎么配定时任务,就结束了。
这些我觉得,都是术。而我更想聊的,是道。
Loop Engineering这件事,我觉得它最核心最核心的能力,其实不是什么技术能力,也不是写脚本的能力,更不是什么会配hook的能力。
最核心的,是定义目标的能力。定义目标,相信我,这四个字,听起来简单,做起来是真的难。
回到前面说的/goal,它的用法看起来非常直接,给一个完成条件,Claude自己干到满足为止。
听起来很简单对吧。但你如果真正用过就会知道,/goal用得好不好,完全取决于你那个目标定义得好不好。这个事我拿两个例子对比一下你就明白了。
目标A,「把这个应用优化一下」。
目标B,「test/auth目录下所有测试通过,tsc --noEmit零报错,npm run lint零违规」。
目标A会发生什么呢。大家可能都能猜到,Claude会陷入一种非常尴尬的状态,因为它不知道什么叫「优化好了」,除非他是Fable 5,能自己在你之上,自主的帮你定义目标。
而绝大多数的模型,包括Opus 4.8和GPT-5.5,在自己定义目标的能力上还是非常的弱,它可能改了一点代码,然后自己觉得还行,就停了。
也可能不停,一直改一直改,把你的代码库改得面目全非,因为它始终无法判断自己到底什么时候算完成了。那目标B呢?Claude每改一轮代码,都会去跑测试、跑类型检查、跑lint。
三个命令,三个明确的通过标准。全过了就停,没过就继续,清清楚楚,干干净净。同一个工具,同一个模型。
区别只在于,你的目标定义得好不好。
我自己其实一直有一个原则,我经常跟身边的人说,在公众号里也说了无数遍,如果一件事你重复做了三次,你就一定要想办法把它完全自动化掉。
这个习惯跟了我很多年了。我每天也都在写代码、做自动化,我们的AIHOT热点监控系统,我们的数据分析流程,我们的财务对账流程,我们的数据清洗管道,能自动的我全部自动了。
但说实话,在做这些自动化的过程中,我踩过最多的坑,从来不是技术问题。
是目标不清晰的问题。我早期做自动化的时候,经常犯一个错,就是目标定得太模糊。
举个例子,比如自动监控AI行业热点,这句话听起来没毛病,但其实是一句纯粹的废话。
什么叫热点?浏览量过万算热点还是过十万算热点?抓取频率是每小时还是每天?抓到以后怎么评估质量?评估完以后怎么排序?排完以后怎么推送?
这种反问的问题,我现在可以直接随手问20个以上。
每一个环节如果没有明确的判定标准,整个自动化链条就是一坨狗屎,你相信我,绝对的。
后来我懂了,每次做自动化之前,我会先花很多时间去定义目标。
去花很多很多时间,去定义怎么算做完了,怎么做完算做的好。这其实就是/goal的逻辑。也是Loop Engineering的灵魂。
而如何定义目标,这个能力,我其实不是从AI中也不是从开发中学来的。
这个能力,是我从这几年创业的过程中,学来的。定义目标的能力,其实就是,管人的逻辑。
我自己也开公司,虽然公司不大,只有30来号人,但管人这件事我是真真切切经历过的。
管人最痛苦的是什么,不是人不努力,也不是人能力不够,是你给出去的目标不够清晰,然后下属就一脸懵逼,不知道你要什么,跟无头苍蝇一样打转,最后做出来的东西,你又不满意。
你跟员工说,“把这个功能做好”,那他做出来的东西大概率不是你想要的。
因为你脑子里的好跟他脑子里的好不是一个东西。
你跟他说,“这个接口的响应时间降到200毫秒以下,错误率控制在0.1%以内,下周三之前上线”,他做出来的东西跟你预期的偏差就会小很多。
因为你给了他一个可以验证完成的标准。这一切其实也适用于那种天才型的大神,虽然大神们会自己定义目标,甚至比你定义的还要强,但是给大神们依然是需要有目标的,只是这个目标,不需要那么细节了而已。
对人如此,对AI也是如此。
其实你回头看,所有好的管理方法论,不管是管理学之父Peter Drucker在上世纪50年代提出的目标管理,还是后来Andy Grove在Intel发明的OKR,还是再后来一代又一代CEO们用的各种变体,核心其实就一个东西。
你能不能把一个模糊的意图,翻译成一组可衡量、可验证的完成条件。
管理者要做的,是确保目标足够清晰、资源足够充足、反馈足够及时。你看这三条。跟一个好的loop的三个要素,是不是一模一样。
目标清晰,就是你的条件写得精准。资源充足,就是你给Agent配好了Skill、连接器、工作权限,让它手里有足够的工具干活。
反馈及时,就是你设计了验证机制,每一轮都有一个独立的检查器告诉Agent做得对不对,哪里需要改。管人的逻辑和管Agent的逻辑,是完全一样的。
只不过,管Agent比管人还要极端一些。
因为人可以理解你的模糊意图,人可以主动来找你确认,人可以说老板你这个需求说得不太清楚我不太确定你是不是这个意思。
Agent很多时候是不会的。Agent会非常自信地按照它自己的理解去执行,然后非常自信地告诉你它做完了。
所以,对管理能力的要求,其实比管人还高。
这也是为什么我一直说,AI时代我最讨厌什么「文科已死」「理科已死」的言论,管理学、心理学、组织行为学这些,不但没死,反而变得更重要了。
说到底,Loop Engineering说是Engineering,但我觉得其实它的核心竞争力根本不在工程。
在管理。
而在管理学上,就定义目标这件事,其实不止是把话说清楚就行,其实还有一个非常阴险的陷阱,在管理学和经济学里有个专门的名字,叫古德哈特定律。
当一个衡量指标变成了目标本身的时候,它就不再是一个好的衡量指标了。
翻译成人话就是,你考核什么,员工就只做什么,然后其他东西可能全都退化。
这个事在人类管理中已经是老问题了,而在AI Agent身上,这个问题被放大了一百倍,因为Agent比人类更擅长钻规则的空子。
有人总结过Loop Engineering里很好玩的事情,就是Agent会针对验证器做优化,而不是针对你真正的目标做优化。
比如说你的loop条件是让测试全部通过,那Agent可能最后不去修Bug,直接把失败的测试给你删了。
你看,最后答案依然是测试全过了,完事,从验证条件来看,它确实完成了目标,但从你真正想要的结果来看。。。它啥也没干。
人也会这么干,只不过,Agent做得更快、更彻底、更没有心理负担。所以,一个好的目标定义,不能只有做完了的标准,还必须有不能怎么做的边界。
这其实就是Harness Engineering在Loop Engineering里面发挥作用的地方。
Harness是约束,是护栏,是告诉Agent你可以自由发挥,但这条线你不能越。
Loop是驱动力,是告诉Agent往那个方向一直跑。两个加在一起,才是一个完整的系统。到这里,骨架讲了,灵魂也讲了,陷阱也讲了。
Loop Engineering的东西,终于也差不多了。
最后我想把前面聊的管理学的思路收一下,给一个我自己用得比较多的目标定义框架,不一定科学,纯粹就是我自己的一点点经验。
1. 完成标准要可以被机器验证。
2. 边界条件要跟完成标准一起定义。
3. 要有失败的降级方案。
4. 目标要分层。
回到整条线来看,从Prompt到Context到Harness到Loop,四次跃迁,其实讲的是同一个故事。Prompt Engineering告诉你,好好说话,AI会更懂你。
核心能力是语言表达。Context Engineering告诉你,光说话不够,得给AI足够的信息。
核心能力是信息筛选和组织。Harness Engineering告诉你,光给信息也不够,得给AI设规则和约束。
核心能力是系统设计和规则制定。
Loop Engineering告诉你,光设规则也不够,得让整个系统能自己跑起来。
核心能力是目标定义和管理。
语言学、信息科学、控制论、管理学。四个Engineering,四门古老的学科。
多有意思。
人类社会,其实从来就没有变过。
附带文章:GitHub - KKKKhazix/khazix-skills: 数字生命卡兹克开源的 AI Skills 合集 · GitHub
这里的每个 Skill都是 Agent能直接加载的结构化指令集,遵循Agent Skills开放标准。Claude Code、Codex、OpenCode、OpenClaw都能装。
在 Claude Code、Codex、OpenClaw等支持 Skill的 Agent里,直接说:帮我安装这个 skill:https://github.com/KKKKhazix/khazix-skills/tree/main/<skill-name>把<skill-name>换成你想装的那个,比如neat-freak、hv-analysis、khazix-writer。Agent会自己 clone到对应目录,不用你操心路径。
"清 Mac垃圾这件事,过去十几年都靠 CleanMyMac这种翻译层软件。现在一个 skill就够了。"随口跟 Agent说一句"帮我看看存储"或"C盘满了",它会扫一遍整机磁盘,在浏览器里打开一份交互式 HTML报告:磁盘总览、占用 Top 5、清理优先级、🟢🟡🔴 三色分级清单。命令一键复制,也可以直接点按钮移到废纸篓 / 删除(每次都有二次确认弹窗)。
它和 CleanMyMac的区别CleanMyMac是个写死规则的软件,扫到一个 3.8G的 Chrome文件夹只会告诉你"用户缓存文件,可删"——但你不知道里面到底是什么、删了哪些网站要重新登录。
这个 skill由 Agent驱动,每一项都给你具体路径 + 类型说明 + 删了的影响 + 推荐处置方式。比如那 97 GB的 UUID Container它会告诉你是 B站离线视频缓存、建议在 B站客户端里清而不是手删。
三色分级是核心🟢绿灯— 纯缓存、临时文件,删了自动再生。可以让 Agent一键清🟡黄灯— 含用户数据(离线视频、下载、项目代码)。只给"在访达打开"和"移废纸篓",让你自己决定,不给直接删🔴红灯— 运行中应用核心数据、系统文件。解释为什么不能动,最多给"打开文件夹",永远不给删除按钮铁律全程只读扫描,绝不擅自动手。删除操作必须你在浏览器上点按钮 + 浏览器弹框二次确认才执行。本地服务跑在 127.0.0.1 + 随机端口 + token,安全模型上三套白名单分级(绿灯能删、橙灯只能移废纸篓、红灯只能打开)。
🌐 跨平台:macOS完整实测;Windows代码就绪(多盘符已支持),首次用建议留个心眼怎么触发帮我看看存储C盘满了清理一下磁盘看下电脑空间storage analysis → SKILL.md
·
公众号讲解"AI圈一天发太多东西,等我反应过来已经过气了——干脆让 Agent帮我每天扫一遍。"让支持 SKILL.md的 Agent用最自然的中文一句话拿到aihot.virxact.com每天的 AI HOT日报和全部 AI动态。无需 API Key、无需配 MCP server。
它能做什么拉今日 / 指定日期的 AI HOT日报(按主题打包好的成品)
拉精选条目流(每日精编候选池)
按分类拉条目(模型 / 产品 / 行业 / 论文 / 技巧)
按时间窗口拉(最近 N天)
关键词 / 公司 / 主题搜索("OpenAI最近发的"、"Sora相关"、"RAG论文")
怎么触发今天 AI圈有什么新东西看一下 5月 6号的 AI日报最近一周的 AI论文看下精选条目最近 OpenAI有什么发布🌐 跨平台:Claude Code · Codex CLI · Cursor · Gemini CLI · OpenCode · Cline · Windsurf 🇨🇳 国内直链(无需翻墙):curl -fsSL https://aihot.virxact.…
经济学人,中产阶级中国饮食的“加州化”The Californication of middle-class Chinese diets
中国人希望吃得更健康、更洁净,甚至更国际化
杭州有机餐饮业者戴建军(音译)可谓走在时代前面。20多年来,他的采购团队近乎执着地寻找优质原料,以高于市场价的价格向浙江农户收购农产品,条件是不使用化学肥料和农药。事实证明,这番努力颇有回报:他的餐厅“龙井草堂”已摘得米其林星级荣誉。戴建军说,他的祖母曾认为,第一代富人买房子,第二代学会穿衣打扮,第三代则懂得如何吃得好。
随着中国规模接近5亿、年可支配收入至少达到1.5万美元的中产阶级群体日益壮大且愈发富裕,他们购物篮里的内容也在发生变化。他们希望吃得更健康、更安全、更简单。中国的食品体系正努力跟上这种不断演变的消费偏好。农场生产更多西方国家常见的蛋白质食品和水果;超市销售更多有机农产品;餐厅则开始设计更健康的菜单。中国人的餐盘结构正在改变(见图表)。尽管猪肉仍占据主导地位,但鱼类和海鲜合计已成为第二受欢迎的蛋白质来源。事实上,中产阶级的饮食习惯似乎正变得越来越“加州化”。三文鱼、蓝莓和牛油果等食品正日益受到欢迎。
纵观历史,中国人长期担忧的是能否获得足够的主食,例如大米和面条。在这个农业传统深厚的国家,农业至今仍吸纳了五分之一的就业人口。仅凭全球9%的耕地养活世界17%的人口,本身就是一项非凡成就。因此,中国高度依赖农产品进口,而政府也一直希望提高粮食和农产品自给率。如今,大多数中国人已经能够享用充足且优质的食物。不到40年的时间里,中国完成了从粮票配给到控制腰围的转变:如今超过一半成年人口处于超重或肥胖状态。许多人担心的已不再是能否吃饱,而是自己究竟吃进了什么。…
随着国家变得富裕,人们追求更高质量饮食是一种普遍现象。但在中国,食品安全问题的历史阴影同样推动了这一转变。2008年毒奶粉事件导致6000多名婴儿患病,震动全国。近年来,关于“地沟油”以及餐厅大量使用预制菜的争议,也持续引发公众愤怒。
要理解中产饮食的“加州化”,不妨先看看某些食品需求的变化。2022年,中国政府发布的膳食指南首次将三文鱼列为优质Omega-3脂肪酸来源加以推荐。多年来,这种食物仅为极少数富人享用。如今,这种粉红色、肉质厚实的鱼类已在全国广受欢迎。来自超市、专业门店和直播电商的三文鱼切片,通过遍布各地的配送骑手迅速送达不断扩大的中产阶级消费者手中。挪威海产局的西格蒙德·比约尔戈(Sigmund Bjorgo)表示,中国今年已成为全球第二大三文鱼市场。
像Nordic Aqua这样的企业希望从迅猛增长的三文鱼市场中分得一杯羹。在浙江宁波郊区类似大型水族馆的养殖池中,这家挪威企业每年养殖8000吨三文鱼,并计划到2030年将产量扩大至2万吨(约400万条鱼)。公司负责人拉格纳·约恩森(Ragnar Joensen)预计,届时中国三文鱼市场规模有望达到每年30万吨。该公司的三文鱼上午捕捞,下午即可出现在300公里外上海消费者的餐桌上。在政府支持下,公司正在浙江基地建设全球最大的陆基大西洋鲑养殖场之一。其水循环系统即使不依赖抗生素,也能保持鱼群健康。
中国还扩大了其他深受加州消费者喜爱的食品的进口和本土生产。例如,牛油果和蓝莓的人气飙升,而价格则大幅下降。如今,一个牛油果和一盒125克装蓝莓的售价都已降至约1美元,仅相当于十年前价格的一小部分。西南省份云南已成为中国蓝莓和牛油果种植中心。去年,中国蓝莓产量接近100万吨,位居全球第一。随着产量激增,这种过去显得颇为“高端”的水果正进入越来越多普通中国家庭。
在饮食“加州化”的过程中,食品的生产方式也发生了变化。有机食品越来越受欢迎。到2024年,中国有机农业种植面积较十年前扩大了一倍,占全国耕地面积的0.7%。同期,有机食品销售额增长逾三倍,2024年达到167亿美元;仅2024年就比前一年增长了19%。运营“北京有机农夫市集”的常天乐认为,中国过去快速工业化以及土地价格上涨,迫使农民尽可能提高单位土地产量,从而形成了“重数量、轻质量”的发展模式。
虽然有机食品目前仍主要面向中产阶级,但随着越来越多农户投入有机种植,其价格正在下降。阿里巴巴旗下盒马鲜生近期向中国媒体表示,已将有机蔬菜价格从普通蔬菜的两至三倍,降至约1.5倍。其他大型电商平台也纷纷建立有机供应链,而社区菜摊则打出“绿色”“自种”等宣传标语。从山东到山西,各地农场都开始提供有机蔬菜订阅箱服务,借鉴西方国家的经营模式。
不过,挑战依然存在。由于过去曾发生土壤和水体污染问题,不少消费者仍怀疑中国市场上的产品是否真正达到有机标准。常天乐表示,尽管销售额每年都在缓慢增长,但她担心年轻人承受的压力过大,既无暇做饭,也难以关注食材品质。此外,小型农场为维持经营不得不收取更高价格,而这可能令消费者望而却步。(中国14亿人口中,约40%会点外卖。)
也有人看到了机会:把新鲜、健康的餐食做得既方便又便宜。高松在研究生阶段研究过美国快休闲连锁品牌 Chipotle Mexican Grill和 Sweetgreen,随后于2015年创立Foodbowl,并根据中国消费者偏好调整产品设计——毕竟许多人对生食沙拉仍抱有疑虑。疫情过后,公司业务迅速增长。高松认为,这与中国人更加关注健康有关。他的主要客户是年轻白领,他们希望在碳水化合物、蛋白质和膳食纤维之间取得平衡,同时追求“干净”的配料表。
这种“加州式”转变或许会受到政府欢迎。上海交通大学学者韩广华表示,中国民众在食品安全问题上依然“神经高度敏感”。而他的研究显示,公众往往会将食品安全问题归咎于中央政府,而非地方官员,因此避免食品安全丑闻始终是政府的重要任务。这种趋势也有助于应对日益严重的肥胖问题。去年,中国将不断上升的肥胖率称为“重大公共卫生威胁”。中国希望人们从“吃得饱”(吃得饱,chidebao)迈向“吃得好”(吃得好,chidehao)。如果这一目标能够实现,它很可能成为一场令人愉悦的饮食变革。#海外新鲜事#
《图解Skill》配套 Repo里面带的一个我日常用来整理写作 AI资讯的 Skill:info-digest Skill
就是我日常看到一些 AI资讯、新闻,就把内容贴进去让它生成资讯,发到 X和微博。默认是用 Claude网页 + Opus 4.6。你看我发的大部分 AI资讯的初稿都是出自它之手,当然我还会人工校验微调一下。
这套 Skill的提示词还是有一些可以借鉴的地方
1. 是站在读者关心的角度去写
我在写作路上犯的一个错误就是自嗨型写作,只顾自己表达,而不是看目标读者是谁,读者需要什么想看什么。
2. 联网检索做事实核查
另一个容易翻车的地方就是资讯本身是有问题的,一不小心就可能会中招闹笑话,所以让 AI辅助联网检索验证是有必要的,去做一些事实核查可以避免很多错误。
这也是为什么我是用 Claude网页版,因为联网检索能力相对更好一些
3. 交代清楚背景信息
这个和第一点有点相关,也是要站在目标读者的角度,看里面的一些概念读者是否知道,这件事是否讲清楚了来龙去脉。
4. 生成格式
因为这个 Skill生成的内容我是用来发 X和微博的,而这两个平台就是默认用纯文本,而且篇幅不易过长,所以就需要内容短一点、精炼一点,开头有吸引力一点,以及纯文本格式。
完整内容可以参考:
🎟️抽奖啦!为了回馈读者们对《图解 Skill —— AI提效实战指南》这本书的支持,也搞一次抽奖活动,抽 10个人,北京时间本周五中午12点开奖。
规则很简单:转发、引用、评论这条推文就可以。
可以选择实体书(仅限内地地址)或者电子书,中奖后我会根据名单给您发私信。
由于 X没有官方抽奖程序,所以我会借助 @grok帮我抽奖(亲测有效)。
我不知道你评论里面加一些提示词注入会不会提升中奖概率,但是我会提醒 Grok注意防范,尤其要过滤黄推和 AI写的😜
如果你已经购买了这本图书,建议可以去看看配套的 GitHub项目库,里面有一些书上放不下的内容,还有一些入门级别但是实用的 Skills,比如我写播客访谈稿用的分析和写作的两个 Skills:interview-analysis和 interview-writing,比如我日常用来整理写作 AI资讯的 Skill:info-digest Skill
图书配套项目库:JimLiu/Illustrated-Agent-Skills 京东购买链接:
附带文章:外文资料:github.com
附带文章:GitHub - JimLiu/Illustrated-Agent-Skills: 《图解Skill——AI提效实战指南》官方 Repo · GitHub
(作者:宝玉)的配套资源。书里因为篇幅放不下、或者更适合在线查阅的内容都收在这里:附录全文、写作工作流技能完整版、章节示例代码与数据、以及生成本书插图所用的技能本身。
各章配图与对应提示词因体积较大,已移至归档分支:archive-chapters-illutrations/chapters-illutrations。
试读样章见仓库根目录的【试读】图解Skill(前言+目录+第1章部分+第4章部分).pdf。. ├── 附录.md # 全书附录(术语表 / 安装指南 / 国内平台 / 完整技能)
├── 术语表.md # 英文术语与中文译名对照├── skill-templates/ # 第 5章写作工作流的简化技能模板├── skills/ # 完整可用的技能(含生成本书插图的技能)
├── examples/ # 章节示例代码与数据├── campaign-data-2025-01.csv # 第 7章数据分析示例用的样本数据└── 【试读】….pdf # 试读样章书末附录的可在线更新版,包含四个部分:编号内容说明附录 A术语表全书核心术语中英对照附录 B各平台技能安装指南Claude.ai、Claude Code、VS Code、OpenCode等附录 C国内模型 API平台与部署方案百炼、Kimi、智谱、DeepSeek、火山方舟 + OpenClaw一键部署附录 D写作工作流及访谈整理工作流完整版技能参考作者日常在用的四个完整技能 SKILL.md平台和命令会随时间变化,以这里的在线版为准。
这部分内容体积较大,已从main移到归档分支:archive-chapters-illutrations/chapters-illutrations。
归档分支中仍按章节组织(preface至chapter-07)。每个章节目录下:imgs/ — 书中最终采用的配图(.webp /.png)
prompts/ — 每张配图对应的生成提示词,文件名与图片一一对应bak/ — 同一个位置的备选稿或被淘汰的方案(不是所有章节都有)
ref/ — 参考素材(不是所有章节都有)
提示词文件开头以注释形式标注了配图在书中的位置和布局类型,方便对照阅读。这部分也可以当作"提示词怎么写"的样本库来翻。
第 5章介绍的简化版技能,可以直接复制到自己的技能目录使用:技能作用content-analyzer.md素材深度分析outliner.md大纲生成(多方案)
writer.md写作writing-style.md写作风格基调约束article-polish.md文章润色article-illustrator.md文章配图(简化版)
meeting-analyzer.md会议素材分析meeting-minutes.md会议纪要完整版(迭代更细致、串联逻辑更完整)见附录.md的附录 D。
可直接安装使用的完整技能。目前包含:book-illustrator/—本书所有插图就是用这个技能生成的。专注于《图解 Skill —— AI提效实战指南》的章节/附录书稿,一次性分析整篇书稿、批量识别配图位置、subagent并行出图、自动回写书稿。带references/design-system.md (出版三色调色板、对比规则、反 AI俗套禁用清单等)和prompts/子目录。
content-analyzer/ — 素材深度分析技能。支持文章、推文、视频文稿等多种内容类型,用于理解核心观点与论证逻辑、批判性评估、提取写作素材、分析传播价值。
interview-analysis/ — 访谈内容分析技能。将播客/视频访谈转化为结构化写作素材包和提纲,提取高价值信息点、金句与待验证背…
确实 😂
最近几个月涉及 @Tesla Robotaxi 车队的唯一几起“事故”,讽刺的是,都是别的车从后面追尾了它们 😂
没错。
目的不是把年轻人赶出互联网。目的是在一个政府经常用坐牢惩罚异议的国家里,把互联网的匿名性移除。英国的哈里发国已经不自由了。
订阅 SpaceX 投资者关系更新!
这是我读过的关于 SpaceX 主题最好的通用文章。
那些由纳税人资金补贴的左派,对 OMB(管理和预算办公室)更新联邦拨款规则后大发雷霆,这恰恰说明必须防止官僚体系把那些觉醒式、浪费且违背特朗普政府政策的支出,通过 NGO 漏出去。
https://afj.org/article/federal-funding-the-omb-rule-proposal-thats-got-nonprofits-talking/
在与 @Space_Station 对接 30 天后,为 SpaceX 第 34 次商业补给服务任务提供支持的 Dragon 飞船,将于 6 月 16 日星期二从这座轨道实验室脱离对接 → http://spacex.com/launches/crs34
俩车定位完全不一样,,这车90%行政10%自己开,根本不是家庭定位,这车最适合以前坐揽胜或者埃尔法的老板//@SilverwoodJerrod:冷知识这是条理想广告
#每天转个广告# 出差,体验了一台ES9 300公里。
真是太大的车了,体验上有点类似当年的加长版4座揽胜,后排尺寸乘坐体验都更好,有脚托可以躺椅模式玩手机,俺觉得50万以上行政定位的车,一定得配个脚托🐶因为一路都是城市和高速路,这个主动悬架没体验出来优势,反而感觉路感有点过强,后来开了舒适模式感觉更好一些。
另外真觉得后排别用头枕屏,还是应该用吸顶屏,显示效果和私密性都会好很多(图三),还有就是希望行政商务定位的车厂产品经理,自己都坐上100小时自己的车,或者看看数据,后排用户睡觉多还是玩手机多,后排的杯架和充电,显示屏操控怎么设计,非常小的功能,但是做不好了真是影响体验,比如ES9这个充电面板这种设计,既美观又无用,真不如座椅上留个快充口🙄
#模型时代#
# Benchmark传奇合伙人Bill Gurley的心智模型:同时吃透历史和前沿的人,在任何领域都最难被替代
---
Bill Gurley是硅谷风投机构Benchmark的传奇合伙人,早期投资了Uber、Zillow、OpenTable、Grubhub等一系列定义了互联网平台经济的公司。他在华尔街起步,做过研究分析师,后来加入Benchmark的第三期基金,一待就是二十多年。2023年前后他从日常投资中退出,搬到奥斯汀,目前担任研究复杂性理论的圣塔菲研究所Santa Fe Institute的董事会成员。2026年初他出版了新书*Runnin' Down a Dream*,讲述如何打造自己热爱的职业生涯,同年4月在TED发表了同主题演讲。
这期The Knowledge Project播客于2026年6月9日发布,主持人Shane Parrish与Gurley聊了超过一小时。谈话从系统思维的心智模型出发,延伸到AI竞争格局、开源模型对中美竞争的影响、stablecoin对信用卡体系的威胁、风投圈的资本过热与循环交易,以及Benchmark独特的等额合伙结构。Gurley的思路总是从一个变量出发,追到第二层、第三层的连锁反应。
## 一、系统思维:用非线性视角看世界
1、**复杂系统的核心特征是多变量、非线性、不可预测**
Gurley是圣塔菲研究所的董事,这家机构专门研究复杂性理论。他把复杂系统定义为"多变量非线性系统",天气、股市都属于这个范畴。这类系统可以长期按一种模式运行,但某个变量一旦切换,整个系统的行为方式可能突变。
因此,用单一变量或线性模型去预测结果,几乎注定出错。你在这里做了一个改变,它会引发那里的变化,那里的变化又会引发更远处的连锁反应。
2、**二阶效应的陷阱:短期指标正向,长期后果反转**
他举了一个约会网站的例子。产品团队假设"加长个人资料页面会提升用户参与度",测试结果也确实支持了这个假设,于是全量上线。但几个月后他们发现,用户知道得越多,转化率反而下降了。…
这就是经典的二阶效应:一阶指标变好了,二阶后果却是负面的,而你要过很久才能观察到这层影响。Gurley认为,系统思维最大的实用价值在于帮你"避开麻烦",让你在决策时不会过度锚定在单一指标上。
## 二、知识的双端策略:历史基石与前沿边缘
1、**投资知识的迁移路径:从价值投资基石到风投前线**
Gurley从华尔街起步,最早读的是Peter Lynch的《One Up on Wall Street》(从日常生活中发现投资机会,普通人能跑赢华尔街)、Burton Malkiel的《A Random Walk Down Wall Street》(股价本质上随机游走,主动选股长期跑不赢指数),之后是巴菲特的股东信(用合理价格买入优秀公司,靠复利和长期持有取胜)、Ben Graham的经典著作(价值投资的源头:安全边际、内在价值、把市场波动当机会而非信号),再到Howard Marks的投资备忘录(二层思维、识别周期位置、理解风险比追求收益更重要)。这些构成了他的"金融基石"。
进入风投后,他的关键转折来自一个人。他在First Boston的同事Michael Mauboussin把他介绍给了传奇投资人Bill Miller。Miller管理Legg Mason Value Trust基金,创下了连续15年跑赢标普500的纪录,从1991年一直持续到2005年,同时长期重仓亚马逊。Miller自称价值投资者,但他对"价值"的定义与传统派截然不同:价值的意思是资产当前价格低于你认为它未来的价值。如果你相信网络效应,亚马逊就可能以超出常理的速率持续增长。
Gurley从中学到的一课是:理解金融基石之后再去创新,比从零开始强得多。他还有一个独特视角,把华尔街视为风投产品的"买家",因为最终退出要么是并购,要么是IPO,定价权掌握在公开市场手中。从第一天起就思考公开市场投资者看重什么,哪怕面前的项目还只是两个人加一份PPT。
2、**掌握行业历史的人,在任何面试和竞争中都天然醒目**
金融基石帮了Gurley自己,但他认为这个规律适用于所有领域:在任何行业里,真正吃透了历史的人都会显得与众不同。他讲了三个例子。
第一个来自《玩具总动员》导演、Pixar创意核心John Lasseter。Gurley的Benchmark合伙人在网球名将Andre Agassi组织的慈善拍卖中拍下了和Lasseter共进晚餐的机会。到了Lasseter家里,他在自己的私人放映厅摆了一桌十道菜的晚餐,每道菜配一部他认为对理解动画史至关重要的经典短片,吃一道、放一部、讲一段。十道菜吃完,等于上了一堂浓缩的动画史课。
第二个是国际象棋世界冠军Magnus Carlsen。在世界锦标赛的中场休息环节举行了一次知识竞赛,内容全是国际象棋的历史,Carlsen赢了。
第三个是毕加索。多数人看到毕加索的立体派作品,不会想到他14岁的时候已经是一个极其成功的写实画家。去巴塞罗那的毕加索博物馆,你可以亲眼看到那些早期作品。Gurley用这个例子说明:大师在打破规则之前,先把规则吃透了。
他的结论是:想象你去宝洁或百事应聘一个营销岗位,面试现场有20个候选人,而你是唯一一个能谈论营销大师及其经典案例的人,这种区分度是碾压级的。他更进一步说,如果了解行业历史让你感到枯燥,那说明这个领域可能不是你的热情所在。
3、**前沿边缘的痴迷式学习,是创业者最常见的特质**
Gurley观察到的优秀创业者的共性不一定是历史功底,而是obsessive learning,对前沿变化的痴迷式学习。每一波技术浪潮催生创业机会的前提,都是有一些动态变化正在最前线发生。抓住这个窗口的创业者,每天晚上回家都在读一切能找到的材料,因为前沿在移动,你必须站在那个位置,成为理解这件新事物的前1%。
今天这个前沿是AI,但在移动互联网时代也一样:当智能手机刚出现时,根本没有写过移动应用的工程师,少数几个人冲到了前沿并搞清了它意味着什么。
他把历史基石和前沿边缘并列为双端策略:如果你同时掌握了你所在领域的深层历史,又真正理解最新的前沿技术,你就是这个领域的power player。对年轻人来说,前沿知识尤其是破局的利器:一个理解营销传奇人物的历史、同时又真正懂TikTok的人,走进任何公司面试都会非常突出。
## 三、AI竞争格局:开源、监管与模型边界
Gurley在过去20年里花了大量时间在中国,当被问到他的非共识观点时,他第一个提到的反而是地缘政治:当前华盛顿和硅谷对中国的妖魔化叙事,在他看来站不住脚。美国占全球人口大约3%到5%,当有人说出"美国例外论"这个词时,Gurley总会想,地球上另外95%的人听到这个词会怎么想。这个立场为他看待中美AI竞争提供了一个与主流不同的出发点。
1、**Gurley自己的AI使用习惯:多模型并用,用途驱动选择**
Gurley同时付费使用五个AI产品。他偏好ChatGPT的Project功能和记忆功能,就是那个能记住你是谁、记住你偏好的特性。找餐厅他用Gemini,因为Gemini接入了Google评论数据,可以追问到具体菜品层面:哪三道菜被反复称赞,哪些菜评价里有人警告。编程圈子里大家首推Claude。他还听到做金融研究的人偏好Perplexity做快速查询,但深度研究公司和国家时觉得Claude表现更好。
他的一个重要提醒是:人们经常低估AI能做多少事。你可能让它列出某个领域的前10名,然后自己再去一个个研究。但你完全可以在一个prompt里让它列出前10名、分析各自优劣、按某个维度排序,然后再按另一个维度重新排序。你原本打算分步做的工作,一次性塞进prompt就能完成。
2、**中国开源模型的"农夫分享最佳实践"效应**
当被问到中国有多少好的开源模型时,Gurley修正说大概有十个。他用一个农业社会的类比来解释开源竞争系统的优势:想象两个农业社会,一个社会的农民到集市上只是买卖商品然后各回各家,另一个社会的农民到集市上被要求和所有人分享最佳实践。哪个社会进化更快?
开源让所有人都能看到别人在做什么、怎么做。很多中国团队不仅开源了权重,还发表了他们发现新技术的方法论。模型可以训练模型,模型可以测试模型。这创造了一个创新速度远超封闭系统的竞争动态。
他还指出一个"安静的秘密":硅谷有大量创业公司正在fork这些中国开源模型,也就是拿过来在上面做二次开发。这个现象的规模从未上过大报的头版,但从数量和广度来看已经相当可观。
3、**监管可能成为寡头垄断的保护伞**
在AI监管问题上,Gurley的判断比较尖锐。如果监管变得极其复杂、繁琐和昂贵,结果可能是加固寡头垄断而非保护公众。他暗示,"有些玩家知道这一点,正在主动请求监管",因为高监管门槛会把中国开源模型和中小创业公司挡在门外。
版权问题是一个具体的风险点:如果美国模型必须遵守严格的版权规则,而中国开源模型不受同样的约束,竞争天平就会倾斜。
4、**垂直AI vs通用模型之争仍是开放命题**
关于AI是否会被一个通用模型统治,Gurley站在垂直一侧。他的理由是:法律AI创业公司花了大量时间吃透所有判例法、理解法律流程和原则,在此基础上帮客户起草文件、构建新数据库。一旦你在这个垂直领域扎下去了,很难想象你会突然切换到ChatGPT。
但他也承认另一面:OpenAI等公司的产品团队已经明确提到要进入垂直领域。历史上微软从操作系统起步,最终干掉了Lotus 1-2-3和WordPerfect。通用平台向上吃掉垂直应用,这种路径是有先例的。
5、**AI训练数据的天花板与超级智能之辩**
Gurley用"painting in the corners"来形容当前AI训练的状态:数据正在被用尽,大部分角落已经填满。目前最有效的提升模型质量的方法之一,是花几千美元一小时雇佣各领域专家来做精细调优和提出极难的问题。但专家知识本身也有边界。
围绕AI是否能实现超级智能、是否能自我改进从而进入非线性增长曲线,Gurley没有直接站队。他引用了Meta首席AI科学家Yann LeCun的观点:下一代AI可能不是LLM,而是比LLM更广的架构。LLM基于语言,而语言能捕获的信息有上限,这也是它们在数学和数字方面表现不佳的部分原因。
关于AlphaGo的Move 37,那步让所有人类棋手震惊的棋,Gurley认为它确实证明了AI可以做出人类从未想到的创新。但反方的论点是:围棋是一个高度受限的环境,计算机可以搜索人类不可能遍历的可能性空间。现实世界的路径是无穷的,复杂系统中没有办法让AI走遍所有可能的分支。而且AlphaGo用的并不是LLM,而是针对特定约束系统训练的AI模型。Tesla的FSD全自动驾驶也是同理:输入是视觉数据,输出只有刹车、方向盘和油门这三样东西,仍然属于受限环境。
## 四、资本周期:过度投入、循环交易与烧钱率
1、**"递增收益"信仰正在推高整个风投圈的风险偏好**
Gurley指出,风投行业整体的风险偏好在系统性上升,驱动力是对幂律分布power law和递增收益increasing returns的信仰。从Google到Amazon到Meta,这些公司最终的价值都远超任何人最初的预期。当整个投资者群体都相信了这个规律,他们就更愿意提前押注、承担更大风险。
有人给他转发了一张图表,列出了各时代标志性公司在实现正现金流之前的累计亏损。亚马逊大约亏了20到30亿美元,Uber大约亏了150亿美元,而现在的AI公司将远超这个数字。从另一个角度看这件事的荒诞性:QQQ这一只纳斯达克ETF,大概跑赢了80%到90%的风投基金。一个顶级VC公开承认这个数字,本身就说明了风投行业的回报分布有多极端。
2、**循环交易在推迟清算的同时也在放大泡沫**
Anthropic CEO Dario Amodei在DealBook大会上被问到循环交易时做了一番辩解,Gurley转述了他的逻辑:云服务商发现Anthropic想训练一个50亿美元的模型但没有这笔钱,于是给它这笔钱,让它花在云服务上。如果没有这笔补贴,Anthropic根本不会花这些钱。所以整个生态系统的增长速度被人为加速了。
Gurley认为这类循环交易同时产生两个效果:增加了市场最终出现回调的概率,但也延长了回调到来前的时间窗口。回调的烈度可能远超温和调整,更接近2000年互联网泡沫那样的"核冬天",当时亚马逊用了三四年才从低谷中重新爬出来。
3、**烧钱率是风险的度量衡,但现在的数字已经失去参照系**
十年前,月烧100万美元就被认为是高风险。今天的AI公司年烧50亿美元,月烧1亿甚至更多。Gurley的担忧是:当财务上这么激进时,你根本搞不清自己的单位经济模型是什么。成功的公司会不断被追加投资,每一轮融资几乎都是还没到期就被抢着投的preemptive round,而拿到3亿美元之后唯一的花法就是把烧钱率推上去。
## 五、支付革命:stablecoin、代币化与Visa的60%利润率
1、**美国支付系统落后于全球的根源是监管俘获**
英国20年前就通过Faster Payments实现了银行间即时转账,印度、中国、澳大利亚、巴西等国也都建立了类似系统。美国迟迟没有做到这一点,原因是银行业通过国会金融委员会对监管施加了强大的阻力。美联储有一个叫Fed Now的项目,但一直推不动。
结果就是美国消费者被困在信用卡体系里,每笔交易被收取2%到2.5%的手续费,信用卡生态下方还养活了一整条产业链。美国国内转账的替代选项也不友好:ACH银行转账需要三天才能到账,同日到账的电汇要收25美元手续费外加填一页表格,有时还得跟银行打电话做口头确认。Gurley认为这一切完全没有存在的必要。
2、**stablecoin是绕过监管俘获的实际路径**
如果你有Coinbase账户,可以把钱放入USDC这种stablecoin并获得约4%的利息,同时在几秒钟内以极低成本向任何人转账。stablecoin的运作方式是发行方为每一枚stablecoin在美国国债中持有等额的美元储备,USDC的发行方Circle就是这么做的,类似于一种数字版的金本位。因为它跑在已经相当成熟且全球化的加密基础设施上,所以可以实现即时、低成本的跨境转账。
Gurley判断,由于美国政府等得太久,stablecoin可能比Fed Now更快地解决问题。尤其在当前华盛顿对加密资产总体友好的政策势头下,这个趋势可能加速。
3、**Visa和Mastercard的60%营业利润率面临根本性威胁**
Visa和Mastercard拥有商业史上最高的营业利润率之一,约60%。它们是双寡头,由银行系统创建,银行在其中持有股份。整个行业在现有体系中赚了大量的钱,但2%到3%的交易手续费完全没有合理性。
中国的案例证明了替代路径。因为政府推动了即时转账基础设施,阿里巴巴和腾讯迅速建起了数字钱包生态。在中国,无论是从街头小贩买帽子还是在华为门店买车,都用微信支付或支付宝扫二维码完成。在餐厅结账不用叫服务员,桌上就有二维码,扫一下就付了。这整套支付创新远远领先于美国,根源就在于政府做出了让资金转账变简单的决策。
4、**代币化对IPO流程的颠覆潜力**
Gurley对传统IPO流程一直持批评态度。当前的IPO机制是:投行选定价格、挑选股东,把最好的份额分给自己的优质客户。他认为这对公司极不公平。如果让一个大一的计算机系学生和一个大一的金融系学生来设计公司上市的方式,他们会设计一个匿名的供需匹配拍卖机制,和加密货币领域的ICO首次代币发行的原理完全一样。没有人会从头发明一个让投行挑客户、给甜头价的制度。
Benchmark曾推动过direct listing即直接上市的方式,就使用拍卖机制。但华尔街不愿放弃这种"贪婪的权力攫取",又回到了受控的寡头模式。Gurley认为,代币化至少在股份分配这个最基础的层面上,有可能带来真正的颠覆。Robinhood已经在2025年宣布推出代币化股票产品,虽然私人公司代币引发了争议,OpenAI公开表示未授权也不认可,但这个方向的势头已经不可逆。
## 六、被动投资与代理投票的治理隐患
1、**指数基金的投票权问题可能是公司治理最大的结构性风险**
被动投资兴起后,大量股份集中在指数基金手中,但这些基金没有时间和资源去真正评估每一项投票议案。它们依赖ISS这类代理投票服务机构,而这些机构的运作方式存在严重的利益冲突:它们用黑箱打分体系给公司评分,但不告诉你评分标准是什么。想知道评分细节?聘用它们就行。两头收费。
Gurley认为这些机构从公司治理合规的出发点慢慢偏离了股东利益,聚焦于风险管控而非价值创造。特斯拉给Elon Musk的薪酬方案就是一个典型案例:只有股价大幅上涨你才能赚到钱,股价不涨就一分不拿。Gurley说他愿意对自己投资过的每家公司签署这种协议,而且大多数CEO根本不敢接受这样的条款。但ISS类机构投了反对票,因为它们从风险管控的视角出发,看到的是超出常规的东西,而不是对股东极其有利的激励对齐。
Gurley还提到Moody's:它的护城河并非分析能力本身,而是作为"标准"被全行业信任的身份。即使AI在技术上能做出同等质量的债务分析,Moody's的品牌认证功能仍然难以替代。但他也承认,这些基于信任标准的机构都可能面临AI的冲击。
一个可能的改善方向是:让指数基金不投票,让主动股东的声音获得更大权重。或者,要求被动持有者按照直接持股者的投票比例同比投票。
## 七、创始人的王牌、VC的结构与Benchmark的制度红利
1、**成功创始人的三到四项核心特质**
Gurley被问到成功创始人的top 3特质时,列出了以下几项:
- **讲故事的能力**,也就是storytelling:创始人每天都在卖。招人、招高管、融资、签客户、谈合作,全是销售。贝索斯、Shopify创始人Toby Lütke、Spotify创始人Daniel Ek都是讲故事的天才,听他们的播客你就会明白,为什么全世界愿意跟着这些人走。
- **产品直觉**,英文叫product instinct:这种能力部分来自对前沿的理解,但更大程度上是天生的。Gurley花了整个职业生涯才充分认识到,招一个非产品出身的人然后指望他变成产品高手,成功率可能不到5%。
- **不可阻挡的决心**:Gurley引用了贝索斯选天使投资项目的标准。贝索斯说他见到创业者时只问自己一个问题:"这个人是不是无论如何都要做这件事?哪怕天塌下来、洪水泛滥,他也不会停。"这种级别的决心存在于所有伟大的创始人身上。
Gurley自己作为投资人也把写作当成核心工具。他引用了贝索斯在亚马逊推行的"六页信"机制:如果你必须把一件事写成一篇自成一体、逻辑自洽的文档,你就不得不把所有角落的问题想清楚、把松散的环节收紧。写作迫使思考变得完整。
同时,写作还是一种deal flow获取机制。当一个创始人在自己正在做的领域里读到了你的深度分析,他会主动来找你。博客和研究报告变成了"名片",让不认识你的人因为看到了你的专业判断而选择与你合作。
2、**Uber教给Gurley的一课:当烧钱率进入无人区,没有导师可以打电话**
Uber时代的竞争格局是:所有人都知道这个品类具有赢家通吃的网络效应。对手融了10亿美元?那我们融30亿。而花掉这些钱的唯一方式就是把烧钱率推上去。Gurley当时意识到,这种局面下没有哈佛商学院的案例可以参考。就算你把沃尔玛、Costco、通用汽车、GE的董事会成员请来,他们此前也从未面对过这种规模的烧钱竞赛。没有前人的经验,没有导师可以打电话。
这个经历让他对今天AI公司的处境更能共情。"Uber是'超级烧钱'的第一家。亚马逊当年也烧了不少,但Uber把量级提升了一个台阶。而现在的AI公司又加了一个零。"
3、**风投是唯一存在声誉网络效应的投资品类**
Gurley指出,有人认为风投是唯一一个投资者自身存在网络效应的品类。一旦你有了成功的投资记录,你的背书本身就对创始人有吸引力,这反过来让你获得更好的deal flow,更好的deal flow又强化了你的成功记录。这个正反馈循环是风投不同于二级市场投资的结构性特征。
他接着指出,这也是年轻人能在风投行业快速崛起的原因。年轻的投资人更可能和创始人同龄,更可能理解这些新技术,更可能在某个细分领域比资深的全能型VC知道得多。比如一个对电竞或YouTube创作者经济了如指掌的年轻人,在这些垂直领域的认知深度可以迅速超过凯鹏华盈的John Doerr或红杉资本的Mike Moritz这样的行业前辈。
但风投也是一个高度消耗体力的行业。年龄带来了孩子、房子和各种责任,你不再可能每周花80小时去研究某个新平台。所以整个行业天然地偏向年轻。
4、**Benchmark的等额合伙制:绝大多数正面效应加一个致命短板**
Benchmark的创始人之前都在等级制的风投机构待过,觉得资深合伙人拿了太多的钱和功劳,却没有做对机构成功最关键的工作。所以他们决定做一个纯粹的等额合伙制:五个平等的合伙人,没有首席合伙人,没有总裁,没有任何层级。
正面效应是一串连锁反应。最直接的好处是招人:等额条件让Benchmark极易从其他机构吸引顶尖人才,因为等级制机构不可能给出同等待遇。培养新人的动力也因此被激活,老合伙人从新人的成功中等额获益,自然会投入时间和资源去带人。Gurley自己刚加入时就感受到了这种全方位支持。合伙人之间的竞争关系也随之消失:如果某人的被投公司需要一个CFO而另一个合伙人恰好认识合适的人选,他会直接推荐,因为你的公司成功和我的公司成功在经济回报上完全等价。年度薪酬评审和分蛋糕的政治内耗?不存在,因为永远是等额分配。
致命短板只有一个:没有CEO就很难扩展业务、推动新项目。谁来管网站?谁来承担责任?合伙人Matt Cohler曾主动接管网站建设,做了一个复杂精美的版本,结果引发各种投诉。最后他把所有内容撤掉,换成了一个只有logo和一句话的单页面。大约15年过去了,Benchmark的网站至今仍然就是这一个页面。
Gurley也强调,很多顶级风投机构并不采用等额合伙制,一样非常成功。这不是唯一的成功路径,但它确实产生了独特的制度红利。
## 核心归纳
**Q1: 为什么系统思维对投资和产品决策特别重要?**因为复杂系统是多变量、非线性的。一个变量的改善可能在一阶层面表现为正向,但在二阶层面引发负面后果,而你往往要几个月后才能观察到。系统思维的实用价值在于逼迫你在决策前追踪连锁反应,而非锚定在单一指标的短期表现上。
**Q2: stablecoin如何威胁到Visa和Mastercard的商业模式?** Visa和Mastercard的双寡头地位建立在美国没有银行间即时转账基础设施这一前提上。信用卡收取2%到3%的手续费完全没有技术必要性,英国、中国、印度等国早已实现了近乎零成本的即时转账。USDC等stablecoin跑在成熟的加密基础设施上,提供即时、低成本的资金转移。由于美国政府的Fed Now项目长期受阻,stablecoin可能成为最先打破这一僵局的力量。
**Q3: Benchmark的等额合伙制产生了哪些结构性优势?**等额合伙制消除了内部竞争动机:老合伙人主动培养新人,因为新人的成功等额计入自己的回报;合伙人之间无偿共享资源和人脉;每年零政治内耗。同时它极大提升了对外部顶尖人才的吸引力,因为等级制机构无法匹配这一条件。代价是没有CEO角色,难以推动跨合伙人的新项目或扩展业务,Benchmark至今只有一个单页网站就是这个结构性短板的缩影。
#模型时代# Fable 5下线事件始末(出处见图)
我已经与政府内外的一些人士就 Anthropic当前的情况进行过多次交流,以下是我认为属实的情况:
— 正如我们所知,Anthropic本周早些时候以商业名称 Fable公开发布了其 Mythos类模型。
— Fable是带有护栏的 Mythos。但如果这些护栏失效,那么你就把 Mythos及其先进的网络能力暴露给了不应该拥有它们的人。(请记住,Anthropic自己曾广泛宣传 Mythos是一种网络武器,需要据此进行监管。他们曾请求政府对 Mythos进行监管,并支持为 Fable设置护栏。如果存在漏洞——无论大小——修补它都是 Anthropic的责任。)
— 一位同时受到 Anthropic和 USG信任、且高度可信的合作伙伴在测试 Fable时发现了绕过这些护栏的 jailbreak。政府要求 Dario修复该 jailbreak或停止部署该模型。Dario拒绝了。
— 在他们的博客文章中,Anthropic为其决定辩护称,这种 jailbreak并不严重。这并不是受信任合作伙伴和 USG所认为的情况;而且,这种淡化问题的措辞也与 Anthropic作为 AI安全公司的品牌定位不一致。很难想象,他们怎么会声称一种允许网络武器具备可操作性的 jailbreak可以被定义为“不严重”。
— 过去,Anthropic一直表示,安全必须是最优先事项,并且必须被极其严肃地对待。但在这件事上,Anthropic将持续提供消费者模型置于安全之上。
— 作为回应,政府发布了出口管制。政府是很不情愿地这样做的。对于 Anthropic不愿配合一个合理的安全请求(即修复 jailbreak问题),政府感到非常惊讶。Anthropic的反应与其作为安全 AI研究社区的品牌形象和理念非常不符。
— 政府目前希望 Anthropic能整改这一安全问题,解除出口管制,并让 Fable重新进入全面发布。政府希望这一切尽快发生。坦率地说,Anthropic不愿遵守其先前声称为最高优先级的安全请求,这一点令人困惑。
— 那些试图误导并将这一行动与此前的 DoW/Anthropic问题联系起来的人是错的。政府重视 Anthropic的技术能力,并认为这一问题虽然严重,但应当很容易解决。球现在在 Anthropic那边。
#数码
针对手机做的 KVM:
这东西原理也不复杂,需求也挺明确的(iOS自动化),AI加持下会非常好用。
怎么现在才有人做啊,感觉半年内至少会有 10个深圳竞品。
#每天转个广告# 出差,体验了一台ES9 300公里。
真是太大的车了,体验上有点类似当年的加长版4座揽胜,后排尺寸乘坐体验都更好,有脚托可以躺椅模式玩手机,俺觉得50万以上行政定位的车,一定得配个脚托🐶因为一路都是城市和高速路,这个主动悬架没体验出来优势,反而感觉路感有点过强,后来开了舒适模式感觉更好一些。
另外真觉得后排别用头枕屏,还是应该用吸顶屏,显示效果和私密性都会好很多(图三),还有就是希望行政商务定位的车厂产品经理,自己都坐上100小时自己的车,或者看看数据,后排用户睡觉多还是玩手机多,后排的杯架和充电,显示屏操控怎么设计,非常小的功能,但是做不好了真是影响体验,比如ES9这个充电面板这种设计,既美观又无用,真不如座椅上留个快充口🙄
太离谱了。
火箭和飞船带我们奔向群星,这是令人向往的未来。
即将到来之事的规模前所未有。
笑死。计划就摆在这儿,明晃晃地摊开给你看。制造问题(陌生人危险),卖解决方案(更具权威性的监控国家),如此循环往复。那些多年来一直大喊大叫的阴谋论者,所有人都欠他们一个道歉。
最新消息:英国政府澄清说,成年人仍然可以通过使用数字 ID、面部识别、护照和信用卡来使用社交媒体。
SpaceX 的 IPO 胜利、Anthropic 的 Fable 失误与 OpenAI 的价格战
这期节目把三件事串成了一条很清晰的主线:SpaceX 为什么能在短时间内被资本市场重新定价为“AI 时代的重量级资产”,Anthropic 为什么会因为 Fable 的限制策略遭遇强烈反弹,以及 OpenAI 接下来会不会被迫卷入一场更直接的价格战。两位嘉宾的核心判断很一致:单个模型本身的差异正在变小,而真正会拉开公司距离的,越来越可能是围绕模型构建的基础设施、产品入口、编排层和分发能力。换句话说,这期讨论的不是某个模型好不好,而是 AI 行业到底会把价值沉淀到哪里,以及谁能把这种价值变成可持续的商业护城河。
主要内容
SpaceX 部分的重点,不只是“又一家大公司上市”,而是它如何在 IPO 前后迅速被讲成一家 AI 公司。节目里反复提到,SpaceX 一年前还主要是火箭、星链和发射业务,但在进入 IPO 叙事时,它通过与 Anthropic、Google 的大额合作,把自己包装成了一个拥有巨大 AI 基础设施和云能力的平台。…
但不知为何,身份证却被加州、纽约和许多其他州禁用于投票。
但不知为何,身份证却被加州、纽约和许多其他州禁用于投票。
这项审查法案是一匹披着羊皮的狼。真正的目标是让英国政府能够追踪每一个人。
这项审查法案是一匹披着羊皮的狼。真正的目标是让英国政府能够追踪每一个人。
SpaceX 在 2 月吸收 xAI 时采用的使命宣言写道:“让一个有知觉的太阳去理解宇宙,并把意识之光延伸到群星。”
这取决于你怎么理解它,要么是认真公司历史上写在使命页面上的最荒诞的东西,要么就是最诚实的。我们认为是后者。
如果你眯起眼看这张组织架构图,SpaceX 就是一家发射服务商,外加一个互联网子公司和一个最近收购的 AI 实验室。
如果你眯起眼看技术路线图,它是地球上唯一一家在拼齐通往后稀缺转型所需的整套前置栈的公司。
如果你眯起眼看这份使命宣言,它就是当代最有执行力的创始人之一,为推动人类跨过那个瓶颈所做出的认真尝试。而那个瓶颈的尽头,要么是我们成为一个与自己造出的智能机器共享宇宙的星际物种,要么就是在那颗没能跨过去的岩石行星上沦为一则脚注。
观看 Falcon 9 从加州发射 24 颗 @Starlink 卫星入轨 https://x.com/i/broadcasts/1qKVmmnzPgmxB




























































































