2026-06-14 信息流

62 条 · 非中文默认译为简体中文
HK-IPO归档
微博: 31X: 28网站: 2Podcast: 1

//@牛津-小裁缝:毕节大方县,面积是深圳的1.5倍,常住人口只有83万。随着人口向核心都市圈集中,县城的年轻人越来越少,行政区划调整在所难免,建议人口少于100万的县,直接与其他县合并。//@SEM_WL536://@壽s派://@敬一山:都还抢着上船呢……//@作者李媛媛://@摩诃般若么么龙:挖槽//@豆豆vera在香港://@于此聚焦://@诗酒之路:大方县确实大方。

某县城财政供养4万人,年吃皇粮26亿!县城财政正在迅速崩塌!

**Anthropic设计主管:Anthropic所有带团队的管理者都在一线构建产品,看Token用量不如看最原始的产品指标**

工作间隙,发一篇 Meaghan Choi 的访谈笔记。她是 Anthropic Claude Code 和 Cowork 的设计主管,此前在 Meta 和 Cloudflare 负责开发者体验以及新兴技术方向的设计工作。这期访谈录制于 2026 年 ProductCon 纽约大会的现场舞台,由 Product School 主持人 Carlos González de Villaumbrosia 对话。

还有,Claude Code 团队的多个关键岗位由女性担任。主持人列出了 CPO、产品负责人、工程负责人、平台产品负责人、平台工程负责人,加上 Meaghan 本人和 Anthropic 总裁 Daniela Amodei。据 2026 年 5 月 Code with Claude 大会的公开信息,这些岗位分别对应 Ami Vora、Cat Wu、Katelyn Lesse、Angela Jiang 等人。Meaghan 说,这件事发生得自然到团队自己都没太注意,直到外界指出来才意识到。

Meaghan 在对话中透露,Claude Code 目前占据 AI 编程工具市场约 51% 的份额。

一、从 12 个人的副项目到年营收 25 亿美元

1、**Claude Code 起步于 2024 年几位工程师的自发探索**

当时整个行业还停留在把代码复制粘贴到聊天窗口、再粘贴回编辑器的阶段,少数人用自动补全。有人开始实验一个想法:让 Claude 直接在你的计算机上执行操作,而不只是给你建议。

一位团队成员用 CLI 做了一个原型,给了 Claude 访问本地文件系统的权限,录了一段视频发到内部 Slack。Meaghan 看到后的反应是:“天哪,就是它了。”但这个原型需要大约一小时才能跑起来,使用体验粗糙,模型能力也还没到位,大概提前了 6 个月。

2、**“如果 Anthropic 所有人都愿意用,外面的人也会想用”**

团队花了接下来的 3 个月专注做一件事:在公司内部推广,让尽可能多的人使用。方法是跟着用户走,看别人怎么用,现场修 bug。Meaghan 回忆自己第一次参与产品工作时,因为 CLI 的设计太新了,所有设计迭代都在 Google Docs 里做,因为那已经是你能拿来代表一个 CLI 界面的最好载体了。

E

在3座城市的3种地质条件中掘进:拉斯维加斯的黏土/钙结层、纳什维尔的石灰岩,以及巴斯特罗普的砂质黏土。

[打脸] [打脸] [太开心] [打脸]

最新 Nature Medicine研究显示:LLM前沿通用大模型(GPT-5.2、Claude Opus 4.6、Gemini 3.1 Pro)在多项医疗基准测试中,全面超越了专门设计的临床 AI工具(如 OpenEvidence和 UpToDate Expert AI)。

测试包括:MedQA医学知识题HealthBench临床对齐评估真实临床查询(RCQ)盲测,由 12名美国临床医生随机盲评

前沿模型在所有维度都完爆,专家定制化定制了个寂寞 [呵呵]

media

攀登人生第一座雪山🏔️@Linksphotograph #现在见山海#

晚期癌症的新面貌:无法治愈,却能活上数年

图片来源……《纽约时报》本·布鲁尔(Ben Brewer)

得益于新的治疗方法,一些晚期癌症患者的生命得以延长——这也让他们在长达数年的时间里陷入了一种悬而未决的尴尬境地。

尼娜·阿格拉瓦尔(Nina Agrawal)

作者:尼娜·阿格拉瓦尔

尼娜·阿格拉瓦尔专注于撰写关于癌症诊断与治疗的变化,以及这些变化对患者意味着什么。

2026年6月12日

凯特·迪特里克(Kate Dietrick)漫步在19世纪的墓碑群中,不时停下脚步,读一读刻在墓碑上的墓志铭。前不久冰雪初融,脚下的土地有些松软,微微下陷。一阵风吹来,拂乱了她的短发。

42岁的凯特花了一上午的时间来为自己挑选一块墓地。眼前这块看起来很合适:这片墓地属于一家犹太会堂,她是在2021年皈依犹太教后加入该会堂的。这个会众群体是该州历史最悠久的——凯特的职业与历史打交道,她很欣赏这个细节。而且这里绿树成荫,给人一种宁静的感觉。

然而,想到自己将独自躺在这里,她还是感到有些不安。她没有孩子,尽管她和丈夫结婚快10年了,但完全有可能在她去世后,丈夫会再婚,过完漫长的一生,然后与另一个人合葬。

“我到时候又不在那儿了,所以我也不知道自己为什么这么介意,”她说,“但这确实让人感觉有点孤独。”

凯特患有4期(晚期)乳腺癌。或者更准确地说,凯特目前正带着4期乳腺癌生活,并一步步走向死亡。她说,这是最真实的表达方式:距离确诊已经过去了快四年,所以这种病现在看起来几乎像是一种慢性病——只是死亡的阴影要笼罩得近得多。

她希望能撑到五年。五年时间足够她和丈夫去坐一趟多瑙河邮轮,庆祝结婚10周年。足够庆祝她侄女的8岁生日。也许,还足够听到泰勒·斯威夫特(Taylor Swift)的一张新专辑。

mediamediamediamediamediamedia

。。。//@庄时利和:在喀纳斯的时候见过,这玩意好吃是好吃,但属于是胰岛极限测试了。//@李梁:……

建议全国普及新疆酸奶粽子

相当于:天才不等于上帝。//@宝玉xp:回复@子陵兄:聪明如牛顿,当年在南海公司股票崩盘中亏了约 2万英镑,还留下“能计算天体运动,算不出人类疯狂”这类感慨//@子陵兄:这么强为啥会被黑客传统技巧攻破啊//@宝玉xp:回复@高野白白:确实很强的,这么说吧,Fable 5编程的水平超过我认识的几乎所有程序员,只要不是很离谱的需求(能实现的),不是功能超级多的需求,你能描述清楚的软件它都能给你实现,你用 Claude Design设计好的软件基本上和设计稿不会偏离太多//@高野白白:回复@宝玉xp:是不是夸张了,有那么强嘛,是

Anthropic下架了所有 Claude Fable 5模型的访问,无论是自家还是第三方都用不了

media

反观现在很多标题是没有信息的,只有情绪。

英文媒体 City News Service 在报道“鹅腿阿姨”事件时,标题写得很完整,直接把事情的前因后果说清楚了:一位深受欢迎的街头小吃摊主——人称“鹅腿阿姨”——因被顾客指称卖的是鸭腿而接受调查。

这个标题虽然很短,但信息量很大,包含了人物、状态、起因和核心矛盾,读者一眼就能看懂新闻大意。

作者把“鹅腿阿姨”直译成 “Goose Leg Auntie”,这是很有亚洲语境的一种译法。像“阿姨”“阿婶”这类对非亲属女性长辈的称呼,在亚洲文化里很常见;在新加坡英语里,也常用 auntie 来指保姆、钟点工、夜市摊贩等女性角色,而在英美语境里,auntie 更常指亲属关系中的姑妈、伯母、舅妈等。

文章接着介绍,这位摊主陈秀凤最早因为在北京大学西南门附近摆摊而走红。她现做现卖的鹅腿迅速成了校园热门,学生们常常排队数小时购买。后来,她的生意又扩展到中国人民大学、中国农业大学,甚至进入了北京的 CBD 商圈。

随后争议爆发。陈秀凤在北京 CBD 的销售群里发公告称,自己已经被顾客举报,并承认原材料其实是鸭腿,之后会把情况说清楚。她同时表示,“鹅腿阿姨”这个名字已经用了十多年,并不存在欺诈。这个表态让很多一直以为自己吃的是鹅腿的大学生感到震惊和失望。

mediamediamedia
Podcast 节目 Lenny's Podcast: Product | Career | Growth

成功产品背后的隐藏模式 | Mark Pincus(Zynga 创始人)

整体概括

这期播客的核心,是 Mark Pincus 对“如何做出真正会赢的产品”的一整套方法论总结。他反复强调,产品成功往往不是从“彻底创新”开始,而是从市场里已经被验证的行为、体验和机制出发,再做得更好一点,最后补上一点新东西,也就是他提出的 Proven Better New。对他来说,创始人的任务不是向同行证明自己,而是站在消费者视角定义野心,先找到能跑通的最小切口,再用留存、正反馈和真实使用数据不断迭代。整场对谈里,他把这个框架延伸到社交产品、AI 产品、团队管理和 parenting,始终围绕一个判断:真正重要的不是“我是不是看起来很有野心”,而是“我是不是在做一件用户会长期需要、并且愿意反复回来用的东西”。

主要内容

Mark 先用 Proven Better New 解释自己做产品的底层逻辑:先承认直觉通常是对的,但点子通常是错的;先找 proven,再做 better,最后再加 new。…

白宫对 Anthropic动用出口管制,Fable 5上线三天即被迫下架

美国商务部长 Howard Lutnick上周五向 Anthropic CEO Dario Amodei发出正式信函,宣布对 Fable 5和 Mythos 5两款模型实施出口管制,禁止任何外国公民访问,包括身在美国境内的外国人,甚至 Anthropic自己的非美国籍员工也不例外。

这是美国政府第一次对一款 AI模型动用出口管制。

Anthropic表示,要完全合规,只能把这两款模型对所有用户全部关停。Fable 5从公开发布到被迫下架,只活了三天。

【注:Mythos是 Anthropic今年4月发布的超强模型,因为具备极强的代码漏洞发现能力,Anthropic自己一直将其定位为“网络武器级”,只向少数安全公司开放。Fable 5是本周一(6月9日)推出的 Mythos消费版,本质上就是 Mythos加上一层安全护栏后面向公众开放。逻辑很简单:护栏一旦被突破,公众就等于直接接触到了 Mythos的全部能力。Anthropic旗下的 Claude系列模型(包括最新的 Opus 4.8)不受影响。】

【1】导火索:Amazon的一通电话

转折点在周四晚上。Amazon CEO Andy Jassy联系白宫,提交了一份报告,称其团队成功绕过了 Fable 5的安全护栏,能够访问 Mythos级别的网络安全能力。

【注:Amazon是 Anthropic的最大投资方之一,但这次举报是应白宫此前的反馈请求,而非 Amazon主动出击。不过,一个投资方向政府举报自己被投企业的安全漏洞,这件事本身就很微妙。】

Amazon的发现被转交给了美国国家安全局(NSA),官员们认为他们拿到了“证据”。

media

//@五哥:我晚上骑车,有个小男孩跟了我两圈,每次都找个机会超越我一下下,看我不理他终于忍不住问我,叔叔,你没发现我跟了你两圈了吗?我说我发现了,但我还要骑十圈,大概四十公里,我想看看你能跟多久,他笑了说不行我要回家啦,那明天再一起骑吧,然后飞驰而去,可爱的孩子😊

刚才做抓饭去买大蒜,穿了一个拳击的帽衫,遇到一个小朋友,他问我:

你是拳击手吗

我说,我是拳击手,但很遗憾,我不是一个很厉害的拳击手

他说:没关系,你看起来很厉害

我说:你多大了?也练拳击吗?你的牙怎么了,是练拳击造成的吗?

他说:我7岁,练拳击一年了,我的牙自己掉了(用手摸他的牙豁),不是被打掉的。

真的没想到会被7岁小孩上情绪价值啊😂

我说:很高兴认识你,年轻的拳击手。

然后伸手跟他碰拳

小朋友伸手跟我碰拳:也很高兴认识你,厉害的拳击手。

离谱!一次焊接失误,造价1.2亿美元的乐园,还没开张就烧了

#如何迈过合资电车生死线#【广汽丰田转型第三年:打碎旧模式,还要认得出自己】5月的中国车市,给合资品牌留下的余地更小了。

乘联分会 6月 8日发布的 2026年 5月全国乘用车市场分析显示,当月全国乘用车零售 151.0万辆,同比下降 22.1%,环比增长 9.2%。其中,主流合资品牌零售 31万辆,同比下降 35%。

广汽丰田没有脱离这个压力,尽管新能源品牌铂智系列 5月销售超过 1万辆、同比翻倍,连续 9个月蝉联合资纯电销冠,公司整体销量也达成了合资三连冠,但 5月总销量 5.5万辆,不到比亚迪一家的六分之一。它们像是某种提醒:广汽丰田可以做出一款有市场竞争力的纯电车,但暂时还没有证明这家公司可以靠新能源摆脱合资大盘下行的压力。

像其他不少合资一样,过去两年,广汽丰田也经历了成立以来最密集的一轮调整:拿到车型的产品定义和开发主导权,建立 RCE(Regional Chief Engineer,中国首席工程师)制度,用联合开发的方式连续推出铂智 3X和铂智 7两款纯电车型。

广汽丰田执行副总经理文大力说,广丰目前只是 “拿到了竞争资格”,按公司规划,2024到 2026年是转型期,研发、产品、供应链和渠道的本土化要在这三年完成;2027年之后进入战略反攻期。他说,合资新能源刚有起色,但前面是 “雨季”,淘汰不会停。

近期,《晚点 LatePost》与文大力和两位 RCE叶志辉、柳文斌先后做了交流。三次对话的侧重各不相同,但始终绕不开同一个问题:在新能源时代,广汽丰田要做成一家什么样的公司?铂智系列要如何找准自己的位置?

如文大力所说,这也是广汽丰田转型最难的地方之一:打碎旧模式之后还要认得出自己。http://t.cn/AXaMAvq8

𝘁

#AI

我也发现了这个问题,每次要进行好几轮对话,让他找到真正的根本原因再动手。

有啥好办法?

跟 codex高强度磨合了 1个月,有点不喜欢它的做事方法,它太喜欢防御式编程,并且在向他提出问题修复时,大多数情况都是想着如何治标,而不是从出现问题的原因解决(虽然它总喜欢用“根因”这个词)。

久旱逢甘露,哪哪都好、就是小贵的Seedance2.0视频模型终于要上史低价,而且会在第一时间接入剪映,大家的钱包终于有救了。

已知的信息是,新的模型版本是Seedance2.0 mini,定价会有「大幅降低」,预期能够满足成本敏感的抽卡用户。

在算力紧缺的情况下,单独训练一个小尺寸模型,去覆盖要求没有那么高的使用场景,是行业里的惯例了,比如已经烂大街了的翻译插件,内置的模型不是mini就是lite⋯⋯

目前,Seedance2.0分为Fast、Standard两个型号,其中Fast就是主打性价比需求的,走的是低价路线,但还不够低,是创作端的难言之意。

据我所知,很多短剧和广告公司在用剪映的文字成片、素材生成等能力时,痛感还是比较明显的,要么成本偏高,要么速度太慢,这些反馈,字节当然都是知道的,mini的上线,就是在给市场反馈。

我看了部分测试,基于相同的提示词,Seedance2.0 mini在文本生视频和参考生视频两个类别的表现和Fast型号差距不大。

剪映选择第一时间接入mini,也很符合这款产品的优势,因为它已经是一站式AI创作平台了,不但可以从0到1的生成视频,也能调用模型对已有素材去做AI化的修改和提效。

毕竟剪映实际上覆盖了最多的非标准用户,既有新手小白,还有专业创作者,以及内容生产商,用最便宜的Seedance2.0 mini模型去兜住最基础的需求,顺理成章。

而且,可以看得出来AI创作正在成为一个新的心智入口,只要模型支持「应用尽用」,任何创作念头都能实现「有酒,就有故事」的新模式:

普通人可以一键成片,把相册里的零散素材制作成网感十足的Vlog;

自媒体用参考能力,直接复刻爆款视频的重点要素;

有想法的年轻人,能直接自己做爆款玩法;

以前大家对于剪映的看法,主要还是在「剪」这个编辑动作上,需要预先提供素材才有用武之地,但其实剪映已经有了非常不错的AI基础,尤其是Seedance2.0出现后,剪映在「All In One」这条全栈生产力的路上走得更远了。

「我知道AI很有用,但我的Token不够用」,解决这个公共痛点的方式,依然还是技术的向前踏步,让强大的继续负责强大,让经济的精准满足经济。

最后大胆猜一下价格吧,Seedance2.0 mini可能会是Fast型号的几折?无论如何,适合更广泛人群的最便宜Seedance2.0,总算还是来了。

很高兴成为 WALOVI 的全球品牌代言人!

这个夏天,和我一起哈 WALOVI!

天热?哈 WALOVI!

烧烤?哈 WALOVI!

看球?哈 WALOVI!

哈~哈~哈~哈不够,根本哈不够!

//@Yali_13:i人是e人玩具实录:[苦涩]

被刘嘉玲和梁朝伟这段红毯笑疯了😂😂

#2026上海国际电影节# #梁朝伟小心翼翼地出错#

AI基础设施我理解就3大项带2个小项,算,存,电,散热+互联 。

一提AI基础设施,多数人只想到GPU。其实它是"3大+2小"的完整体系,而且真正值得关注的,是瓶颈在不断往下迁移。

算:最显眼的一层。GPU/ASIC,英伟达的护城河 + 各家自研芯片(TPU、Trainium、MTIA)。但今天算力早已不是"堆FLOPS"那么简单,它越来越被内存和网络卡脖子。

存:隐形的胜负手。HBM是这一轮的关键变量,价值量正从逻辑芯片往存储迁移,这也是存储股(美光、海力士)重估的核心逻辑。"内存墙"决定了:再强的算力,喂不饱也是空转。

电:新的硬约束。算力能扩,电网扩不动。电力正在成为AI产业的"隐形税",谁拿到稳定、廉价、可扩张的电,谁就掌握了行业天花板。核电、自备电厂、并网排队……竞争已经从芯片打到了变电站。

散热(小项):功率密度上来了,风冷扛不住,液冷(冷板→浸没)从选配变刚需。这层不性感,却卡着机柜密度。

互联(小项):The network is the computer。Scale-up(NVLink)+ Scale-out(InfiniBand/以太网),带宽正在取代算力成为新瓶颈,光互联(CPO)是新战场。

别去挤洛博了,洛阳这三家馆人少很多!

洛博一直人很多,特别是暑期,参观体验不太好,现在又即将迎来以年为单位的一次大升级。其实洛阳好博物馆很多,完全不必全去挤洛博,我这次参观的三家博物馆人比洛博少许多,甚至轻松做到无人,非常值得一看哦。

(这里就不推荐古墓博物馆了,现在也是很热门的馆了!)

1.二里头夏都遗址博物馆这家馆是最远的,在偃师。二里头19年新馆开放之后我是第一次来,馆里和其他遗址博物馆一样有文物不足的问题,但这个也是客观存在的问题(二里头的大批东西还在北京呢),也没办法,洛阳能调拨来这里的东西都过来了。

值得一看的、出土于二里头原来在洛博的东西都回来了,不容错过的洛阳本地唯一一块绿松石牌饰,“中华第一爵”都回来了,还有禁止出境的七孔玉刀也不要错过。

展馆还有一整个切割未经处理的一级大墓,还有一件同样精细的绿松石器。

总之如果这几件重要文物没见过,二里头完全值得单独跑一趟,毕竟文物重要程度在这里摆着。

同时可以刷掉偃师博物馆,这里更远一点,馆里的碑刻石雕也可以看很久,这俩地方打车20分钟。

2.汉魏洛阳城遗址博物馆这里从二里头打车15分钟也可以去,但是和偃师博物馆完全相反。

这家博物馆是去年新开的,去之前完全没有任何预期,谁知道是大大的惊喜,有不少近年新出土的考古所的文物在这里展览(比如这件2023年薪出土的粟特石棺床),看展过程一直在哇…

非常的精彩,一共四个展厅,三个通史,一个精品厅。

以上两个博物馆是基本没啥人的,特别是洛阳城,从头到尾就三三两两的人,不要太爽了。

这里有个路线推荐,1)可以把白马寺+洛阳城+永宁寺遗址拼在一天,因为白马寺从城里去好去,且白马寺有摆渡车去汉魏洛阳城遗址博物馆。

mediamediamediamediamediamedia

【 #姑娘称男友送的9万多LV包有色差# 全国只有2只?】张女士从江苏到杭州旅游,她说逛到湖滨银泰IN77的LV店时,男友在店员的推荐下,花了94500元给她买了一只鸵鸟皮的包。回到酒店后,她开心地拍视频和朋友分享,拍着拍着,笑容凝固了...... #姑娘称全国只有两只的LV包在各地出现#

E

SpaceX 总裁 Gwynne Shotwell 昨天在 CNBC 上谈到 Elon Musk:

“我觉得他在各个方面都非常容易被误解。我希望大家了解他。事实上,过去几周我们与投资者进行的一些讨论中,他也参与了其中。

投资者离开后说:‘我根本不知道他是那样的人。’

我说:‘那就是我共事了 24 年的人。我爱他。’

Gwynne 于 2002 年加入 SpaceX,是公司的第 11 名员工。她太棒了。真是一段精彩的旅程。

E

我计算了 Tesla FSD 的反应时间

E

科学不是一种流程、不是一种资质,也不是一种机构。

它是对真理毫不退让的追求,由少数人践行,却被多数人借用。

E

大约 5 年前,Elon 正在带 @Erdayastronaut 参观 Starbase 发射台。现场一名工人走上前,抱了抱他,说:“我们一定能成功。”

他现在大概已经是百万富翁了。

E

他们会的。

工党必须尽快下台。

E

他捅人了吗?

极右翼活动人士汤米·罗宾逊因反恐立法被拘留 https://ft.trib.al/74FBIzF

和当年讨论“可回收”差不多?

红杉资本合伙人Shaun Maguire就SpaceX上市话题接受完整专访。

“轨道算力的推理计算成本,至少会比大型地面算力低三倍。纵观所有大宗商品行业规律,成本优势领先者终将占据绝对主导地位。”

本次访谈要点:

1. 公司发展前景,以及为何普通投资者或许比华尔街更能看懂这家企业。

2. Starship项目:其技术风险远低于外界认知。

3. 轨道算力已成必然趋势。

4. 热工程方面的先天优势。

5. 观点:具备实质竞争力的航天发射对手,至少十年内不会出现。

6. Starlink与手机直连业务,将助力SpaceX成为全球成本最低的宽带及移动通信服务商。

#SpaceX市值破20000亿美元##spacex暴涨##spacex正式上市#

//@蚁工厂:好//@摇摆时间线ZHLMI:呕吼[笑而不语]//@德拉贡就是龙:转发微博

英译汉翻译润色(en-zh-translation-polish)

多年前读过叶子南的《高级英汉翻译理论与实践》,今天又翻出来翻了翻,于是想到可以把它蒸馏成一个 skill,便配合 cangjie-skill 和 Claude Code 跑出了一个初版。

工作流:先按文本的软硬程度确定翻译策略,再拆解形合、去掉翻译腔、调整音韵节奏,最后产出地道中文和逐段英中对照(如果只想输出中文,调用时需要明确说明)。

例如:

他的收入下降改变了他的生活方式。机翻:他收入的减少改变了他的生活方式。润色后:他收入减少,生活方式也跟着变了。

欢迎试用:

http://t.cn/AXaVNaL5

mediamedia

#模型时代# Apple、xAI模型训练的不好,原因之一可能是保密工作做的太好。

𝘁

飞机睡觉支撑哪种好?

mediamedia

我的精神状态不太好了

🇶🇦 负 🇨🇭 不同意的可以去测测精神状态

🇧🇷 让1球胜 🇲🇦 巴西太久没出成绩了,会攻得很凶

🇭🇹 负 🏴󠁧󠁢󠁳󠁣󠁴󠁿 菜鸡互啄,海地就是来旅游的

🇦🇺 平 🇹🇷 来把大的,相信铁桶阵

反复欣赏很久,哼哼,确定这是一份智慧与美貌并存的方案,在正确的路上继续胜利,真不好意思呢。

(千问竟然预测摩洛哥会掀翻巴西,明天我要好好嘲笑这个AI……

#世界杯大v说##ai观战世界杯#

media
𝘁

牛逼引用原帖:

全新打造了简洁的 Snell Panel,支持 Snell v6的一键安装和统一管理,输出订阅链接。支持 Serverless部署在 Cloudflare Workers。

mediamedia
附带文章:外文资料:github.com
这条附带资料是外文长内容,日报卡片保留原文入口;如需完整译文,应先生成 baoyu 翻译产物。
打开附带文章

当年 GPT 3.5的时候,很多人在提示词里面让它把自己当成 GPT-4,号称性能就更好,你现在信吗?

这是prompt engineering 101。

Fable 5的真正实力来自Mythos-class底层权重,海量新训练数据,外加复杂agent架构,不是prompt copy就能继承的。

泄露prompt与老模型顶多cosplay出味道像的lite版,性能差距巨大。连轻量版都算不上。

真Fable 5在长时程复杂分析、工具链、自验证这些硬核任务上直接甩老模型几条街。

目前还是希望多一些scaling law训练创新和实打实的benchmark。

mediamedia

模型是根本,Harness层相对好补齐,但Harness这层不需要太多垂直领域的,Claude Design很快就会合并到 Claude Desktop,Codex在下一代或者几代模型能力够了后,会在 Codex App直接以 Plugin集成 Codex Design引用原帖:

@dotey模型能力与Harness是相辅相成的。

宝玉这篇对这两个的解释太通透了。另外,宝玉怎么看开源的Open Design之类的?如果他用上了Claude Code的模型,是否也能达到类似的工程能力呢?

精细调整字型字号颜色,确实是设计师的日常。但我觉得用 AI Agent辅助设计之后,修改的方式也得跟着变:

1、设计系统要用起来

为什么需要手动精调字型字号、颜色?很多时候是因为没有统一的设计系统做规范。如果有配套的设计系统,按钮圆角、字号、间距都有严格定义,生成时不会出现 3px、5px这种随意值。就算偶尔有偏差,让 Agent遵循设计系统去修改就行,极少需要人工微调。

2、设计师变成设计经理

不再亲自调像素,而是用文字指令指挥 Agent去改。Opus 4.8+ 结合设计系统,基本做到"言出法随",不太会偏出你的要求。

3、方向和验收还是人的活

虽然执行交给了 Agent,但大方向还是人来把关,告诉 Agent该怎么调整,调完检查结果是否符合预期。Agent干活,人做判断。

mediamedia

@FanVancoo @dotey你说的对。绝大部分时候设计师还是需要对字型字号,图形颜色做精确调整的。不是什么都适合用claude design码字描述

网站 周榜 Product Hunt Weekly

Product Hunt Weekly 2026-W23

2026-06-01 至 2026-06-07 17 个产品 12 个 AI 相关
#1
做什么

AI 募资代理,帮你寻找投资人并安排会面。

团队

团队成员共 18 人,详见原始页面

解决的问题

创始人在融资时,常常需要反复筛选投资人、判断是否在积极出手,并手动跟进沟通,效率很低。

形式

开发者工具 / API

标签

Venture Capital、Artificial Intelligence、Fundraising

#2
做什么

产品自述:The email warmup tool, upgraded for deliverability.

团队

团队成员详见原始页面

解决的问题

Product Hunt 页面没有明确问题陈述;可先参考产品自述和官网。

形式

网页应用

标签

Email、Email Marketing

#3
做什么

产品自述:Your GTM: from diagnosis to execution

团队

团队成员共 12 人,详见原始页面

解决的问题

Product Hunt 页面没有明确问题陈述;可先参考产品自述和官网。

形式

网页应用

标签

Sales、Marketing

给 Agent交代任务的时候一定说清楚怎么验证,然后就怎么需要管中间结果了引用原帖:

有什么与 AI Agent交互的习惯,你一旦开始后就再也回不去的?

我先来一个 —— 先让 Agent把 coding plan写出来,反复确认后,汇总一个 task列表,最后再编程,同时把 task标记已完成

举一个具体的用 Claude Design更新设计和代码的例子

我有一个视频字幕编辑器工具,是 Claude Design做的设计,之前标题文字和下面的信息是放在一行,标题一长就放不下,于是我就让它变成两行。

图1是我在设计稿上做的修改,修改好了后导出下载 zip文件,放到项目中,用 git diff很容易看到做了哪些变更(图2)

然后一句简单的提示给 Claude Code:

> 参考设计稿 design 目录下的相关变更,对 UI 进行变更

Claude自己通过 git diff去分析变更,然后找出所有设计稿修改了的位置,自己帮我修改了相应的 Swift代码,任务完成!(图4是修改后的效果)

全程我主要是在 Claude Design上修改,然后需要手工去同步一下。

mediamediamediamedia

为啥 Codex还不推出类似 Codex Design的产品?

Anthropic最近推出了 Claude Design,是我除了编程之外用得最多的 Agent,也推荐过很多次。效果真的好:你用一句话描述想要的 App,它直接给你生成一个可交互的原型,点哪哪都有反应,不仔细看还以为在操作真实的 App。

有网友问:为啥 Codex还不推出类似 Codex Design的产品?

简单来说,GPT-5.5的模型能力还做不好这件事。但要解释清楚为什么,得先理解一个关键区分。

【1】Agent的两层:模型和 Harness

很多人把 Codex、Claude Design和 GPT-5.5、Claude Opus 4.8混在一起说,其实它们是完全不同的两层。

Claude Design和 Codex是"产品层",业界叫 Harness,包括提示词、工具链、UI交互流程这些工程层面的东西。Claude Opus 4.8和 GPT-5.5是"模型层",是真正干活的大脑。

打个比方:Harness是厨房,里面有锅碗瓢盆(工具)和菜谱(Skills),模型是厨师。同一套厨房,换个厨师,做出来的菜完全不一样。

理解了这个区分,后面的事情就好说了。

【2】Harness不是门槛

Claude Design的 Harness层技术上不复杂。花点心思逆向一下,提示词、工具代码几乎都可以拿到。我已经做过了,成果在 baoyu-design(),可以借助 Skill把 Claude Design在其他模型上运行。工程上没秘密。

真正拉开差距的是背后的模型。

【3】高精度可交互原型,难在模型

media
附带文章:外文资料:github.com
这条附带资料是外文长内容,日报卡片保留原文入口;如需完整译文,应先生成 baoyu 翻译产物。
打开附带文章

就看它的业务是加法关系,还是乘法关系。//@成一虫:它几个业务:星链值两三千亿美元、X(推特)值三四百亿美元、AI业务参考OPENAI与ANTHROPIC大约值2000-5000亿美元,火箭发射值1000-3000亿美元,余下全是太空算力、太空挖矿的饼。未来几个月暴跌三四成,不奇怪。

【IPO打破多项纪录 #SpaceX已大而不能倒#】#马斯克说金钱终将失去意义#,但他是万亿富豪。美国太空探索技术公司SpaceX12日完成史上最大IPO,其创始人马斯克成为全球首位“万亿美元富豪”。未来一段时间,将有多家重磅科技公司计划上市,竞争将更加激烈。彭博亿万富豪指数显示,截至12日,马斯克的个人财富达到1.11万亿美元,以绝对优势排名世界第一;排名第二的谷歌联合创始人拉里·佩奇身价刚刚超过3000亿美元——事实上,马斯克的财富比排名第二到第五的四位超级富豪财富之和还要多。目前,SpaceX的业务涵盖航天发射、卫星互联网和人工智能等领域;其中,星链业务收入占到公司总收入的近七成。CNBC电视台指出,SpaceX已经不是传统的科技企业:一旦SpaceX停摆,美国政府将陷入棘手困境。#中国不需要也不可能复制SpaceX#

//@蚁工厂:第一编程,第二角色扮演🐶 话说deepseek好像蛮重视这方面的,也有蛮多这方面的用户

#HOW I AI# OpenRouter上token用量排名第一的领域你应该能猜到,但排名第二的领域可能猜不到🐶

S

我的 Transformer 是加拿大的,我的芯片是台湾的,Dario 的 De’Aaron Fox,OpenAI 的(GPT)6

media
D

情况已检测到:里约热内卢市已经对一个模型进行了后训练。

基于 Qwen 7/2,Rio 3.5 Open 397B 在基础 Qwen 模型之上加入了 SwiReasoning 机制——这是一个框架,会根据基于熵的置信信号,在标准思维链和潜空间推理之间动态切换,因此模型只有在需要时才会“开口思考”,否则就在隐藏空间中静默推理,从而提升 token 效率。

media

🇶🇦 负 🇨🇭 不同意的可以去测测精神状态

🇧🇷 让1球胜 🇲🇦 巴西太久没出成绩了,会攻得很凶

🇭🇹 负 🏴󠁧󠁢󠁳󠁣󠁴󠁿 菜鸡互啄,海地就是来旅游的

🇦🇺 平 🇹🇷 来把大的,相信铁桶阵

反复欣赏很久,哼哼,确定这是一份智慧与美貌并存的方案,在正确的路上继续胜利,真不好意思呢。

(千问竟然预测摩洛哥会掀翻巴西,明天我要好好嘲笑这个AI……

#世界杯大v说##ai观战世界杯#

media
S

情况已发现:里约热内卢市对一个模型进行了后训练。

基于 Qwen 7/2,Rio 3.5 Open 397B 在基础 Qwen 模型之上加入了 SwiReasoning——一种框架,它会借助基于熵的置信信号,在标准思维链和潜空间推理之间动态切换,因此模型只会在需要时“说出自己的思考过程”,其余时候则在隐藏空间里静默推理,以获得更高的 token 效率。

media
D

我的 Transformer 是加拿大的,我的芯片是台湾的,Dario 的 De’Aaron Fox,OpenAI 的(GPT)6

media
G

和这么多老朋友一起度过这一天,真的很开心。

离开 Starbase 总是有点难舍。

一路披荆斩棘,所以有时更要好好庆祝一下。

非常感谢 SpaceX 的每一位,帮助把未来变得如此精彩。

期待下一次 Starship 发射!迈向星辰!

mediamediamediamedia

#拼好票的秘密#【晚点视频|#揭秘廉航套路#:“拼好票”的秘密】

飞机燃油价格大涨,多数航空公司只能亏钱硬扛,为什么春秋航空还有得赚?#热点解读#

S
media

我已经和政府内外的很多人就 Anthropic 当前的情况进行了多次交流,以下是我认为属实的内容:

- 正如我们所知,Anthropic 本周早些时候以商业名称 Fable 公开发布了其 Mythos 系列模型。

- Fable 是加入了护栏(guardrails)的 Mythos。但如果这些护栏失效,你就把 Mythos 及其先进的网络能力暴露给了不该拥有这些能力的人。要记住,Anthropic 自己曾广泛宣传 Mythos 是一种网络武器,并且需要像武器一样受到监管。他们曾请求政府对 Mythos 实施监管,并力推 Fable 上的护栏。如果存在漏洞,无论大小,修补它都是 Anthropic 的责任。

- 一位同时受 Anthropic 和美国政府信任、且极为可信的合作方在测试 Fable 时,指出了这些护栏的一个越狱(jailbreak)方法。政府要求 Dario 修复这个越狱问题,或者下架该模型。Dario 拒绝了。

- 在他们的博客文章里,Anthropic 为自己的决定辩护,称这个越狱并不严重。可信合作方和美国政府并不这么认为;而且,作为一家 AI 安全公司,Anthropic 也不该用这种淡化问题的措辞。很难想象,他们怎么能声称,一个允许网络武器可被实际操作的越狱手法,竟然不算“严重”。

- 过去,Anthropic 一直说安全必须是最高优先级,并且必须被极其认真地对待。可这一次,Anthropic 把继续提供面向消费者的模型放在了安全之上。

- 作为回应,政府实施了出口管制。政府这样做是不得已的。他们非常意外,Anthropic 竟然不愿配合一个合理的安全要求(也就是修复这个越狱问题)。Anthropic 的反应与他们作为安全 AI 研究社区的品牌和理念非常不符。

首先这个 Skill很好,另外提供一个额外选择:可以试试用 Claude Design生成一份简历试试,也许你会喜欢引用原帖:

假如你的朋友最近需要更新简历,一定要把 Kami推荐给他,我单独细致优化了一个版本,单独让 Kami写简历变得非常好用好看清晰,让他把他的原生素材 md准备好,然后对着 AI说 /kami帮我产出一个简历,然后调1-2下差不多就好了。

media
附带文章:外文资料:github.com
这条附带资料是外文长内容,日报卡片保留原文入口;如需完整译文,应先生成 baoyu 翻译产物。
打开附带文章

6月13日 | 手术日🏥

一大早,石冰教授和李盛副教授@李盛医生就到病房查房,同时给三位专程赶来的孩子面诊,逐一制定了治疗方案。

这次活动中有位爸爸是冲着石教授来的,“我就是赌他会来,不来的话我也要专门带着孩子跑过去找他。”感谢石教授团队每次都带着过硬的技术奔赴而来,不只为孩子们完成高质量的手术,还手把手带教当地一线医生,逐步提升区域诊疗水平,让更多家庭不用再长途奔波求医。

病房里的三个小宝宝不哭不闹,倒是家长们的紧张藏不住——孩子人生里第一次手术,小家伙们还不懂忐忑,做父母的总归放不下心。

今日全天手术已由石冰教授、李盛副教授和董斌医生顺利完成,孩子们一切安好。所有医护与工作人员,辛苦了❤️@微公益 #奇遇公益##遇见改变#

mediamediamediamedia

//@裴喜龙:我至少讲了两次 vue尤雨溪的事,讲了(Blender这样的工具)建模与渲染Render的关系,人的视网膜是平面的,但能感知出3维的世界,而这是 Windows这样的图形系统的本质。计算机并不是在处理现实世界,而是在处理现实世界的模型(Model)。人机交互的发展史,本质上是在不断缩短“人的意图”与“系统内部模型”之间的距离。如果人的大脑本身就在对世界进行建模和渲染,那么下一代交互系统应该如何直接与人的世界模型对接,而不仅仅是与按钮、窗口和菜单对接。

我这学期给同济大学创意学院本科生上课时,用力讲了几次,LLM加持下,人机交互技术会有本质上的变化,无论是人机交互方式(不一定是 VR那种),还是支持交互的技术(不只是图形系统技术)。人机交互这个方向,对于有工程化的艺术技术训练,又学了一些计算机技术的同学,是可能出大的成果的。

不知道我的苦心,能不能结点果子出来。为国育材,我之所愿!

Codex操作浏览器有两种模式,一种是 Chrome插件,一种是内置浏览器。用了一段时间之后,我总结一下两者的差异和各自适合的场景。

【1】先说一个被低估的用法:拿 Codex当爬虫

传统爬虫用 requests或者 Playwright无头模式去请求页面,现在风控越来越严,指纹检测、行为分析、验证码轮番上阵,很多网站一看你是程序化请求直接拦截。Codex的浏览器不一样,它操作的是真实浏览器,有完整的渲染引擎、真实的用户代理、正常的 JavaScript执行环境,在网站看来就是一个普通用户在浏览页面。

配合 /goal模式,你设定一个目标(比如“把这个网站上所有产品的名称、价格、评分抓下来存成 CSV”),Codex会自己规划步骤、翻页、处理异常,不需要你一步步指挥。这比自己写爬虫脚本省事得多。

但 Codex有两种浏览器模式,特性完全不同,选对了事半功倍。

【2】Chrome插件模式:能力强,但吃资源

用 @Chrome调用的 Chrome插件模式,核心优势是一个字:登录态共享。

它直接运行在你自己的 Chrome浏览器里,继承你所有的 Cookie、登录会话、已安装的扩展。那些需要登录才能访问的内容,比如付费订阅的文章、企业内部的管理后台、CRM系统里的客户数据、需要登录的社交平台,Chrome插件都能直接访问,因为对网站来说,就是你本人在操作浏览器。

Codex在 Chrome里工作时会把任务放进独立的标签页分组,不会打断你正在看的页面。它还支持 DevTools协议,能抓性能数据、看网络请求、调试 Console错误。

但代价也很明显:资源消耗相当大。Chrome本身就是内存大户,每个标签页都是独立进程。Codex的 Chrome插件在上面再加一层操控逻辑,截图、DOM解析、指令交互全在跑,内存和 CPU占用会非常高。机器配置不行的话(比如 8G内存的笔记本),跑起来能明显感觉到卡顿,拿来做批量爬虫任务就更难受了。长时间运行还容易出现截图延迟、状态不同步的问题。

media

🤔

media
D

第 0 天警报:@MiniMax_AI 的 M3 现已上线 HuggingFace,并已加入 InferenceX。M3 架构约有 428B 参数,其中约 23B 为激活参数。得益于 @inferact 的 10x 工程师团队,M3 在 @NVIDIAAI B300 Blackwell Ultra 上已经在第 0 天展现出相当不错的优化性能 @vllm_project!此外,Inferact 还发布了他们的 EAGLE3 头部,带来了更强的性能。

期待第 1 天、第 2 天和第 3 天的表现,团队也在抓紧对 InferenceX 上第 0 天的 MI355X 性能进行基准测试。

media
A

负责任的 AI 在实践中是什么样子?

在《Advanced Insights》第 3 集中,Mark Papermaster 将与哈佛教授、Revive 的 AI 负责人 Kathy Pham 一同探讨 AI 的机遇、挑战及其现实影响。

完整一集即将上线,敬请期待。

S

第 0 天警报:@MiniMax_AI 的 M3 现已上线 HuggingFace,并已加入 InferenceX。M3 架构约有 4280 亿参数,其中约 230 亿参数会被激活。得益于 @inferact 的 10 倍工程师团队,M3 在第 0 天就已经在 @NVIDIAAI B300 Blackwell Ultra 上交出了相当不错的优化表现!此外,Inferact 还发布了他们的 EAGLE3 头部模块,带来了更高的性能。

我们也期待第 1 天、第 2 天和第 3 天的表现,团队还在加紧对 InferenceX 上的第 0 天 MI355X 性能做基准测试。

media

那边5.0下架了,这边5.2上架了

致开发者:GLM-5.2全量开放,前沿智能属于所有人今天,一些前沿模型的突发禁用令人遗憾。在这样一个前沿模型因非技术原因被突然切断访问的时刻,我们更加坚信:科学应该是全球化的。

通向 AGI(通用人工智能)的道路绝不应被高墙封闭。我们一直觉得,AGI应当是全人类共同探索智能边界、解决复杂挑战的基石,而不是被少数规则垄断、随时可以被收回的特权。面对外部的封锁与限制,我们的态度是极度开放。前沿智能必须保持开源、可用、可构建,并服务于每一位脚踏实地的开发者。

GLM-5.2是智谱迄今能力最强的开源模型。它不仅支持真正可用的 1M上下文,更在长程任务(Long-horizon Tasks)的独立完成度上持续保持领先,为构建复杂的 Agent智能体应用提供坚实的底层支撑。它也依旧是我们打造最强国产 Coding模型的主力。

今晚 5:21——在这个特殊的时刻——GLM-5.2将面向 GLM Coding Plan全量用户(包括 Lite / Pro / Max / 团队版)正式开放。API也即将在下周上线。同时下周将全面开源,遵循MIT协议。

向人人都可触及的前沿智能更进一步。AI的未来是开放的,它属于人民。ModelKey:GLM-5.2 http://t.cn/AXa53AFD

小孩子才做选择,成年人全都要引用原帖:

现在你选 Claude Code还是 Codex?