Skip to content

Vol.001:有点怪、有点暖、有点深

做 flomo 的这五年,有一个问题始终萦绕在我们心头:我到底该记录什么?

没有方向,再好的工具也只是原地打转; 但这样一个关键问题,却没有统一答案。

这份「小信号」双周刊,是我们尝试给出的一种解答,无关功能,而在于能给彼此一些启发。 它不是新闻,也不是知识搬运,而是我们亲自筛选的三种信号: 一些人、一些概念、一些能让你轻盈出发的力量。

不说教,不灌输,不制造焦虑。 只想陪你在记录中,慢慢构建那个更清晰的自己。

在每一期里,你都会收到这三个信号:

  • #人物:每个人都会迷茫。我们记录那些曾启发我们的人,以及他们生命中的关键年岁。愿你在相似的时刻,知道自己并不晚。
  • #新知:每个人都在成长。我们分享真正值得记录的新概念与实践,帮你更清晰地理解世界,也理解自己。
  • #心力:每个人都会脆弱。我们分享能安顿内心的片段与感悟,愿你在混乱中找到方向与平静。

它们简短,却都经过挑选。希望能在你心里留下些微小的痕迹。信号发出,也希望能接受到来自你的回应。

你可以这样回应每期的小信号,在 flomo 中:

  • 尝试用自己的语言,把看到的内容重新说一遍,是理解也是再创作;
  • 补充自己曾读到、经历过、或想到的类似内容,建立更多关联;
  • 提出一个问题,记录下它引发的联想或思考,是一种深入的方式;
  • 也可以写下当下的感受:为什么这一句话、这个概念、这个人,会在这个时刻打动你。

这些卡片,不必完整、不必标准,重要的是,与你有关。

你可以在微信公众号评论区分享你记录的 flomo 卡片,为同路人带来更多视角,让知识在彼此之间相互流动。

每期小信号会先从这个公众号发出,在下次信号发出之前,我们会接受来自你的 flomo 卡片。

我们会精选收录一部分,和发出的这篇小信号一起汇总到 flomo 官网的新栏目,最终,通过 flomo 的消息推送给更多的 flomo 记录者。

持续不断记录,意义自然浮现。

TIP

🎯 #人物:每个人都会迷茫。记录那些曾启发我们的人,以及他们生命中的关键年岁。愿你在迷茫时,知道自己并不孤单。

#人物/Richard_Sutton | 失败不是终点,而是调整方向的信号


图片来源:http://www.incompleteideas.net/sutton-head12.jpg

强化学习之父、癌症幸存者,他告诉我们:解决复杂问题的方式,往往不是设计出精巧方案,而是从一个简单起点开始,不断学习、不断迭代。

简介

  • 1957 年:出生在美国俄亥俄州,童年时期多次搬家,频繁搬家的经历可能影响了他后来移居加拿大的决定
  • 1971 年:高中时迷上哲学与科学,尤其对「意识从何而来」着迷
  • 1975 年:接触编程(Fortran),却因计算机无法自主思考而失望
  • 1978 年:在斯坦福学心理学,参与机器人编程,逐渐被「机器如何学习」吸引
  • 1984 年:在麻省理工读博,开创强化学习体系,提出时间差分学习(TD Learning),后来被用在 AlphaGo 上
  • 2003 年:确诊黑色素瘤(死亡率极高),经历多次复发,癌症也促使他移居加拿大阿尔伯塔
  • 2005 年:停止了所有黑色素瘤相关治疗
  • 2015 年:成为加拿大公民
  • 2017 年:未见肿瘤复发,他在采访中表示:「看来我活下来了」,同年放弃了美国公民身份
  • 2025 年:与 Andrew Barto 一起获得图灵奖

苦涩的教训:

我们有时会好奇,那些站在智能前沿的人是如何思考的?他们的思维方式能否给迷茫的我们带来启发?

今天想聊聊 Richard Sutton,被誉为「强化学习之父」的他,有一个观点被广为流传,叫做「苦涩的教训 (The Bitter Lesson)」。了解它,或许能给我们提供一个对抗复杂问题的有力思维工具。

Sutton 观察到的「苦涩教训」是什么?
简单来说,在人工智能研究中,那些试图将人类的知识、规则和理解硬编码进系统的「精巧」方法,长远来看,几乎总是输给那些更「笨」、更通用、但能受益于大规模计算能力的方法(比如基于海量搜索和持续学习的方法)。

就像他打的比方,早期下棋的 AI 依赖人类棋谱和经验,但最终被 AlphaGo 这样依靠「暴力」算力自我对弈学习的 AI 超越。人类的「智慧」在「简单方法 + 海量算力/数据」面前,显得有些「苦涩」。

Sutton 的洞察,不仅仅适用于 AI 研究,对我们处理复杂问题同样有启发:

  1. 拥抱通用方法 + 持续学习: 当面对一个极其复杂、规则繁多的问题时,与其试图一开始就设计出完美的、包含所有特例的「精巧方案」,不如找到一个相对简单的、通用的核心方法,然后投入资源(时间、精力、试错)让它通过实践和反馈持续学习、自我迭代优化。就像 AI 从经验中学习一样。
  2. 相信「规模」的力量(广义上的): 这里的「规模」不一定是算力,也可以是足够多的尝试次数、足够广的数据输入、足够长的时间投入。很多时候,问题的解决不是靠一两个「天才」的灵光一闪,而是靠在正确的方向上进行足够量的、基于反馈的迭代。
  3. 警惕「人类知识」的诅咒: 我们过往的经验和知识非常宝贵,但也可能成为限制。在快速变化或全新的领域,过度依赖过去的成功模式或「想当然」的规则,可能会阻碍我们发现更底层、更简单有效的规律。保持开放,允许「笨」方法通过学习和规模化展现力量

正如 Sutton 在经历癌症后所说:「失败不是终点,而是调整方向的信号」。这种从经验中学习、在试错中前进的思维方式,或许正是他希望传递给我们的、超越技术本身的智慧。

当我们感到迷茫或被复杂性困扰时,不妨问问自己:我是不是过于追求「精巧」而忽略了「简单+迭代」的力量?我是否给了「学习」和「规模」足够的机会?

参考

TIP

🎯 #新知:每个人都会成长。我们分享新学到的知识与实践,和你一起成为更好的自己。

#新知/压缩 | 作为一种处理复杂的武器


发明是一个人为的事情,你可以选择使用或者不使用; 而发现是一个现象,一旦发现了就无法无视它的存在。 AI 更像是是韦伯望远镜的图像处理管道,它是一种探索和发现的工具,而不仅仅是提高效率的引擎。 因为其更擅长帮助我们理解或者解释已经存在的信息,而不是创造新的实体。 下面就是在研究一些课题时,AI 带来的新的学习范式。

Richard Sutton 的文章 《苦涩的教训》 告诉我们的教训之一:搜索和学习是人工智能研究中两种最重要技术。 于是让 AI 推荐了搜索和学习这 2 个范畴中最重要的论文。

搜索方向

  • 2006 《基于多臂赌博机的蒙特卡洛规划》
  • 2016 《基于深度神经网络与树搜索的围棋博弈研究》
  • 2017 《通过自我对弈掌握国际象棋和将棋的通用强化学习算法》

学习方向

  • 2012 《基于深度卷积神经网络 CNN 的 ImageNet 数据集分类》
  • 2015 《用于图像识别的深度残差学习》
  • 2017 《注意力就是你需要的一切》

显然,阅读论文对于普通人来说,总是显得那么遥不可及。 但有了 AI 在于,我们可以让其不断把内核压缩,提炼,直到和我们已有的知识网络对接。 而这在之前,只有请教非常专业的人,才能得到类似的效果。 比如第一篇文章,压缩之后得到的一个小故事,大家应该就都能理解了:

假设你面前有 10 台自动售货机,每台卖不同口味的饮料(但口味未知)。 你只有 50 元,想找到最好喝的那款。 传统方法是随机试喝,但可能浪费钱在难喝的饮料上。 这篇论文提出的方法会这样做:

1. 先广撒网:前 5 元随机试 3 台机器
2. 再聚焦:发现 2 号机饮料评分最高后,后续 45 元中 80% 投 2 号机,20% 继续试其他机器
3. 动态调整:若某次试喝发现 5 号机更好,立即增加 5 号机的投入比例

这种自适应搜索策略后来成为强化学习的核心组件,直接影响 AlphaGo 的树搜索设计。

它就像在迷宫中一边探索未知路线,一边利用已知信息快速找到出口。

你看,用「思维漏斗」过滤信息熵,是人类对抗复杂性的必然选择。 学习这些论文背后的常识,将复杂问题逐步压缩分解到你可控的水平。 然后再用自己的话记录,在大脑中「刮」一道,和自己的知识网络建立更深入的联系。

当然,在一遍又一遍压缩上述论文的核心之后, 其实最终也得到了一个反常识的常识,一条复杂问题的简单规则

  1. 🧩 拆解:将大问题分解为互不重叠的块状,每个子问题独立可解
  2. 🎯 聚焦:帕累托法则,20/80 聚焦,只关注影响 80% 结果的 20% 关键因素
  3. ✂️ 本质:奥卡姆剃刀原则,最简单的解释往往最接近真相,最简单的关键点往往最有效

因为人类受限于工作记忆 7±2 规则(约束),必须将 O(n!)量级可能性(决策),压缩为可操作步骤(限时)。
O(n), 计算机学术语,指数量和系统大小 n 成正比;
所以面对人生的复杂问题,别怕,尊重常识就行。

参考

TIP

🎯 #心力:每个人都会脆弱。我们分享能安顿身心的片段与感悟,愿你在混乱中找到平静。

#心力/怪人 | 鼓励怪人,打击混蛋


格格不入,不拘礼节,害怕社交,厌恶繁文缛节。 是不是有些时候,会觉得自己是个怪人? 但又碍于各种社会规则,不得不每天扮演一位精神正常的普通人。

你不是一个人。 新加坡作家、思想者与社群建设者 Visakan Veerasamy 也和你有一样的困惑。 他在《鼓励怪人,规劝混蛋(Encourage weirdos, discourage assholes)》一文中阐述了他的困惑和看法, 希望看完之后,你不再觉得孤独和另类。

怪人,到底是什么人呢?

在英文中,Weird 原意并不是女巫,而是「掌控命运的人」
如果从现在回头看历史,隐约会觉得当年被称之为女巫的人,
或许仅仅是一群按照自己想要的生活方式的独立女性。
而这种独立,恰恰让其他人感到害怕、生气和不安,以至于才有了后续的种种传闻。

所以怪人(weird)等于异常(abnormal)或者奇怪(strange),这个观念是近代才有的。
但也是这些「怪人」,创造了我们今天习以为常的一切:艺术、娱乐、技术,几乎所有有趣的东西。
想想乔布斯重塑苹果精神的那条「Think different」的广告吧,里面又有多少不是「怪人」呢?

图片来源:https://medium.com/ad-discovery-and-creativity-lab/think-different-b566c2e6117f

所以,怪 ≠ 好/坏,怪仅仅是一种属性,不是道德评判。
就像普通人一样可以有好坏之分,怪,也可以是好的怪,也可以是混蛋的怪。
吊诡的是,我们能迅速识别出来哪些人(或者行为)是怪的,
但却对那些日常普通人的混蛋行为(比如家庭暴力、歧视、谎言等)习以为常。

世界对「正常」的执念,有时令人窒息。
而太多人为了融入而压抑自我,反倒把真正的「怪」看成了错。
你不觉得,常人对彼此的迷恋和模仿,才是真正奇怪的事?
请记住,怪异不是问题,混蛋才是。

无论你是「怪人」还是普通人,最重要的是彼此理解,
不是让某一方去适应另一方,而是彼此靠近,共同生长。
这样,世界才能容纳更多「好的怪人」。因为他们,是灵感的源泉,是创造的火种。就像达 · 芬奇那样。
做个好怪人,别当混蛋。人间值得,也需要这样的你。

参考


封面图片:A map of the Arno west of Florence,Leonardo da Vinci 1504
本文由 flomo 周刊编辑部编撰,AI 提供辅助建议,敬请周知。
欢迎大家转发,或默默点赞,让我们知道这期信号有被收到。
祝好,下期见。