网络文章@202506


作者:三只乌鸦 链接:https://www.zhihu.com/question/563683181/answer/1915094049385354843 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

成功源自对一切规则的天然反感和对自身的绝对自信。

孙自己说得很清楚,应试教育使人全面平庸。

孙很早就有自己的主见,他从来没有臣服于应试教育,反而致力于战胜它。这份“理想主义”几人有?做题家们接受应试教育花不了一秒。

我可以说看不起孙的人99%都是应试教育的拥护者,他们努力刷题,享受到应试教育那一点点可怜的光环加持,并对孙“钻了空子”大感不满。他们仿佛在说:跪着要饭不能插队!

这不就是应试教育使人平庸的最好例子吗?规则摆到面前就毫不犹豫接受,光速体制化,并且维护体制,以巩固自身在体制中既得的地位,哪怕这个地位也不过是比底层略高一点。

有趣的是,体制化的人群反而加速了孙的成功。因为体制化的人只会机械地处理社会学问题,他们习惯于用体制发放的筹码进行“实力对比”,从而社会行为是完全机械和可预测的。虽然可能他们中部分人嘴上不愿意承认,但实际上体制化的人特别愿意为体制付费,相信名校光环名人光环并趋之若鹜。如果说孙的求学之路是找到了规则的bug,那么其发币割韭菜、戏耍老巴则完全是体制化人群托举的结果。

孙是极少有的一把烂牌,硬是把世界玩成单机游戏的人,而且他确实证明了一件事:你不需要智商超群和口含金钥匙,就可以让体制为你服务,仰视体制的人都是全面平庸的机器人。

这简直就是某种意义上的斗士。


https://weibo.com/1987163183/PwcYkCaU2

乔布斯在一段对话中谈“审美(taste)的来源”:

史蒂夫·乔布斯:我觉得我的审美和很多人没什么区别。区别在于,我非常执着地想要把东西做到我们认知的最好程度。这是唯一的区别。

迈克尔·莫里茨:是的,我认为你很谦虚。

史蒂夫·乔布斯:嗯,事情会随着犯错而变得更加精妙。我犯过很多错误。你的审美观(aesthetic)会随着犯错而提升。

但真正重要的是:如果你要做一件事情,它并不需要花费更多的精力、也很少需要花费更多的金钱—— 就能让它变得真正伟大。你只需要多花一点时间。不会多很多。而且要有付出的意愿—— 坚持不懈直到它真正伟大的意愿。

PS:这段对话最早来自 Michael Moritz 的书 《Return to the Little Kingdom: Steve Jobs, the Creation of Apple, and How It Changed the World》(2009 年新版),之前原版名为 《The Little Kingdom》(1984 年) 。


https://weibo.com/1727858283/Pwp2bb1Vr

美国限制向中国出售先进AI芯片后,中国公司想出了一个新招:直接带着硬盘飞往国外,利用海外数据中心进行AI训练,再将结果带回中国。

硬盘箱飞往马来西亚的背后故事

今年3月初,4名中国工程师从北京飞抵马来西亚吉隆坡,每人携带一个装满15块硬盘的行李箱,硬盘中存放着80TB的数据,包括用于训练AI模型的图片、视频和表格等。

抵达后,他们来到一家马来西亚的数据中心,这里租用了约300台搭载Nvidia先进芯片的服务器。他们将数据输入服务器,训练完成后再带回中国。


前“Google Brain”团队HR负责人Hwang:为什么中日韩员工很难在谷歌等硅谷大公司当高管?但印度裔就可以

第一个原因是对权威的顺从:"权威意味着等级制度,顺从就像是服从或崇敬。所以基本上,是一种顺从权威的文化倾向。当我提到这一点时,几乎所有10个国家的领导人都开始鼓掌。他们都说,'就是这样,就是这个。'"

黄成贤解释说:"一些教授直接问我们,你是如何来到像Google这样的世界级公司总部的?几乎每个人都给出了同样的回答:'我非常努力学习。我想为最好的公司工作。'然后他们被问到,'但为什么?'几乎100%的人会说类似的话:'我想成为父母可以为之骄傲的儿子,值得骄傲的丈夫,受人尊敬的前辈,孩子可以为之骄傲的父亲。'"

这种思维模式的问题在于:"在一个充满聪明人的房间里,没有人提到他们想要什么。不是我的目标。这不是真正的他们的目标。更像是'别人会怎么看我?'比如,'我父亲说我应该主修计算机科学。'回应必须是第一名。他们一直朝着这个目标不停地奔跑。"

这种文化习惯如何影响工作表现:"所以发生的是,即使在工作中,当老板给他们一个明确的目标时,他们会向前冲,完成它,然后说,'这是结果。'他们因此得到认可,这就是他们一路走到Google的方式。即使在他们的祖国,这也是让他们引人注目的原因。但一旦他们到了总部,游戏完全不同了。那时他们遇到了障碍,因为有了这种心态,你就是无法晋升到领导层。即使当他们意识到这一点时,改变也真的很难。"

第二个原因是人际关系的建立:"起初你可能会想,等等,谁比亚洲人更善于建立关系?这听起来有点反直觉,对吧?我们很擅长聚会,对吧?人们认为有温暖,有这种强烈的联系感。"

但从社会学角度看问题就不同了:"当人们评价他们时,他们通常看两点。首先,他们看这个人是否温暖?他们是否友善,平易近人?其次,他们评估能力。这个人是否真的知道自己在做什么?他们不会平等地做这些事情。人们倾向于先判断温暖,然后才是能力。"

他举例说明文化差异:"我们不经常微笑,首先。我们的面部表情并不总是最友好的。如果你通过他们的镜头来看,我们的眼睛可能显得有点锐利或强烈,即使当我们在街上碰到某人时,我们通常不会说'对不起'或任何话。"

黄成贤继续解释:"所以,从他们的角度来看,我们显得非常冷漠。这就是这个差距出现的地方,他们如何看待我们与我们如何看待自己之间的差距。但转过来想一想。如果某人超级聪明和冷漠,你感觉如何?"

第三个原因是脆弱性:"这个词有点难干净地翻译,但如果按照字典,'脆弱'意味着有弱点或暴露缺点。在IT术语中,'脆弱'意味着对病毒或外部攻击开放。但当我们谈论人时,情况不同。这是关于勇气去展示你的弱点。这才是脆弱性真正的含义。不仅仅是有弱点,而是愿意让他人看到它们。"

黄成贤继续解释道:"所以当有人展示脆弱性时,他们真正在做的是说,'我信任你。'但这种开放的信任关系在我们的社会中并不常见。如果你不得不用一个词总结亚洲文化,那就是关于保全面子。即使你内心不确定或有困难,你也要表现得好像一切都很好。你假装知道事情,避免提问。这都是同一种心态的一部分。"

保全面子的心态如何影响职场表现:"因为我们在脆弱性方面挣扎,我们觉得需要隐藏我们的弱点。那么会发生什么?我们最终如何表现?我们只展示我们想让别人看到的完美一面,而隐藏所有不确定性和困难。"

黄成贤继续解释这种心态的后果:"任何感觉有风险的事情,或者有失败可能性的事情,我们就完全避免去尝试。我们总是坚持最安全的选择。什么是最安全的道路?努力学习,通过公务员考试,进入像大型电信公司那样的稳定企业,而不是尝试创业或冒险,因为那可能导致破产或负债。在这样的社会中,这被视为一个巨大的风险。你失败一次,就会被贴上不能成功的人的标签。在这种文化中,从失败中恢复并重新开始是非常困难的。"


云行在天 浪行在川 欲渡关山 何惧狂澜

云行在天 浪行在川 英雄出世逆流行险 欲渡关山 何惧狂澜 风生水起正好扬帆

豪情相依 生死相伴 天涯无处不念桃园 三人成众 何惧患难 诚心能纵沧桑变幻

莫道功名需百战 愿效滴水洞石穿 为有胸怀摘星志 手足协力共登攀

莫道征途路漫漫 愿效江水去不还 大势所向天地宽 终究奔涌归浩瀚 归浩瀚


https://weibo.com/1497035431/Pv5VCo1Am

“梁博,我昨天一个实习面试搞砸了,面试官问我用一两句话概括对大模型的理解,解决了什么问题,为什么能解决这些问题。我一下子就懵了,我一个大四学生,哪能有很高的理解水平呢,又向往大模型公司,这个问题要怎么回答呢?”

答:我认为大模型的核心价值2C来说是压缩信息差,此前搜索引擎做到了一部分,但是缺2个。第一个是泛化能力,搜索引擎相当于从自己知识库找到相关性高的答案给出,没有自己的理解。第二个是受限于阅读习惯,只能按照按一定排序算法顺序给出参考,距离最终答案还需要人工做最后解读和整理。而大模型解决了这些问题,一步到位直接给答案,极大的压缩了信息差,实现了信息进一步公平。 2B来说是整理数据的能力大大提高了,我们此前整理数据,使用了各种各样的自然语言处理工具,整理效果和性能都不行,大模型把这方面能力大大提高了,这也使得中美两国,包括一些拥有巨大数据的公司,Palantire,彭博,还有一些对冲基金公司的数据被更高效的整理,整体价值大大提高了。

至于为什么大模型解决了这些问题,有两个特别牛逼的结合,第一个是注意力机制,这个解决了对输入的精准理解。第二个是残差网络,这个解决了深度神经网络训练梯度消失,梯度爆炸的问题。而深度神经网络可以拟合任何输入和输出的特性,加上上面2条改进,就成为无敌的利器。

当然我的回答可能还是繁琐了一些,如果简单来说,2C是压缩信息差,2B是提高数据整理能力。核心改进是注意力机制(首创)和残差网络(借鉴),这么回答基本可以过关了。。


(311) The KV Cache: Memory Usage in Transformers - YouTube

Pasted-Image-20250605153942.png


人工智能让人文学科变得更加重要,但也变得更加怪异 — AI makes the humanities more important, but also a lot weirder

But in the longer run, the damage is being done to students. By making effort an optional factor in higher education rather than the whole point of it, LLMs risk producing a generation of students who have simply never experienced the feeling of focused intellectual work. Students who have never faced writer’s block are also students who have never experienced the blissful flow state that comes when you break through writer’s block. Students who have never searched fruitlessly in a library for hours are also students who, in a fundamental and distressing way, simply don’t know what a library is even for. 但从长远来看,这对学生造成了损害。将努力作为高等教育中的一个可有可无的因素,而不是其全部意义,法律硕士有可能培养出一代从未体验过专注于智力工作的感觉的学生。从未遇到过写作瓶颈的学生,也是从未体验过突破写作瓶颈时的畅快淋漓的学生。从来没有在图书馆里毫无结果地找上几个小时的学生,也是根本不知道图书馆是用来做什么的学生。


AI and the Rise of Judgement Over Technical Skill https://notsocommonthoughts.com/blog/ai-and-judgement/

As AI continues to evolve, we’ll see more roles shift from technical execution to strategic judgement. The most valuable professionals will be those who can:


判断力比技术更重要 | Hacker News — The rise of judgement over technical skill | Hacker News

The problem wasn't low paid labor, it was just incompetent labor. You can find competent developers in all these countries offering lower pay, India, Brazil, Romania, Poland, China, Pakistan, its just that they would already be hired by other higher paying companies and what is left for the ones that are looking for the lowest paid possible workers are the incompetent ones. 问题不在于低薪劳动力,而在于不称职的劳动力。你可以在印度、巴西、罗马尼亚、波兰、中国、巴基斯坦等所有这些提供低薪的国家找到有能力的开发人员,只是他们已经被其他高薪公司雇佣了,而那些正在寻找最低薪工人的公司只剩下那些不称职的人。

Reminds of me working in IT. One company tried to outsource my job to India five different times before they were mostly successful at it. The companies that are successful aren't the ones that assume it'll cost 1/10th the price, they are the ones that know it'll cost 60+% of the price and still require some handholding. 这让我想起了我在 IT 行业工作的经历。有一家公司曾五次试图将我的工作外包给印度,最后才基本成功。成功的公司并不是那些认为成本只有 1/10 的公司,而是那些知道成本只有 1/10 的 60%以上,而且还需要一些帮助的公司。

If you're hiring on price alone, you're already selecting the pool that doesn't contain the most competent labor. 如果您仅凭价格来招聘,那么您选择的人才库中就没有最有能力的劳动力。

"Never buy the cheapest version of something." I don't remember who told me that, but it was good advice. There's always a reason. "永远不要买最便宜的东西"我不记得是谁告诉我的,但这是个好建议。总是有原因的


https://weibo.com/1497035431/PuVqmzwHE

我们知道有一个著名大厂(大部分人都用过他们家产品),非常牛逼,深谙拖账期的问题,和其他大厂形成鲜明对比,绝不拖延,付款非常及时。但是以此为条件,把合作金额压得非常低。这也是一个了不起得创新,你在我这里少赚点,我让你资金转的快,有些小厂老板一看能快速拿到钱,在这个残酷的市场下,薄利总比垫资风险小,总比倒闭强,于是也干了。。

洋人大厂这一点就比较好,约定的账期一定会支付,而且还会有条款,提前支付的话,能减免一定比例的费用。现在大家都喜欢出海,服务洋人,主要是洋人在做生意这块,确实有信仰约束,不乱来。。


Introduction to CUDA Programming for Python Developers | PySpur | AI Agent Builder

We've seen how threads are organized into warps (eg. 32 threads each) and then grouped into blocks, and how these blocks are scheduled onto Streaming Multiprocessors (SMs). Now let's zoom out to see the complete picture. A thread block is a group of threads that can cooperate via shared memory and synchronization and that execute on the same SM. You can think of a block as a team of threads working together on a portion of the data. The grid is composed of all the blocks launched by a kernel, representing all the teams tackling the entire problem. In the diagram, you can see how the grid is divided into multiple blocks, each block is subdivided into warps, and each warp contains multiple threads.

Pasted-Image-20250603134216.png


https://www.zhihu.com/question/1897959255778231029/answer/1911414619534263222

作者:lu luce 链接:https://www.zhihu.com/question/1897959255778231029/answer/1911414619534263222 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

编程,英语和数学。这三个是基本上都是不归路。

先是英语:

我在2017年学完新概念英语以后,发现新概念英语只是一个可以在一年半的时间里,让我的单词量和阅读水平从四级提高到托福的教程。等我学完了以后,还有漫漫长路等着我呢? GRE单词要背,长难句分析要做。数不清的题目。基于英语的汗牛充栋的文学作品,科技文章。VOA,BBC的广播。Science网站。经济学人,纽约客杂志。 从四级提高到托福的这条河流的航行只是我英语学习长路中的一条小溪。当我学完新概念英语这记小舟,驶出英语学习的河流。等待我的是像太平洋一样浩瀚无垠的英语世界。

之后是编程:

你只要学会了C和C++。。你的面前就是一个浩如烟海的代码世界。。操作系统,编译器,通信协议栈,游戏引擎,光追引擎,高性能数据库。 这是一个你一生都无法穷尽的世界。你就像一个勇敢的水手,驾驶着你手头那个破笔记本电脑,遨游在代码的海洋中,你会乐趣无穷。。 不管你是否承认,代码生成的软件已经遍布你的身边。除非你是住在深山老林的原始人,或者是吃饱等死的所谓普通人。你都无法摆脱软件。 遨游在代码的海洋里,不仅让你和这个世界一起前进,还能让你获得丰厚的收入。拥有赚钱的快乐。

最后是数学:

首先B站上,啥视频都有。。有人喜欢看就多写点。首先如果高数基础不好就看同济的高数和线性代数,概率论就看浙大的。这些书先别管和美国教材相比好不好,这些书都是有对应的辅导书和参考习题解答的。你先对着玩一遍。之后过一遍吉米多维奇。 之后就可以走不同的方向,想玩微积分方向的就去B站刷一遍数学分析。之后刷一遍裴里文。 如果进一步想玩,就去看程其襄的实变函数。这个在B站有一个非常好的视频教程。ModuliSpace做的。 想玩实分析和复分析的,那本可视化方法现在B站上也有教程。 如果看DL眼热的,对概率论有兴趣的,可以先买一本北大黄皮的测度论和概率论基础,这个在B站上也有教程。还有Advanced probability也有讲解视频。上面的都搞完,就可以玩Foundation of ML轻松一下了。 反正就是有很多事情可以玩。