- 该项目是我个人的笔记,部分会刻意制作成Blog,但大部分仍然是我个人的Note,除非特殊声明,否则不建议作为学习资料。
- 该笔记部分插图来自各种书籍、课程或其他资料,若涉及任何版权行为,请联系我,我将删除内容。
- 对于课程笔记,我严格遵循Academic Integrity,虽然在笔记中可能记录思路,但代码肯定是Private的,如果有不合适的地方,请提醒我。
- 文中所有内容,与本人之前、现在或将来的雇佣公司或组织无关。
- 本人保留自省的权力,即你看到的内容不一定代表本人最新的认知和观点。
- 项目下所有文章除特别声明外,均采用CC BY-NC-SA 协议,转载请严格准守。
-
在初学时
- 在学习时记下笔记有助于记忆
- 在整理时重构笔记有助于搭建知识体系
随着进一步学习,我们对同一知识的理解发生变化,会动态的调整笔记(重构知识体系的过程)
-
在实践时
通过笔记快速的回忆起学习时的理解或者查找对应的知识点
但随着时间的推移,笔记的作用减少了
- 常用的、重要的知识点内化于心
- 零碎的、细节性的知识现用现查
此时笔记更像是"当年攻城略地时的纪念品"。
-
现在看来笔记不是一个结果,而是一个过程。工作之后,少有整块时间学习,又通勤时间过长,故基本是在地铁上学的,读资料的时候确实感觉学到了东西但是很快忘记。不能即时记笔记意味着不能很好的构建(并重构)知识框架,也不能通过整理进行反复记忆。这就是导致学完之后对知识的吸收很少,如果能充分记笔记可能会有更好的学习效果。花有重开日人无再少年呀。
-
在最开始刚接触一个领域时,任何知识对我都是新的,于是笔记是非常详细的。随着我对这个领域的深入和实践,对最基本的概念已经有了自己的理解,此时再事无巨细的记录只会徒增复杂性,此时的笔记侧重重点难点或者整体框架。反过来看在初入该领域时做的笔记就对现在的我没有了意义。
- 什么是发心:做事的方向,对己的要求。
对于输入(通常是新知识),以搭建知识框架为主,且莫成为知识点的罗列。
对于输出(即博客),要么是没有人写过的,要么是比别人好的。
- 什么是规范:产物的一致性,比如这里就是笔记风格的一致性。
- 什么是最佳实践:目的与规范相同,主要针对工具(比如编程语言),使用工具是为了做成某事,工具有某些属性可以做成某事。当人学习某些属性后,未必有能力完成对应的事情,因为,一个学习的好方法是先提出要做成什么事情,再考虑如何使用工具的属性完成。此为最佳实践,关键在一个Practice字上。
我认为计算机最有普遍意义的天赋只有一种 —— 行动力
- 立刻去做的行动力
- 坚持去做的行动力
好吧,当然还需要独立思考和深度思考
顺便讨论下完美和完成哪个更重要,仅讨论在计算机相关知识学习方面的,我表达下个人的看法。我认为完美比完成更重要,因为我做事的发念是好奇心,如果第一次做不好很可能就没有下次了。
-
发心:
- 自用:我个人有强迫症,想让自己在计算机领域的知识体系很系统,但熵增定理告诉我们这样阻力很大,我希望通过笔记去对抗它
- 费曼学习法:我会设想有一个人在看这篇记录,用词尽可能有易读性,比如简介下资料内容、推荐程度
和适合人群
-
说明:我本科的学习方法论是理论结合实践螺旋上升
- 理论结合实践:Donald Knuth曾经说过"If you find that you’re spending almost all your time on theory, start turning some attention to practical things; it will improve your theories. If you find that you’re spending almost all your time on practice, start turning some attention to theoretical things; it will improve your practice.",我这里也提供一个工程类的视角理解这句话,如果我们要写一本教材,我们要选择一个主题,我们希望可以写出这个主题的方方面面,各个层次、各个细分以及它们的发展和现状。但我们发现如果一本教材想要实现理论和实践相结合是要做取舍的。如果想概念方面面面俱到,很难辅以实践,各个概念分别给出实践很零散,而且并不是所有的概念都有适合学习的实践。目前对这个问题的一种解决方案就是开发相对独立的配套实验嘛。还有一个方案就是专门写实践的书籍,这本书就是主要讲怎么实现某个东西,然后在这个过程中讲这个领域的相关概念,那么我们发现这样组织就很难展示尽可能全面的概念。所以我在资料的选择方面就涉及上面说的几种类型的资料。
- 螺旋上升:这个是理论结合实践在时序上必然体现的结果,我们可能对某个领域的某个概念以不同的视角"重新"学习。
-
下面的文字无形中成为学习资料的推荐,但是这里有一个问题,比如我对一个领域是入门,此时我选择一份资料,即使它客观上很差甚至有错误,我也能学到东西,同时无法识别出中间的错误。比如《C++ Primer Plus》,这是我的第一本 C++语法书,后面再提到它我只评价是语言版本落后,但是实际上其中有很多知识是错误的,这是别人识别出来的,在我看的过程中是没有能力辨别的,这就导致我无法对学习资料做出正确的判断。
-
对于涉及项目(实践结果是一个项目)的部分,我会在下面使用这个🤏emoji进行标注,表示相关项目体量比较小,适合作为练手项目,但不足以写在(本科校招)简历上。定量的说,我希望代码行数在3k行以下的使用该符号标记;值得讨论的是,比如《Crafting interpreters》中涉及的Lox的C语言解释器,其代码行数虽然在3k行以上,而且是C语言实现的麻雀虽小五脏俱全,其实思维难度不小,但是由于其代码全部开源且相当于有逐行解释的手册,所以认为其是练手项目;而xv6 lab中虽然学生添加的代码比较少,但是由于整个xv6项目规模不小且整个lab思维难度较大,所以认为是可以写在简历上的。而诸如B站小彭老师的一些课程,实现Vector或者实现Json,则毋庸置疑是练手项目,而像BusTub这种整个项目在3w行左右,学生添加的行数在4k行左右的则毋庸置疑是可以写在简历上的项目。
-
大学基础:
- How to ask questions the smart way
- 上海交通大学生存手册以及我的书评
- 数学基础:
- 微积分:
- 宋浩:应付期末、草草看完,早忘光了。
- 线性代数:
- 宋浩:应付期末、草草看完,早忘光了。
- 概率论:
- 宋浩:应付期末、草草看完,早忘光了。
- 信息安全:
- 《深入浅出密码学》:比较推荐,我目前需要的绝大部分密码学知识都来自这里,在做Web3或者其他东西时对这方面不犯怵了
- 微积分:
- 物理基础:
- 上课(很少听讲),学校老师讲的应该算挺好的。
- 电子基础:
- 数字电路
- 上课(草草看完录播),学校老师讲的确实挺好的。
- 《编码 · 隐匿在计算机软硬件背后的语言》:这本书的范围比数电这个科目要大,是从最基本的逻辑门开始直接干到概念性的计算机,但是偏简单,为了平缓的学习曲线放弃了深度,
适合高三。
- 数字电路
-
信息学导论:
- csdiy.wiki:我没开玩笑,我在刚上大学时看了无数人的学习路线规划,感觉抄来抄去,但是csdiy属实是有世界观刷新感觉,强烈推荐。
不过可能过几年 Lab 也是人均了( - Crash Course Computer Science:神奇的网课,语速极快的overview了CS的各种topic,比较推荐
高中毕业。
- csdiy.wiki:我没开玩笑,我在刚上大学时看了无数人的学习路线规划,感觉抄来抄去,但是csdiy属实是有世界观刷新感觉,强烈推荐。
-
编程入门:
我有点遗忘在第一次接触编程的感觉了,不太能换位到一个初学者的视角;不同人进入编程世界的入口是不一样的,这个阶段可能会花一些时间找找感觉。
- CS61A(SICP, Structure and Interpretation of Computer Programs):CS-DIY的第一门课,其教材SCIP也被称为是一个常看常新的书,我大概尝试了下,对我来说过于初学者,没有必要看完,写在这里作为推荐,适合编程初学者。
- Acwing Linux 基础课/Missing-Semester:这两门课有一小部分重叠,主要讲 Linux 的操作和工具,我觉得非常实用,前者内容更少,所以讲的更细致(给了很多演示),但是它是服务于它自己后面的课程的,够细但不够多,所以需要后者作为补充;后者非常的全面,会讲到我们在实际开发中会遇到但是不会有人系统讲的东西。强烈推荐。
-
计算机系统基础:
- CSAPP/CMU15-213
语言是互通的,一个新语言的诞生必然要考虑用户教育成本,一个显而易见的方案就是和之前的语言更像。
所以我在编程语言的学习方案从开始是系统的看大部头的书籍到后是面看 Quick Start 文档然后直接上手。
-
C:
- 《C Primer Plus》:C 语言学习的不二之选,我当时有 C 语言基础,但是不够系统,于是看的这本书,用了五天五夜,看完后可以在小范围当语言律师了。
-
C++:
- 《C++ Primer Plus》:不评价,不推荐。
下面的几本书真是值得反复刷呀。
- 《C++ Primer》(以下简称 c3p):毫无疑问的成为C++初学者的第一本书,比较推荐,但我个人认为它还是有股 C++98 味儿。
下面的几本书必须要二刷,因为c3p毫无疑问是给新手准备的,但是C++太深奥了,刚看完 c3p肯定要继续看下面来学习更Modern的特性和最佳实践,但是在没有足够实践的基础上绝对是理解不到位的,在充分实践后再来看会有崭新的体验。
- 现代 C++30讲/32讲:一个课程的文字记录,是《C++ Primer》必要补充。本身更多是提纲挈领的说明一些要点,对细节想要更深刻的理解肯定要看更多的资料。或者它本来就是一个提纲,为我们打开Modern C++的大门。
- 《Effective Modern C++》:本来想看《Effective C++》的,它被称为 Effective 类书籍的鼻祖,但看评价觉得它不够Modern,而这本书是它的continuation和correction。强烈推荐!惊叹于 C++的博大精深,这本书对我个人而言说清了很多我过去模棱两可的事情,看完之后越发感觉自己还是 C++的初学者。
我也想大言不惭的表达下该如何学习 C++,推荐叔叔的博客。好吧我写不出比叔叔更好的,"眼前有景道不得,崔颢题诗在上头",算了算了。
-
Python:
- Manual:Python这种语言看Manual就行啦
- B站码农高天,他是CPython的Contributor,Python相关教程很不错,适合想精深Python的。
-
Go:
- Quick Start:A Tour of Go
我目前以Go作为工作中的主要开发语言,有这样的体会,它的语法非常非常简单,在Quick Start后就可以立刻投入到大项目的实践中。在实践过程中,会遇到很多问题,几乎都可以通过见招拆招解决。在这个过程中,有意识的积累典型场景和最佳实践,很快就很好了。“大道至简”的优势体现的淋漓尽致。
所以我后面的学习重点基本在“最佳实践”上,基本囊括Go常见的语法陷阱。
- 100 Go Mistakes and How to Avoid Them:当提出“最差实践”的同时,最佳实践也就有了。
-
Rust:
我在学习Rust前非常忐忑,因为我极大概率永远不会用Rust写对自己“工作”有益的代码,而个人的学习理念向来是在实践中学习; 没有需求的推进我很怀疑自己学习Rust的动力。
-
Quick Start:语法(fasterthanlime · A half-hour to learn Rust) + 练习(rustlings):前者顾名思义,后者还是很惊喜的,其提供一系列无法编译的Rust代码然后供我们修改,在实践中理解Rust的各种用法。其特色是提供了一个全自动的交互环境,就像玩游戏闯关一样。
-
The Rust Programming Language:很多的人的推荐,目前当作查表。
-
-
前端:
- Acwing算法全家桶,我不想评价Acwing和yxc,但结合性价比,这个可能是国内最适合初学者的一套教程了。
编译原理在整体计算机知识体系中似乎是一个比较独立的部分,但是我个人感觉非常有学习的必要
- 它为我们展示了计算机看待程序的视角
- 它为我们展示设计编程语言的方方面面
-
《Crafting interpreters》【🤏】:这本书自底向上手把手的带读者使用C语言实现一个有闭包、类、垃圾回收的动态类型语言。是我2023年看到的最好的技术书(这个受到了《Effective Modern C++》的冲击),总之非常推荐。
-
内存分配器
个人感觉计算机组成原理、体系结构、操作系统(的一部分)并不能泾渭分明的划分,这里以体系结构统称
- 王道考研的计组课:应付期末,草草看完。
- 南大ICS PA:只看过部分视频,可预见的未来也不会完成了,这里只做记录
- 让我对计算机底层有了全新的理解
- 学到了很多对Coder来说很珍贵的的品质:Unix哲学、如何提问、STFW/STFM/RTFSC等等
- 相信机器是永远正确的,相信 Bugs 一定是能观测,可复现,你能够解决的。如果不是,那一定是没有找对合适的工具,没掌握正确的调试手法。
- 《计算机体系结构基础》(胡伟武等,第三版)
- 《计算机组成与设计:软件/硬件接口》
- 《Computer Architecture A Quantitaive Approach》(又称《量化方法》)
- 王道考研的操统课:应付期末,草草看完。
- 南大蒋炎岩操作系统/OSTEP:蒋老师说他的课是OSTEP导读,但蒋老师的课很有个人风格,推荐课程;蒋老师评价OSTEP为最好的自学OS的资料,我的第一本英文书,全程在地铁上看完的,没有课后作业,没有记笔记,非常推荐(其实中文版就翻译的挺好,没必要硬啃英文版)
- MIT6.S081:资料方面只看了xv6 Manual和野生课程内容翻译,然后直接啃实验,以实践为主,缺乏理论由OSTEP补充。
- 《现代操作系统·原理与实现》(陈海波等):好书!推荐!
- 谢希仁的《计算机网络》(第七版):教材
- Stanford CS144(2023):使用C++20实现了字节流、重组器、TCP的两端、数据链路层和网络层的接口、IP的路由选择。其中的项目结构(包括CMake相关代码)和几个Util类(地址的封装、文件描述符的封装、Socket的封装)都挺值得学习的。做完才意识到删除了往年最难的部分,难度低了很多,应该适合新手。遗憾的是这就导致后几个实验比较零碎,未能得到一个完整可用的TCP协议实现。
- 《计算机网络:自顶向下方法》
-
谷歌三件套
- MapReduce
- GFS
- BigTable
- LevelDB
- RocksDB
- LevelDB
-
一致性协议:
- Raft
- ectd:Raft的开源实现
- Zookeeper
- Zookeeper:Zookeeper的开源实现
- Paxos:世界上只有一种分布式协议,那就是Paxos
- Raft
- 王珊、萨师煊的《数据库系统概念》(第五版):教材
萨师煊先生是我国数据库的奠基人。
-
《Build Your Own Redis with C/C++》和《Build Your Own Database From Scratch》【🤏】:分别用C with STL实现mini Redis和Go实现mini关系型数据库,我个人完成了第一个和第二个的 B+Tree 部分(有bug),第一本中我将作者的 C 实现改成Modern C++实现,但是对于侵入式数据结构还是一股C味儿,后面有机会可能结合CRTP重写。对于第二本,写出的 B+Tree不符合预期,而且作者使用的B+Tree是比较特殊的变种,作者没有好好描述、网上也没有很好的描述,于是作罢,以后有机会写15445吧。嘻嘻,写完15445的B+Tree了,果然要科学的多(拉踩一波)。
-
CMU 15445 Lab 2023 Spring:在23年春季版本中,我们首先实现一个面向磁盘的内存管理器作为整个数据库的基础,然后实现一个很有意思的数据结构B+Tree来实现数据库索引,这也是我选择23春季版本而不是秋季版本的原因。之后则是深入到数据库的相关概念中,火山模型和事务系统。还有其他的涉及优化的可选作业,我是最小实现,没有做任何优化。首先要感谢老师、助教和其他为该项目贡献的人,是你们的付出才有了如此精致的课程。其次是十分感谢群友,没有群友前辈的点拨我是万万不能完成的。我在这个过程中,也遇到一些坑,收集整理一些资料,在这里,我过了一遍,保证符合学术诚信,这里包括我遇到的坑点,还有对相关知识的整理,比如B+Tree伪代码里面的数值逻辑和模糊概念的梳理,还有关于事务系统这个名词之间的关系和限制(Project4的Handout有点离谱)。这个过程中,特别是P3和P4,看来很多前辈的文章攻略,我个人觉得这是不违反学术诚信的,因为客观开发项目也是需要文档手册的,而Handout真的不是一个好手册;当然,jyy老师也说过,在工业场景,并不是所有问题都有答案和指导,在没有指导的情况下完成也是需要训练的。但是这里过于离谱,没有说明算法流程可以接受,但是相关概念也没有说清,是甚至需要对照野生样例反推语义;当然这又涉及另一个话题,"共享测试样例"是不是不违反学术诚信,见仁见智吧,没这个我真过不了了呀,太菜了。然后是这个bustub_2023spring_backup,这是 23 春季起始代码的副本,当然正常途径是 reset 或者找 release,但是我当时并不知道这样的方法,不管怎么这个可以给您节省一些时间。除此之外,这里添加了两个部分,一个
script.py
的脚本,这个本身也是我常用的一个命令行工具框架。一方面,这里收纳整理实现所需要的命令,--help
即可查看,这个存在的必要是什么?命令还需要整理?实际上,15445 的每个测试(或者 format 或者 submit),都需要两个命令以上,当然可以通过&&
和历史命令补全来实现,但是终究是麻烦,该脚本提供了简写,除此之外,这样也让可以“记住”所有命令成为可能,我个人的调试方法几乎只有一种方法,那就是打日志,我需要高频的重复运行测试代码,所以对我个人很有用。另一个方面,这里有三个有意思的命令,viz
是按照代码中持久的命令生成 B+Tree 可视化,viz-repr
是以交互的形式生成 B+Tree 可视化,使用的都是 15445 提供给我们的工具,前者帮助我们快速的复现错误的 B+Tree 形态,后者的使用体验我相信和 15445 提供给的 Web 的体验一样。它帮助我在 P2 非常快速的发现了出现错误的样例。还有一个是terier-debug
,这里借用 6.824 中的工具中的一些技巧,将多个线程的日志并排的按时间输出(不过我用的并不多)。所以这个脚本极大的提高了我的开发和排查效率。另一个是更多的测试,它和前面的脚本是对应的,收集了一些我使用的民间测试样例(还有一些纠错)。希望可以给大家帮助,祝各位武运昌隆。 -
CMU 15-721: 15445的后续,形式类似6.8244
- MIT6.824:看完了部分课程的讲义和完整的课程字幕翻译记录,主要以了解知识点为主,因为我的实习项目就是分布式存储,工业界的实践就在眼前,所以课程实现没有做。
- 《数据存储-架构与技术》舒继武:海舟哥严选,先mark下下
- 迟先生的Mini-LSM
- Pre:
- 语法:The Rust Programming Language
- 存储:
PingCAP人才计划P2 - LSM基础知识:LevelDB整体思想(叉鸽的博客)
- Pre:
- 记录一下群友推荐的:
- 《Direct Data-independent acquisition》(简称DDIA)
- 《卓有成效的工程师》
基本技术栈:react+ts+vite
目前向量数据库和RAG强绑定
- Survey of Vector Database Management Systems
- Vector database management systems: Fundamental concepts, use-cases, and current challenges
- 《文学讲稿三种》美国的弗拉基米尔·纳博科夫
- 《给青年人的十二封信》朱光潜
-
刘慈欣: +
+ [x] 短篇小说《赡养上帝》:假如上帝是一个客观存在的、创造人类的种族。 + [x] 短篇小说《赡养人类》:人类发展的一种终极情况。
- 短篇小说《乡村教师》:老师和孩子们无意中拯救了整个地球。
- 短篇小说《中国太阳》:双线叙事,一个人从农村的无知状态,到整个人类最激进的宇宙开发者。
- 短篇小说《超新星纪元》:
-
阿西莫夫:
- 短篇小说《最后的问题》:超级AI与人类发展到整个宇宙最广泛物种。
- 尤瓦尔·诺亚·赫拉利的简史三部曲
- 《人类简史》
- 《今日简史》
- 《未来简史》
- 《优秀的绵羊》
- 《做时间的朋友》
- 吴思的《潜规则》和《血酬定律》:这两本书的性质更像是文摘,它们组合起来通过较多的事例让读者明白某种道理。“潜规则”和“血酬定律”是分别对官与官、官与民之间的这种道理的比较好的概括,所以才选择这两个名字。那么作者想表达的道理究竟是什么?我是这样理解的,从人的本质出发,人首先是动物,有趋利避害的本能,然后再是人,在人类社会中的不同位置。相互之间有损害或者使获益的能力。这种相互的力推动人们进入新的位置,并不是由于个人品质才导致某个位置的人变到另一个位置,而是由于利害计算。书中以此视角解释了诸如贪官、造反等等话题。抛开其表达的思想,书本身很好读,在读之前以为会很晦涩,但读起来发现可以理解为一个个历史故事组成的,作者以他的视角对历史事件做出新的解读,让人眼前一亮,可读性不错。
-
《棉花帝国》
-
基金或者证券从业资格证
-
瑞·达利欧的《原则》
-
电子信息:
- 《我在硅谷管芯片:芯片产品线经理生存指南》
- 瑞安·诺思的《万物发明指南:时间旅行者的生存手册》
- 美国史蒂文·约翰逊的《我们如何走到今天:重塑时间的六项创新》
- 哈福德的《塑造世界经济的五十项伟大发明》
- 马克·米奥多的《迷人的材料:10 种改变世界的神奇物质和它们背后的科学故事》
- 卡尔·奇默的《病毒星球》