diff --git a/ai/model.md b/ai/model.md index bc8289c..97a7087 100644 --- a/ai/model.md +++ b/ai/model.md @@ -45,4 +45,5 @@ data is upstream in process of developing good models ## 其他 -- [Port of Facebook's LLaMA model in C/C++ ](https://github.com/ggerganov/llama.cpp) \ No newline at end of file +- [Port of Facebook's LLaMA model in C/C++ ](https://github.com/ggerganov/llama.cpp) +- [ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型 ](https://github.com/THUDM/ChatGLM3) diff --git a/articles/2024/trend.md b/articles/2024/trend.md index 9600b39..3724ed2 100644 --- a/articles/2024/trend.md +++ b/articles/2024/trend.md @@ -18,6 +18,15 @@ David Gu 顾险峰写了一篇文章《Sora物理悖谬的几何解释》基本 上面的描述加上对图像处理的理解,现在越来越感受到那种临界状态的问题!即使完成大部分内容,但是在这种情况下也会导致越来越差的效果,就是那个临界状态。 +### 2024-3-15 +陶哲轩在一个谈话中,谈到关于数学与AI的关系,在某些领域的论文已经很长,达几百页的,AI可能帮助简化阅读,对形式化证明的证明过程由AI来当作阅读助手。 + +现在AI可以回到标准考试的问题了,对教学会产生影响。大多数学科都包含理论和实验部分,实验部分可能使用AI提供的数据,这样对学习进步很有帮助。 + +当然对AI的输出,我们也必须甄别,必须符合价值,因为时间是有限资源,注意力是有限资源,金钱也是一种有限资源。任何科学都需要某种价值判断,是否值得。 + +提到了网络梅特卡夫定律Metcalfe's Law的法则,如果有n个人,他们互相交谈,他们之间有n^2个连接,受众越多,潜在的好处就越多。 + ## 参考 - [The Ai Revolution]() diff --git a/articles/notes/math.md b/articles/notes/math.md index 67d2b39..e7e20f0 100644 --- a/articles/notes/math.md +++ b/articles/notes/math.md @@ -4,6 +4,8 @@ > 数学的精准是建立在一系列基本概念和逻辑推理之上。定义、公理、猜想、定理、证明和推论相互关联,形成了一个严密的逻辑体系。 - 定义Definition,是对某个概念或术语清晰而精简的描述,它是利用已知的概念来解释新的数学对象 + 1. 数学概念是体现数学对象本质属性的思维模式,而定义是对我们所讨论的数学对象的本质属性进行描述的语句 + 2. 当不断往前追溯时,会遇到无法给出的定义的概念,这就是基本概念或元概念 - 公理Axiom,又称公设,是没有经过证明,但被当作不证自明的一个命题,是构建数学理论的出发点 1. 一组公理能构成某个公理系统的基础框架,用于构建特定的数学理论 2. 每个公理系统都试图以最少且最基本的假设出发,来构建整个理论体系, @@ -32,6 +34,8 @@ 2. 鸽巢原理Pigeonhole principle(抽屉原理),是一个基本的组合数学原理,表明n+1个鸽子放置n个巢中,至少有一个巢有两个鸽子。 - 证明,是验证的过程 + + ## Linear Algebra 线性代数 diff --git a/cg/graphics.md b/cg/graphics.md index f78e09b..45c2263 100644 --- a/cg/graphics.md +++ b/cg/graphics.md @@ -1,5 +1,11 @@ # Graphics +## 图形接口 + +早期3D的API由驱动层提供,所有细节都是驱动贴近硬件实现的,在经过shader发展中,现代硬件越来越复杂了 +新时代的抽象图形接口vulkan来了,需要更具象化的过程,就是需要自己负责更多的事情 +- 任务调度 +- driver驱动 ## Thingking diff --git a/cpl/language.md b/cpl/language.md index d8a9d5d..056ba1d 100644 --- a/cpl/language.md +++ b/cpl/language.md @@ -1,17 +1,22 @@ # 编程语言 -3D的API在早期时只需要按照API调用就行啦!到vulkan时代,不仅仅是调用API,而是要在API层负责更多的 -责任,任务调度,driver逻辑,底层是越来越接近底层啦! +程序执行的过程就是把解决问题的思路翻译成计算机可执行的精确化形式语言的过程,编程语言就是解决问题思路的呈现 -编程语言也是如此,在各种概念成熟后,语义的发展成又加深了学习编程语言的门槛啦!现在越来越感觉 -编程语言是面向编译期的,不再对编译后的结果进行二进制的映射,编译期需要理解程序语言的语义! -说到语义,又会牵扯到语言学,毕竟编程语言中很多概念都是借用语言学的。 +计算过程依赖于形式语言,而形式语言的核心就是代数体系,就是定义了数据类型及针对这些类型的运算规则,确保运算的封闭性和自洽性。 -一个菜鸟就只有去依葫芦画瓢,不了解一些原理性东西,没法灵活运用知识,当然更多的是没有到那个量, -仅仅完成一些必要的工作需求。 +一门编程语言的核心就是代数体系,如何设计得不够好,把思路翻译成形式化语言得过程的难度超过解决问题的本身。 +从另一个方面来说,编程语言与我们日常交流语言,语言学有一定的共同点,编程语言很多概念也是借鉴语言学的 -## 编译语言 +现在越来越感觉编程语言是面向编译期的,不再对编译后的结果进行二进制的映射,编译期需要理解程序语言的语义! + +从硬件层面来说,比如C语言的驱动程序 +```c +*r = 0x27 +``` +就是一条赋值语句,在硬件层面就是给某几个引脚上电,产生高低电平,翻译成机器码01 + +## 术语 ### 引用 null reference与Maybe语义 @@ -23,3 +28,5 @@ null reference与Maybe语义 复合数据的不确定性,对编译期来说不明确,就需要程序员根据规则自己来提供至基本数据类型这一级别的 逻辑。 +### 所有权 +rust语言的安全,就是通过所有权的确定来保证在运行期不会出现意外。 diff --git a/database/sql.md b/database/sql.md index abcb661..51e90a1 100644 --- a/database/sql.md +++ b/database/sql.md @@ -15,3 +15,5 @@ SQL语言与其他语言区别最明显的特征是执行的顺序 9. distinct 10. order by 以上每个步骤在查询中没有对应的语句会自动跳过, 每个步骤会产生一个虚拟表,该虚拟表被用作下一个步骤的输入,这些虚拟表只有最后一步生成的表才会返回给调用者,其他虚拟表对外部调用sql来说都不可见 + +但SQL不是对所有数据和逻辑都适合,SQL缺乏离散型,导致集合化不彻底,有序运算困难,根本的困难是来源于其理论基础,关系代数。 \ No newline at end of file diff --git a/index/computerScience.md b/index/computerScience.md index db7a193..a101de8 100644 --- a/index/computerScience.md +++ b/index/computerScience.md @@ -146,4 +146,5 @@ ## 其他 - [计算机专业学习路线](https://hackway.org/docs/cs/intro) +- [安全之攻击](../others/attacks.md) diff --git a/others/attacks.md b/others/attacks.md new file mode 100644 index 0000000..5798a9b --- /dev/null +++ b/others/attacks.md @@ -0,0 +1,7 @@ +# Attacks + +- [计时攻击,依据调用的时间差来攻击](../articles/time.attacks.md) +- [网站gzip炸弹,可以用来报复爬虫软件](http://da.dadaaierer.com/?p=577) + 1. 就是利用HTTP/1.1规定了使用GZIP压缩数据传输的技术,后台以GZIP格式压缩,浏览器主动解压缩GZIP,用户无感知 + 2. 利用压缩技术,增加压缩比,比如全是1的数据,两百个1的压缩比高达95以上,捏造1G的数据,压缩比就达99%以上了。 + 3. 炸弹发生时就是浏览器解压GZIP时,内存崩溃,如果担心一下子没有这么多内存,可以放置多个小文件,足够消耗爬虫机器。 \ No newline at end of file