This issue's feature · 精选
并发控制:互斥(Mutual-Exclusion)
为什么操作系统课要讲并发?并发不是"多线程编程"的内容吗?原因来自 UNIX 的 fork-execve 模型——进程之间不共享内存,但系统调用却共享内核数据。互斥,因此是操作系统自身要解决的问题……
为什么操作系统课要讲并发?并发不是"多线程编程"的内容吗?原因来自 UNIX 的 fork-execve 模型——进程之间不共享内存,但系统调用却共享内核数据。互斥,因此是操作系统自身要解决的问题……
REVIEW · 从零开始的系统。一台刚上电的计算机,什么软件都没运行,谁来决定第一条指令是什么?谁来把操作系统加载进内存?这就是启动链(boot chain)要解决的问题。
内存管理相关概念——内存空间的分配与回收。操作系统作为系统资源的管理者,当然需要对内存进行管理:分配、回收、保护、共享、虚拟化。
核心问题:训练误差很低,但我们真正关心的是泛化误差。两者之间的关系能被量化吗?PAC 给出的是概率意义上的上界——不保证每次都对,但保证"大概率对,且误差不大"。
从 Seq2Seq 说起。给定一个序列,我们想得到另一个序列——翻译、摘要、问答。问题在于:上下文信息该如何被恰当地聚合?Attention 的核心洞察便是此处。
抛开所有递归和卷积,只靠注意力机制,这是论文的主张。为什么这个"极端简化"反而奏效?抛开对"顺序"的执念后,模型获得了什么?