生成式學習的兩種策略:要各個擊破,還是要一次到位
生成式AI—生成有结构的复杂物件,如文句、影像、语音 策略1:各个击破 Autoregressive(AR) Model 产生代表结束的符号时停下来 策略2:一次到位 Non-autoregressive(NAR) Model 怎么知道结束? 法一:固定输出长度,碰到[END],后面直接丢掉 法二:先输出一个数字,再生成这么多个字 各个击破像是“串行化”,一次到...
生成式AI—生成有结构的复杂物件,如文句、影像、语音 策略1:各个击破 Autoregressive(AR) Model 产生代表结束的符号时停下来 策略2:一次到位 Non-autoregressive(NAR) Model 怎么知道结束? 法一:固定输出长度,碰到[END],后面直接丢掉 法二:先输出一个数字,再生成这么多个字 各个击破像是“串行化”,一次到...
PyTorch:python的机器学习框架 特点: 快速进行高维矩阵的计算 自动算微分 三件事情: model架构 loss function optimization算法 DataSet:stores data samples and expected values DataLoader:groups data in ba...
如何打造AI Agent 当我们把LLM当作AI Agent来使用的时候,其实做的事情没有任何不同,归根到底,就是: \(goal\rightarrow obs1\rightarrow action1 \rightarrow obs2 \rightarrow action2 \rightarrow ... \rightarrow result\) 如何把LLM当成一个AI Agen...
生成式人工智能基本原理:输入一个x,输出一个y 通过有限的选择组合出近乎无穷的可能 基本单位叫token 基本策略:每次只生成一个token yi \(\{ z_1, z_2, z_3, \dots, z_{t-1} \} \rightarrow z_t\) 类神经网络:本质上是一个function,产生的是一个token的概率分布,给每一个token一个分数 把一个函数分成多个串...
机器学习是什么:让机器具备寻找函数的能力 不同的类别 Regression:假设函数的输出是一个数值scalar Classification:选择 机器怎么寻找一个函数 Step1:function with unknown Step2:define loss from training data Step3:optimization Loss:也是一个函数 输入...
今年差点忘了写,虽然我发现我写的所谓“年终总结”也就是最接近年末这段时间的心境罢了,但是不管怎么说,年末的我也是由今年的无数个我汇聚形成的。 前几天和朋友玩了个二选一小游戏,在“给时光以生命”和“给生命以时光”中,我毫不犹豫地选择了前者。 也许在光阴还没有认识我的陌生角落,那里的岁月婉转绵长,也可能一片荒芜。可一旦当我,当我们涉足那片土地,用脚步去丈量,用双眼去抚触,用呼吸去熨帖——那一...
理解的要求>了解,掌握=需要会计算/推导 传输层 比如说传输层,大家回顾一下的话,首先要知道它的应用层,在TCP/IP协议里也好,OSI模型里面也好,要有个基本的认知,还有它们之间的关系。在这里面其实传输层很关键的一点就是它是一个端到端的协议,核心内容不仅是主机之间的通讯,而是应用之间的问题。一台机器里可能有多个应用在运行,依据什么来区分,这很关键。就是要考虑五元组,源地址...
I/O接口:又称I/O控制器,负责协调主机和外部设备之间的数据传输 通道控制方式 驱动程序一定是厂家自己设计的
指令周期 指令周期:CPU从主存中每取出并执行一条指令所需的全部时间 一个指令周期由若干个机器周期表示,机器周期又叫CPU周期 一个机器周期又包含若干个时钟周期(节拍、T周期、CPU时钟周期,是CPU操作的最基本单位) 每个指令周期内机器周期数可以不等,每个机器周期内的节拍数也可以不等 指令流水线
指令周期 指令周期:处理单个指令的过程(时间) 取指周期:从内存中提取一条指令 执行周期:执行所提取的命令 只有当机器关闭、发生某种不可恢复的错误或遇到停止计算机的 程序指令时,程序执行才会停止 并非所有指令的周期都一样,例如,NOP(空操作)只有取指周期 间址周期 操作数/间接寻址涉及访存 间址周期:把间接地址的读取看成是一个额外的指令子周期 ...