HEYWEEN

生成式學習的兩種策略:要各個擊破,還是要一次到位

生成式AI—生成有结构的复杂物件,如文句、影像、语音 策略1:各个击破 Autoregressive(AR) Model 产生代表结束的符号时停下来 策略2:一次到位 Non-autoregressive(NAR) Model 怎么知道结束? 法一:固定输出长度,碰到[END],后面直接丢掉 法二:先输出一个数字,再生成这么多个字 各个击破像是“串行化”,一次到...

2025年终总结

今年差点忘了写,虽然我发现我写的所谓“年终总结”也就是最接近年末这段时间的心境罢了,但是不管怎么说,年末的我也是由今年的无数个我汇聚形成的。 前几天和朋友玩了个二选一小游戏,在“给时光以生命”和“给生命以时光”中,我毫不犹豫地选择了前者。 也许在光阴还没有认识我的陌生角落,那里的岁月婉转绵长,也可能一片荒芜。可一旦当我,当我们涉足那片土地,用脚步去丈量,用双眼去抚触,用呼吸去熨帖——那一...

互联网计算复习---t老师部分

理解的要求>了解,掌握=需要会计算/推导 传输层 比如说传输层,大家回顾一下的话,首先要知道它的应用层,在TCP/IP协议里也好,OSI模型里面也好,要有个基本的认知,还有它们之间的关系。在这里面其实传输层很关键的一点就是它是一个端到端的协议,核心内容不仅是主机之间的通讯,而是应用之间的问题。一台机器里可能有多个应用在运行,依据什么来区分,这很关键。就是要考虑五元组,源地址...

指令周期和指令流水线

指令周期 指令周期:处理单个指令的过程(时间) 取指周期:从内存中提取一条指令 执行周期:执行所提取的命令 只有当机器关闭、发生某种不可恢复的错误或遇到停止计算机的 程序指令时,程序执行才会停止 并非所有指令的周期都一样,例如,NOP(空操作)只有取指周期 间址周期 操作数/间接寻址涉及访存 间址周期:把间接地址的读取看成是一个额外的指令子周期 ...

Trending Tags