📓 工程札记

51 篇文章
角速度为什么是矢量:三维空间的几何戏法

角速度为什么是矢量:三维空间的几何戏法

角速度之所以是矢量,源于它天然携带转得快慢、转轴方向、转的手性三个不可分割的信息;更重要的是,当物体同时绕多轴转动时,这些信息必须用平行四边形法则合成。此外,有限角位移本身不是矢量(旋转顺序不同结果不同),只有无穷小角位移才具有矢量性;三维空间的霍奇对偶使得本该是二阶张量的旋转可以「压缩」成矢量形式。

一个公式+一个循环:感知机如何学会判断

一个公式+一个循环:感知机如何学会判断

感知机是1958年提出的最简神经网络模型,仅包含权重、偏置和一个判断阈值。本文通过「判断成绩是否及格」的具体例子,解释了偏置如何将锁定在0的决策边界「搬运」到正确的50分位置——没有偏置,机器无论训练多久准确率都卡在50%;加上偏置后精准达到100%。感知机虽小,却是理解现代深度学习原理的最佳起点。

花6美元租显卡,用QLoRA微调LLM重写90年代文档风格

花6美元租显卡,用QLoRA微调LLM重写90年代文档风格

作者用QLoRA方法在两个8B规模模型上微调,让LLM学会1990年代技术文档的写作风格。训练数据来自Bitsavers网站的微软手册(超3700万词),在Runpod平台租用B200显卡完成适配器训练,成本可控。微调后的适配器导出为LoRA文件,在本地Ollama上运行,整个流程耗时不超过一个周末。