2025 周报

5 min

W31

Review

  • 基础课:学了 jyyos、cuda mode,基本上一天一节课的进度,rust 只学了一点,之后继续
  • 实验室:在 qwen2.5 math 7b 上验证了 idea 的可行性,通过少量代码的修改,可以实现热插拔,并且相较于 dapo、grpo,在使用了不到一半的训练数据情况下,在 AIME 等多个数据集上指标有稳定提升(好官方的说辞……
    • 另外,关于 RoPE 编码,证明出了一个非常有意思的结论,再梳理梳理,说不定能有所应用
  • InfiniTensor:跟着也学了一段时间了,只能说其中的质量良莠不齐,讲得烂的也有,讲得好的也还不错,可惜就是由于课时的原因节奏上赶了一些,如果能慢下来一点就好了
  • 更新了一下博客,加了很多自己喜欢的 上去,顺便改了改 about 的内容

Plan

下周继续 jyyos、cuda mode,infinitensor 挑着看。此外可以学一点 js 和 ts,就是前端的一些知识,拿来 custom 自己的博客。实验室那边照常推进,隔两天刷下论文就行了。

感觉自己还需要学一下怎么包装故事,现在的收稿很看写作,要是在这一块拉了就太不划算了。

其他

这周看到一个对我而言相当不错的油猴脚本:微博知乎B站小红书关键词屏蔽器。在知乎的推荐页面试验了一下,添加了约 800 个屏蔽词,这样下来知乎的每轮推荐只能给我推大概 1 到 4 篇文章,并且都是我想看的(比方说论文解析、教程之类的);回想起没有用这个屏蔽器之前,知乎每轮推荐可以推十多二十篇回答/文章,其中相当一部分是我压根不关心的,甚至看着就烦的——比方说女拳、公知、粉红,以及很多引战、博眼球、挑起对立、渲染焦虑的内容,还有各种广告。不得不说知乎的推荐算法以及大部分内容都很烂,让我留在这个平台上的唯一原因应该只有能看到关注的一些大 v 的博客笔记解析之类。同样的道理我给 B 站和 xhs 都添加了具有平台特色(笑)的屏蔽词,剩下的内容就非常让我赏心悦目了。

另外在添加了屏蔽词之后,一些原本在推荐算法中排序靠后的内容就会呈现到最前面几条,也会让人厌烦。由此我又想起 rss 的好了:自己管理自己的信息源,内容的质量比推荐算法高得多得多,只是多样性欠佳。

这样一来,我就又把手机上的知乎、B 站、xhs 都给卸载了——过度的内容摄入不如不摄入,一篇高质量文章的好处远比一百篇推荐算法拿来刷月活日活的低质(低智)内容好得多。

如上所说,最近还听上了一些(个人认为)很好听的歌:

基本上都是鸣潮出品的,jkinss、jixwang、XuLai、Obadiah 等等老师的功底非常棒,也是让我吃上了。

W29

Review

Plan

  • 学 rustlings,一天一个 quiz 的量就行了,这块不太重要
  • 跟着学 InfiniTensor,重点看并行编程、推理和训练这三块
  • 背单词,练听力(不能再鸽了啊😭)
  • (可能)写论文的 abstract 以及 infro、related work,需要等到实验结束看效果
  • 如果还有余力,就学一下 jyyos