Assignment Overview
course web:https://stanford-cs336.github.io/spring2025/
这个homework有一定的算力要求毕竟要训练model
CS336: Language Modeling from Scratch,是Stanford开的一门课,目的是带领学生从头
构建llm,通过尽量少调用现有库的方式手搓
llm。
事实上由于我的大部分知识学习与工作都是通过即用即学
的方式完成的,这种系统的学习确实是我所缺乏的,我将通过五个homework尽量补全llm所缺乏的知识,并希望以此提升我的code skill,方便开发新的work。
CS336的第一个homework被叫做basic,但是我看到这个homework的overview就觉得不是很basic,事实上这个homework涉及到的theory确实是basic的,但是完成的方式和basic还是有一定区别。
这个homework要完成以下几件事: