游戏本打吃鸡要什么配置（满满干货）游戏本打吃鸡风扇太响怎么办，小破本也能炼GPT！300行代码搞定，GitHub获6k星，来自特斯拉前AI总监，开源平台，-丞旭猿

那么，这个最简单最快的NanoGPT怎么用？下面展开讲讲NanoGPT的打开方式发布文件里面包含一个约300行的GPT模型定义（文件名：model.py），可以选择从OpenAI加载GPT-2权重还有一个训练模型PyTorch样板（文件名：train.py），同样也是300多行。

7.玩吃鸡游戏本要什么配置

作者补充道，代码并不难，很容易就能满足大家需求——无论是从头开始训练新模型，还是基于预训练进行微调（目前可用的最大模型为1.3B参数的GPT-2）。

8.玩吃鸡的游戏本配置

△一个训练实例展示上手前，需要提前准备好依赖项：pytorch <3numpy <3pip install datasets for huggingface datasets <3 (如果你需要下载和预处理OpenWebText)

9.吃鸡的游戏本配置

pip install tiktoken for OpenAI’s fast BPE code <3pip install wandb for optional logging <3pip install tqdm

10.打吃鸡的游戏本

先下载并标记OpenWebText数据集$ cd data/openwebtext$ python prepare.py这将创建一个train.bin和val.bin文件，将 GPT2 BPE token id放入一个序列中。

然后准备训练，目前脚本默认是尝试重现GPT-2，124M参数版本，但作者更鼓励大家阅读代码查看文件顶部的设置及路径$ python train.py如需使用 PyTorch 分布式数据并行 (DDP) 进行训练，请使用 torchrun 运行脚本。

比如，要在4个GPU节点上运行，代码如下：$ torchrun –standalone –nproc_per_node=4 train.py要从模型节点中采样，就需将一些检查点写入输入目录中$ python sample.py。

据作者目前自己的测试，他在1 个 A100 40GB GPU 上训练一晚，损失约为 3.74如果是在4个GPU上训练损失约为3.60如果在8个A100 40GB节点上进行约50万次迭代，时长约为1天，atim的训练降至约3.1，init随机概率是10.82，已将结果带到了baseline范围。

观察不同参数下训练/验证loss值如下：

至于如何基于新文本微调GPT，作者也简介了方法先访问data/shakespeare，查看prepare.py下载小型shakespeare数据集并将其呈现为train.bin和val.bin文件（方法前文已介绍），几秒即可搞定。

运行一个微调示例，如下：$ python train.py config/finetune_shakespeare.py该操作将加载配置参数，覆盖config/finetune_shakespeare.py文件。

作者指出，一般情况下，基本操作就是从GPT-2检查点初始化init_from，再正常训练此外，如果手里只有macbook或一些“力量”不足的小破本，作者建议使用shakespeare数据集，然后在一个很小的网络上运行。

先渲染数据；$ cd data/shakespeare$ python prepare.py再用一个较小的网络来运行训练脚本比如下面就创建了一个小得多的Transformer（4层，4个head，64嵌入大小），只在CPU运行，在作者自己的苹果AIR M1本上，每次迭代大约需要400毫秒。

$ cd ../..$ python train.py –dataset=shakespeare –n_layer=4 –n_head=4 –n_embd=64 –device=cpu –compile=False –eval_iters=1 –block_size=64 –batch_size=8

关于NanoGPT的后续计划，Andrej Karpathy也在网上有所分享他将试图让NanoGPT更快复现其他GPT-2模型，然后将预训练扩展至更大规模的模型/数据集中，此外，他还计划改进下微调部分的文档。

转战教育和开源的特斯拉前AI总监熟悉Karpathy的圈内人肯定知道，他此前是李飞飞高徒，也长期致力于让更多人接触了解神经网络和相关数据集2020年8月，他就曾发布NanoGPT前一代，MinGPT，同样旨在让GPT做到小巧、简洁、可解释，同样主打300行代码搞定。

Karpathy另一大身份是前特斯拉AI核心人物。在马斯克麾下，他历任特斯拉高级AI主管、特斯拉自动驾驶AutoPilot负责人、特斯拉超算Dojo负责人、特斯拉擎天柱人形机器人负责人…

2022年7月，Karpathy Andrej离职，在业内引发不小讨论他表示，未来将花更多时间在AI、开源技术教育上，比如他做了一档AI课程，现还在更新中此番发布NanoGPT同时，Karpathy还下场安抚了下催更党——。

新视频正从0开始构建，计划2周内发布。

最后附上：NanoGPT项目：https://github.com/karpathy/nanoGPTAndrej Karpathy课程：https://karpathy.ai/zero-to-hero.html

— 完 —

1. 本站所有资源来源于用户上传和网络，如有侵权请邮件联系站长！邮箱：cxysz1@tom.com
2. 分享目的仅供大家学习和交流，您必须在下载后24小时内删除！
3. 不得使用于非法商业用途，不得违反国家法律。否则后果自负！
4. 本站提供的源码、模板、插件等等其他资源，都不包含技术服务请大家谅解！
5. 如有链接无法下载、失效或广告，请联系管理员处理！
6. 本站资源售价只是赞助，收取费用仅维持本站的日常运营所需！
7. 如遇到加密压缩包，请使用WINRAR解压,如遇到无法解压的请联系管理员！
8. 精力有限，不少源码未能详细测试（解密），不能分辨部分源码是病毒还是误报，所以没有进行任何修改，大家使用前请进行甄别
丞旭猿论坛

THE END