Skip to content
入门
- 环境配置,pytorch或者TensorFlow等框架主流框架配置,可跟随b站视频或博客配置,不要选择太新的Python版本和框架,复现的代码大多为旧版本居多,会出现接口问题。
- 可复现师兄师姐已有代码
- 熟悉Python基本语法,无需系统学习,仅需学习几种Python的数据结构及接口,需要导入使用的包,可看官方文档demo或博客学习
代码复现流程
- 首先确定研究方向后,选择顶刊或者顶会已开源的代码,年份需注意,最好是大于1年,小于3年,小于1年出现问题,不好查找报错类型,小于3年保证代码不至于被淘汰,适用性不高。
- 下载数据集,可以配置Linux、Windows双系统,现有代码大多是部署在Linux系统的,Linux系统需注意内存大小,数据处理及数据集的存储需占内存,至少大于512GB
- 代码大致分为几个模块,模型(model.py),数据处理(utils.py),数据集读取(dataset.py),其中dataset.py尤为重要,是复现的第一步,注意如何能够实现数据集的读取,首先要注意的就是数据集的路径等,数据的预处理。
- 熟悉上述几个模块后,将代码熟读,弄清楚每行代码的作用
- 遇到报错,第一步去查看GitHub仓库中的issues,看有没有人遇到同样的问题,第二步可以去Stack Overflow去搜索,进行debug,最后可以去CSDN检索报错信息(优先看报错提示,运行的控制台英文报错提示你出现了什么错误)