Skip to content

Latest commit

 

History

History
37 lines (25 loc) · 3.69 KB

Plan_learning.md

File metadata and controls

37 lines (25 loc) · 3.69 KB

预备知识

科学上网指南:https://clash.top/clash-verge/
提问的智慧:https://github.com/ryanhanwu/How-To-Ask-Questions-The-Smart-Way/blob/main/README-zh_CN.md

PS:如果有问题,请在群里提问,群里会有人解答.
去问ChatGPT也是完全OK的,比较推荐GPT4o和Claude3.5-sonnet

从0开始的AI之旅

环境配置:https://blog.csdn.net/qq_43874102/article/details/123164105

一.如果你没有Python基础,请你学完这个视频的前九章点击这里

二.如果你没有高数+线代+概率论基础,请你学到第二课-3.10 深度学习框架吴恩达深度学习.然后就跳到第三步,第二步学的内容基本上对应的是动手学深度学习的3-4章.

三.如果你有高数+线代+概率论基础或者你觉得你数学底子不错,请你学完这本书的前10章动手学深度学习.
后续的学习以这个为主,因为他用的是Pytorch框架,现在学术界用的都是这个框架.

四(可选).我们现在有学长的方向是具身智能(论文导向),需要有以上基础+强化学习基础教程链接的同学,如果学有余力的同学欢迎联系QQ:787471313

面试时间

暂定是在7,8周以后,具体时间等通知.

面试内容

1.复现mnist手写数字识别代码(网上教程很多,比较容易学习)

2.(较难选做,加分项)近年来,Transfomer 架构在计算机视觉领域得到了广泛的应用,逐渐成为了代替CNN,Resnet 等基于卷积的神经网络成为新的骨干网络。要求使用Vision Transformer 搭建网络,并载入预训练参数,以下两个数据集中任选一个进行训练。但对最终结果不做要求,能跑通即可。相对其他任务难度较大,考验对于transformer 架 构 的 理解和掌握,建议谨慎选择。可参考 git 项目:https://github.com/google-research/vision_transformer。。Cifa100 和 CIFAR-10 是同一个数据集,不同之处在于cifar100划分的类别更多更细。它有100个类,每个类包含600个图像。,每类各有500个训练图像和100 个测试图像。CIFAR-100中的100个类被分成20个超类。每个图像都带有一个“精细”标签(它所属的类)和一个“粗糙”标签(它所属的超类)image

也可以使用Caltech256数据集,数据集下载地址:https://link.zhihu.com/?target=http%3A//www.vision.caltech.edu/Image_Datase ts/Caltech256/

3.针对基础知识和代码提出部分问题,解答即可。

能得到什么

  1. 参加百度飞桨平台组织的AI赛事,项目,获得交流机会,实习等等(我们现在有几个成员就在做百度的开源项目)
  2. 入门AI,了解AI基础知识,为后续的比赛打下基础,我们学校有好几个AI方向的星级比赛
  3. 参加语言与智能系统实验室的学长学姐的项目,获得论文产出
  4. 科技楼九楼有六个工位可以使用