Skip to content

Comments

Week_5 26기 분석 유현선#66

Open
hyunsun276 wants to merge 1 commit intoBOAZ-bigdata:Week5from
hyunsun276:Week5
Open

Week_5 26기 분석 유현선#66
hyunsun276 wants to merge 1 commit intoBOAZ-bigdata:Week5from
hyunsun276:Week5

Conversation

@hyunsun276
Copy link

  1. ViT는 Self-Attention을 사용하기 때문에 ResNet에 비해 계산 비용이 많이 들고 이미지를 이해하는 데 필요한 기본적인 가정을 거의 가지고 있지 않기 때문에 충분한 학습 데이터가 있어야 제대로 성능이 나온다. 따라서 데이터가 적을 때는 ResNet을 사용하는게 더 낫다.

  2. pretrained=False로 설정하면 모델이 사전학습된 가중치를 사용하지 않고 랜덤 초기화 상태에서 시작하기 때문에 학습 초반 정확도가 낮고, 수렴 속도도 느리다.

<ViT>
1. ViT는 Self-Attention을 사용하기 때문에 ResNet에 비해 계산 비용이 많이 들고 이미지를 이해하는 데 필요한 기본적인 가정을 거의 가지고 있지 않기 때문에 충분한 학습 데이터가 있어야 제대로 성능이 나온다. 따라서 데이터가 적을 때는 ResNet을 사용하는게 더 낫다.

2. pretrained=False로 설정하면 모델이 사전학습된 가중치를 사용하지 않고 랜덤 초기화 상태에서 시작하기 때문에 학습 초반 정확도가 낮고, 수렴 속도도 느리다.
@choiyoonhyeok
Copy link
Collaborator

맞습니다! ViT는 이미지를 이해하는 데 필요한 기본적인 가정(inductive bias)가 부족해서 ResNet이 더 유리한 부분도 있습니다.
그리고 2번은 설명을 더 붙여주자면, ViT는 초대형 데이터셋을 학습해야 성능이 올라오기 때문에, pre-trained 가중치를 불러오지 않는다면 local에서 아무리 학습해도 성능이 좋아지기 어렵겠죠!

수고했어 현선~~

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants