Conversation
Collaborator
sung00819
commented
Feb 18, 2026
- Resnet은 CNN based기때문에 적은 데이터셋에서도 안정적으로 학습이 잘 됩니다. 그렇기 때문에 학습데이터가 매우 적거나 사전학습된 모델을 사용하기 어려울때 유리할 것 같습니다.
- pretrain되지 않은 ViT모델을 불러와서 크기가 작은 데이터셋으로 처음부터 학습시키게 되면 과적합되어 일반화성능이 낮을 것으로 생각합니다. 초대형 데이터셋을 통한 사전학습을 전제로 설계된 모델이기 때문입니다! 실제 10에폭으로 비교하여 학습해보니 pretrained ViT에서는 final Train Loss:0.1185, Train Accuracy:95.74%, Val Loss:0.2892, Val Accuracy:92.48%였으나 False로 설정한 Vit는 final Train Loss: 1.0387, Train Accuracy: 62.47%, Val Loss: 1.0956, Val Accuracy: 59.96%였습니다. validation값뿐만 아니라 training조차 잘 못하는 것을 확인할 수 있었습니다.
1. Resnet은 CNN based기때문에 적은 데이터셋에서도 안정적으로 학습이 잘 됩니다. 그렇기 때문에 학습데이터가 매우 적거나 사전학습된 모델을 사용하기 어려울때 유리할 것 같습니다. 2. pretrain되지 않은 ViT모델을 불러와서 크기가 작은 데이터셋으로 처음부터 학습시키게 되면 과적합되어 일반화성능이 낮을 것으로 생각합니다. 초대형 데이터셋을 통한 사전학습을 전제로 설계된 모델이기 때문입니다! 실제 10에폭으로 비교하여 학습해보니 pretrained ViT에서는 final Train Loss:0.1185, Train Accuracy:95.74%, Val Loss:0.2892, Val Accuracy:92.48%였으나 False로 설정한 Vit는 final Train Loss: 1.0387, Train Accuracy: 62.47%, Val Loss: 1.0956, Val Accuracy: 59.96%였습니다. validation값뿐만 아니라 training조차 잘 못하는 것을 확인할 수 있었습니다.
Collaborator
|
잘 적어주셨습니다!! CNN based model은 inductive bias로 인해 데이터 효율이 높아 말씀해주신 상황에서 ViT보다 유리합니다. 수고했어 유민 👍👍 |
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.