Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Lab 2] head size #132

Open
lathanasiadis opened this issue May 1, 2024 · 1 comment
Open

[Lab 2] head size #132

lathanasiadis opened this issue May 1, 2024 · 1 comment

Comments

@lathanasiadis
Copy link

Στον κώδικα που μας δίνεται το head_size υπολογίζεται ως head_size = dim // self.n_head. Όμως η διάσταση των embeddings μας (50) δεν μπορεί να διαιρεθεί χωρίς υπόλοιπο με πολλά πιθανά n_head (π.χ 3, 4).

Για να λύσουμε αυτό το θέμα, μπορούμε να ορίσουμε head_size = dim και το layer προβολής να έχει διάσταση εισόδου n_head * head_size; Ή δεν χρειάζεται, οπότε δουλεύουμε μόνο για n_head = 1 και 2;

@pxaris
Copy link
Contributor

pxaris commented May 1, 2024

Ναι, μπορείτε να κάνετε οποιοδήποτε λύση από αυτές που λέτε (ή να δοκιμάσετε για n_head = 5 επίσης). Γενικά, ενθαρρύνουμε τον πειραματισμό με ιδέες σαν κι αυτή που αναφέρετε, οι οποίες μπορούν να συγκριθούν και με τις προτεινόμενες υλοποιήσεις στην αναφορά σας.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants