-
Notifications
You must be signed in to change notification settings - Fork 19
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
label数值和具体类别不是固定对应的? #1
Comments
并且label数值不一致的话,如何推理输出数值映射的标签呢 |
这里应该是每次随机选择N个类别的K个样本,一个N*K个样本作为support set,再选择这N个类别里的Q个样本作为query set。 |
@xpxpx 普通的有监督训练,不同批次训练标签肯定都是一致的,任务也是一致,学习原始数据到相应目标标签(数值)的映射,不断迭代至收敛。这里不同批次各类别的数据绑定的label数值都不一样,如何学习对应的映射,而且还能收敛。。有点不太理解 |
@hurricanedjp 这里的任务本质上是一个匹配的任务,每次随机选择K个类别的数据,算出这K个类别数据在特征空间中的位置,然后再计算测试数据在特征空间中和这K个类别的距离,根据距离来判断测试数据的类别。 |
@xpxpx 多谢回复,我可能大概理解你的意思。对于每一个选出来的类,模型都是在做query和类原型的匹配任务,并将这个任务的匹配度(或者匹配距离)映射到对应的label数值? |
@xpxpx 另外因为数据没有负样本,对于不属于数据集中类别的样本要建一个新类么,或者说负类(涵盖范围较广)。inference如何处理呢,对匹配度logits设个阈值么?当然这个我也看过,对于我自己的数据,模型虽然收敛,但logits数值比较大有点不好操作 |
@xpxpx https://mp.weixin.qq.com/s/fnR_-B0PEnSpnwDN9r6btg 清华刚放出了FewReal2,就是我说的不属于数据集中任一类别样本的情况了 |
@hurricanedjp 这个我看了,一般的小样本学习问题的定义是query set的数据类别都是在support set内出现的。但是实际问题,没有那么完美。query set中会出现不属于support set的类别,也就是清华那篇文章提出的具有挑战的问题。 |
MLMAN/models/data_loader.py
Line 220 in 43cbbdb
target_classes = random.sample(self.rel2scope.keys(), N)
类别是随机选的每次类别顺序不一样,但是query label数值却是递增的。所以不同的batch,相同类别对应label数值是不同的,也就是不固定的。请问模型为什么能收敛呢?
The text was updated successfully, but these errors were encountered: