Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于文章的几点疑问 #1

Open
selous123 opened this issue Jul 27, 2020 · 2 comments
Open

关于文章的几点疑问 #1

selous123 opened this issue Jul 27, 2020 · 2 comments

Comments

@selous123
Copy link

首先非常感谢你的非常优秀的工作。

其次在拜读了你的文章和复线你的代码之后,我有以下几个疑问,希望能得到你的答复。

  1. 为什么文章中对比方法中没有mmoe模型呢?我看你的代码中已经实现了mmoe方法(TAAN 结果要明显优于mmoe文章汇报的结果)

  2. 我在自己的业务场景下跑了TAAN的网络,在我的数据集场景下,结果震荡比较严重。请问这是正常的么?你之前有遇到过么?对于结果震荡你有什么调参的建议么?

@yingrliu
Copy link
Owner

您好,感谢您对这个工作的兴趣。关于您问的两个问题:

  1. 为什么文章中对比方法中没有mmoe模型呢?我看你的代码中已经实现了mmoe方法(TAAN 结果要明显优于mmoe文章汇报的结果)
    -- MMOE的结果是论文第一轮review之后根据reviewer的意见加上去的,我们跑了一下发现和hard-sharing的效果差不太多,受文章篇幅的限制没有加进去。

  2. 我在自己的业务场景下跑了TAAN的网络,在我的数据集场景下,结果震荡比较严重。请问这是正常的么?你之前有遇到过么?对于结果震荡你有什么调参的建议么?
    -- 你有加regularization term吗, 如果震荡很厉害,建议调小alpha和奇函数个数,或者先去掉regularization看一下。

@selous123
Copy link
Author

好的,非常感谢您的回复!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants