-
Notifications
You must be signed in to change notification settings - Fork 50
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
程序会卡在test Syncing处 #105
Comments
正常来说慢慢等就好了,会在timeout前搞定,你看看单卡走测试流程呢? |
我使用了4张h100,使用给出的config训练S3DIS数据集,只能跑出69.75%的精度,无法达到文中提到的73%精度,数据增强和超参数都与给出的config保持一致。请问可能是什么问题呀?运行这个config文件: semseg-pt-v3m1-1-rpe.py和semseg-pt-v3m1-0-rpe.py之间是什么区别呀 |
我最近做无监督预训练也有跑过,应该是能比较容易达到的。RPE是用了relative positional encoding,关闭flash attention和conditional positional encoding。当时的结论是s3dis上rpe好一些,不过后面随着预训练发展以及scaling up,搭配预训练下使用标准的ptv3 config也能达到最高的结结果,这些等今年晚点发布吧。 |
所以您汇报的73.6结果使用预训练了吗还是? |
Scratch结果应该是这样的,PPT(多数据集联合训练,最高)是用了标准的参数。现在其实不太推荐scratch了,小数据规模下带来的结论是不准确的。0,1 表示config编号 |
请问可以提供与Pointcept框架分离,第二种执行方式的ptv3的scratch训练脚本吗,如果您方便的时间可以提供我将不胜感激! |
Inference demo和Pointcept分离是有可能的,Training process和Pointcept分离是不可能的,因为Pointcept本身就是提供达到Sota的训练工具 |
感谢您的耐心回复! |
Inference的demo code有吗?我依据model.py初始化模型,加载model zoo里的模型看起来key不太匹配?匹配上key的value的维度好像也不太对,有一些实例代码吗?想直接把pretrain模型拿来用,加上Pointcept框架太冗余了 |
马上就能有,新的无监督预训练的工作发布后,会提供一些inference的demo以及one line code load model的方法,还请稍等。 |
我在s3dis数据集上,使用两张h100显卡训练
sh scripts/train.sh -g 2 -d s3dis -c semseg-pt-v3m1-0-base -n semseg-pt-v3m1-0-base
总是在在Syncing ...处卡住并最后time out,resume也会卡在这里
The text was updated successfully, but these errors were encountered: