-
Notifications
You must be signed in to change notification settings - Fork 2.2k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
测试精度对不齐 #15
Comments
测试代码请详见:PR-531 |
@tackhwa |
@tackhwa |
好的,我已经使用该脚本成功复现论文里的精度了,看来是 prompt 不同导致我之前的脚本复现不了论文里的精度。 |
你好,我直接跑出来精度有些偏差,请问是必须要在.env里提供对应的API跑出来的精度才能对上吗? |
是的,我记得官方好像当时用的是4o作为评判,但是我用deepseek2.5跑出来的结果也大差不差。 |
你好,再请教一下,如果不使用4o,采用deePseek2.5的话API的话,只需要在.env里配置一下deepseek的API key就可以了吗?还是说也要有其他地方的改动。 |
以前的代码不支持deepseek2.5作为评判,我是改了源代码的,忘了哪个文件了,好像是
|
System Info
我对 Janus-1.3B 进行了测试,发现得到的精度和论文里的不一样,以下是我测试得到的精度:
POPE
,MMMU
,MMVet
的精度可以说是都对的的上,但是MME-perception
和MMB
的进度差了太多了,我这里怀疑是不是环境以及模型配置和官方的不一样所导致的,所以这里想请问官方的测试环境以及参数设置,以及会不会开放测试代码。The text was updated successfully, but these errors were encountered: