Skip to content
This repository has been archived by the owner on Oct 17, 2024. It is now read-only.

LogicKor V2 Update #37

Merged
merged 11 commits into from
Jun 28, 2024
Merged

LogicKor V2 Update #37

merged 11 commits into from
Jun 28, 2024

Conversation

StableFluffy
Copy link
Collaborator

@StableFluffy StableFluffy commented Jun 28, 2024

LogicKor V2 Update

업데이트 동기

  • 일부 항목(E.g. 영어로 작성하라)에서 제대로 된 평가가 이루어지지 않았습니다.
  • 모델의 기본 템플릿을 사용함에 있어서 모델의 제대로 된 성능 평가가 힘들었습니다.

업데이트 사항

judge_template 수정

Template 내에서 사용 되는 용어 및 요구하는 답변의 조건들이 바뀌었습니다.

모델 템플릿 사용 방식 수정

generator에서 생성시 모델의 chat_template 파라미터를 사용합니다.

evaluator 수정

특정 폴더에 있는 generation 결과들을 한번에 평가합니다.

Merge 이전 Todo

  • 기존 jsonl로 사용하던 평가 템플릿을 py 파일로 전환

Further Work

템플릿이 수정되고 모델들의 성능이 좋아짐에 따라 상당수의 모델이 최고점에 가까운 점수를 얻고 있습니다. LogicKor-Hard등의 어려운 데이터를 포함한 데이터셋이 필요하다고 생각됩니다.
본 Repo를 확장하여 LogicKor-Hard를 포함한 여러 데이터를 기반으로 평가 할 수 있도록 하는 작업이 필요할 것 같습니다.

Contact

추가적인 이야기를 함께 나누고 싶으시다면,
https://instruct.kr/

@boxqkrtm
Copy link

#34 잘 들어갔네요

@StableFluffy StableFluffy merged commit eabb637 into main Jun 28, 2024
0 of 2 checks passed
Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants