PDF to Markdown #531
airman5573
started this conversation in
Today I Learned
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
번역을 위해 해외 pdf 문서를 markdown로 변환하고있다.
1, 380page 짜리 pdf를
https://smallpdf.com/kr/split-pdf을 사용해 챕터별로 분할 한다. (용량 줄이기)2. claude를 사용해 챕터별 폴더를 만들고 분할한 pdf파일을 넣는다.
3. codex를 사용해 pdf를 markdown으로 변환한다.
https://github.com/datalab-to/marker처음엔 이걸 썼는데 좀 별로였다.4. 이미지 까지는 제대로 처리 못해주기 때문에 옵시디언으로 pdf와 markdown 파일을 열어서 하나하나 비교해본뒤에 이미지를 올바른 위치에 넣는다. 스크린샷 찍은걸 바로 복붙할 수 있어서 옵시디언이 편했다.
힘들다...벌써 몇시간째. 오늘안에 못끝낼것 같다.
Beta Was this translation helpful? Give feedback.
All reactions