Skip to content

对于韩国发票,OCR识别的内容不正确 #177

@java-my-life

Description

@java-my-life

System Info / 系統信息

unbuntu 24

Who can help? / 谁可以帮助到您?

在使用OCR识别时,对韩国发票内容抽取出的结果与实际原文不相符。
以下为发票原图。

Image

Information / 问题信息

  • The official example scripts / 官方的示例脚本
  • My own modified scripts / 我自己修改的脚本和任务

Reproduction / 复现过程

请求报文:

{
"model": "glm-ocr",
"messages": [
{
"role": "user",
"content": [
{
"type": "image_url",
"image_url": {
"url": "data:image/png;base64,图片的base64编码"
}
},
{
"type": "text",
"text": "OCR"
}
]
}
],
"max_tokens": 8192,
"temperature": 0,
"top_p":1,
"presence_penalty": 0,
"frequency_penalty": 0
}

输出后的内容为:
상호: 고교초지원 어떤도움 [대표자: 이영지원 1 사업번호: 016-23-76782 TEL: 01000000000 주소: 서울 영동포구 어떤도움67급 11 1층 인사침번호 매표준 IC 승인 CATID: 17758****1 일본번호: 7465 4386-76****-1905 거래번호: 24/12/23 21:22:46 승인번호: 06534229 거래번호: 012963963 NGKNAK/I/ETHERNET 이번번호 상황리드 발행: (입시시급) 거래번호: 141,364 원 부 가지: 14,198 출货 개기: 155,500 원 (OS2전표/중구매인플기) 저자서명전표 생생P: 0 저장P: 0 저장 부적P: 10.500젃 고유번호: 2122-4618-4545 감사입니다! (고직용)

Image 总金额、增值税等内容识别出的文字与实际原图不相符

Expected behavior / 期待表现

输出与原图相符的内容

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions