Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

全电发票暂时还不能识别,请问大佬什么时候能支持一下,感激不尽 #7

Open
vanpersie9 opened this issue Nov 9, 2022 · 8 comments

Comments

@vanpersie9
Copy link

No description provided.

@sanluan
Copy link
Owner

sanluan commented Nov 9, 2022

ofd可以识别

@vanpersie9
Copy link
Author

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

@sanluan
Copy link
Owner

sanluan commented Nov 9, 2022

我这没有这类发票 后面可能要不同发票类型 不同地区区分处理了 这个识别主要是按位置逐行取文本的 不同地区 不同类型 排版差异较大

@vanpersie9
Copy link
Author

非常感谢大佬,目前测试和使用的还是比较顺畅的
目前有一些存在问题,我只能按照自己的笨方法先解决了一下,我给您说一下,您看可以改进一下
1、目前一些发票的detail模块存在规格型号也是纯数字的情况,在您的代码里面根据数字去判断的时候,就导致了规格,单位错位了
2、ofd存在一些特殊情况识别不出来,版式用的跟PDF的一样的格式,这种情况下就没办法识别,不知道咋回事,会报entry是Null,我只能先把ofd转成pdf再识别,但是转成pdf之后,最右侧的下载次数会被纳入到识别范围内,因为转换之后字体变化了,总体撑大了
3、没有方法能自动识别是全电发票还是老版的发票,我目前能想到的就是根据读出来的fulltext是否包含电子发票这种字样来判断是否为全电发票

@sanluan
Copy link
Owner

sanluan commented Nov 16, 2022

pdf识别部分没有特别理想的方法 就是根据各种线索 把发票种类先识别出来 然后针对不同类型不同地区的发票做 位置适配,目前的代码里面通用性 已经比较难提升了
ofd是直接读取的文件里面的发票数据

@82kg
Copy link

82kg commented Oct 9, 2023

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

pdf的全电,我搞定了。 OFD的全电,用作者方法,读不到内容

@mejinke
Copy link

mejinke commented Nov 2, 2023

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

pdf的全电,我搞定了。 OFD的全电,用作者方法,读不到内容

怎么做的呢?我们现在好多也是全电发票

@qlmajun
Copy link

qlmajun commented Nov 9, 2023

现在遇到了部分全电发票是pdf的,type能否识别为全电,另外大致的都能识别出来,buyer和seller的定位是错的,不知道大佬能否帮忙看是否可以支持一下,感激不尽

pdf的全电,我搞定了。 OFD的全电,用作者方法,读不到内容

能分享一下吗

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants