-
Notifications
You must be signed in to change notification settings - Fork 1.3k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
批处理去水印功能建议 #209
Comments
https://www.cnblogs.com/stronghorse/p/14572080.html `用正则表达式对PDF文件内容进行替换 喜欢这个功能的人喜欢到骨子里,甚至有人相信这个功能无所不能;讨厌这个功能的人也能讨厌到骨子里,甚至认为这个功能根本就是个坑。而我自己为了使用这个功能,《PDF Reference》也不知道翻了多少遍。 当年和国外某PDF软件开发者讨论这个功能的时候,他直接说我开发这个功能就是在打开潘多拉的盒子,所以我相信无论是过去、现在还是将来,都不会有哪家严肃的软件公司会开发出竞品。` 他们经常用这样的正则表达式去水印,异常简单: |
原理是一样的,但是靠正则不能处理各种水印。只有采用通配符处理原始字节码才行。 另外,PDFCommander表面上是一个万能水印工具,其实本质上是一个PDF命令行编辑工具。只是对外宣传说水印方便菜鸟理解而已,毕竟你不能让菜鸟用命令行去编辑PDF。 命令行的好处是可以批量处理同一批次的PDF文档。 |
最理想的是做文档分析,并输出。类似上面的图。 |
不见得用正则表达式匹配处理就是必由之路。 |
修改itextsharp的PDFString,增加HexValue,在解析token的时候,给Value和HexValue都赋值。 这样输出Tj就可以支持字符串和16进制码了 例如你发的那个test2.pdf,输出是这样的: |
PDFCommander 更新到 v1.20 基本可以应付99.9的PDF水印。最新版的删除指令段功能可以处理Contents中全部的曲线水印。 这个issus可以关闭了 |
Enfocus Pitstop的操作逻辑太过复杂,软件体积也太大,不适合补丁丁的实现
可以参考一下这个PDF工具箱的操作逻辑:PDF去水印
批量去水印的功能需求应该是蛮大的
The text was updated successfully, but these errors were encountered: