Skip to content

过滤path路径,提取第三方路径,删除mimetype内容,过滤静态后缀,删除空行+去重+排序

License

Notifications You must be signed in to change notification settings

ffffffff0x/pathtrim

Repository files navigation

pathtrim

过滤path路径

使用

./pathtrim

# 自动读取 input.txt
# 删除 output.txt
# 删除 output2.txt  (第三方链接)
# 删除 output3.txt  (可能需要人工确认的path)

rule

  1. 提取第三方路径

以 http:// 等协议开头的行

http://
https://
dict://
jar://
ldap://
netdoc://
ftp://
sftp://
tftp://
  1. 删除mimetype内容

见 mimetype.txt

  1. 过滤静态后缀
(?i)(.*\.(md|woff|3g2|3gp|7z|aac|abw|aif|aifc|aiff|arc|au|avi|azw|bin|bmp|bz|bz2|cmx|cod|csh|css|csv|doc|docx|eot|epub|gif|gz|ico|ics|ief|jar|jfif|jpe|jpeg|jpg|m3u|mid|midi|mjs|mp2|mp3|mpa|mpe|mpeg|mpg|mpkg|mpp|mpv2|odp|ods|odt|oga|ogv|ogx|otf|pbm|pdf|pgm|png|pnm|ppm|ppt|pptx|ra|ram|rar|ras|rgb|rmi|rtf|snd|svg|swf|tar|tif|tiff|ttf|vsd|wav|weba|webm|webp|woff2|woff|xbm|xls|xlsx|xpm|xul|xwd|zip|zip|exe|mp4|flv|less)\?.*)|(.*\.(md|woff|3g2|3gp|7z|aac|abw|aif|aifc|aiff|arc|au|avi|azw|bin|bmp|bz|bz2|cmx|cod|csh|css|csv|doc|docx|eot|epub|gif|gz|ico|ics|ief|jar|jfif|jpe|jpeg|jpg|m3u|mid|midi|mjs|mp2|mp3|mpa|mpe|mpeg|mpg|mpkg|mpp|mpv2|odp|ods|odt|oga|ogv|ogx|otf|pbm|pdf|pgm|png|pnm|ppm|ppt|pptx|ra|ram|rar|ras|rgb|rmi|rtf|snd|svg|swf|tar|tif|tiff|ttf|vsd|wav|weba|webm|webp|woff2|woff|xbm|xls|xlsx|xpm|xul|xwd|zip|zip|exe|mp4|flv|less|vue))
  1. 删除空行+去重+排序

  2. 开头自动加 "/"

  3. 双 // 过滤

About

过滤path路径,提取第三方路径,删除mimetype内容,过滤静态后缀,删除空行+去重+排序

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages