2023.08.04 ~ 2023.09.04
Field | Stack |
---|---|
API Back-end | |
Data Warehouse | |
ETL & ELT | |
Dashboard | |
CI/CD | |
Event Logging | |
ETC |
.
├── .github
│ ├── workflows
│ │ ├── scraper.yml
│ │ └── test.yml
├── README.md
├── airflow
│ ├── Dockerfile.mac
│ ├── Dockerfile.ubuntu
│ ├── README.md
│ ├── dags
│ │ ├── sqls
│ │ │ ├── athena
│ │ │ │ ├── create_company_detail.sql
│ │ │ │ ├── create_daily_jd_table.sql
│ │ │ │ ├── create_jd_preferred_english_nouns.sql
│ │ │ │ ├── create_jd_preferred_korean_nouns.sql
│ │ │ │ ├── create_jd_primary_responsibility_english_nouns.sql
│ │ │ │ ├── create_jd_primary_responsibility_korean_nouns.sql
│ │ │ │ ├── create_jd_required_english_nouns.sql
│ │ │ │ ├── create_jd_required_korean_nouns.sql
│ │ │ │ ├── create_jd_skills.sql
│ │ │ │ ├── create_jd_welfare_english_nouns.sql
│ │ │ │ └── create_jd_welfare_korean_nouns.sql
│ │ │ ├── redshift
│ │ │ │ ├── create_unique_jds.sql
│ │ │ │ ├── drop_schema.sql
│ │ │ │ ├── drop_unique_jds.sql
│ │ │ │ └── initialize_external_schema.sql
│ │ ├── athena_query.py
│ │ ├── glue_crawler.py
│ │ ├── glue_etl_job.py
│ │ ├── glue_nlp_job.py
│ │ ├── jobplanet_api_call.py
│ │ ├── jumpit_api_call.py
│ │ ├── rallit_api_call.py
│ │ ├── redshift_elt_query.py
│ │ └── wanted_api_call.py
│ ├── docker-compose.mac.yaml
│ ├── docker-compose.ubuntu.yaml
│ ├── plugins
│ │ ├── aws_athena_operator.py
│ │ ├── aws_redshift_operator.py
│ │ └── long_http_operator.py
│ └── requirements.txt
├── appspec.yml
├── eda
│ ├── Dockerfile
│ ├── EDA-spark.ipynb
│ ├── EDA.ipynb
│ ├── docker-compose.yml
│ ├── font
│ │ └── applegothic.ttf
│ └── requirements.txt
├── glue
│ ├── 1st_preprocessing
│ │ ├── de1_1_1st_preprocessing_notebook.ipynb
│ │ └── de1_1_1st_preprocessing_script.py
│ └── 2nd_preprocessing
│ └── de1_1_2nd_preprocessing_script.py
├── scraper_server
│ ├── Dockerfile
│ ├── api
│ │ └── scraper.py
│ ├── docker-compose.yml
│ ├── main.py
│ ├── plugin
│ │ ├── jobplanet_class.py
│ │ ├── jumpit_class.py
│ │ ├── rallit_class.py
│ │ └── wanted_class.py
│ ├── requirements.txt
│ ├── server.py
│ └── test_app.py
└── monitoring
├── s3_event_rule.json
├── s3_alert_lambda.py
├── glue_job_event_rule.json
├── glue_job_alert_lambda.py
└── glue_job_read_iam.json
Directory | Explanation |
---|---|
.github |
github actions 관련 파일 |
airflow/dags |
airflow dag 관련 파일 |
airflow/dags/sqls |
athena 및 redshift 쿼리 모음 |
eda |
eda 모음 |
glue |
1차 & 2차 전처리 glue job 관련 파일 |
scraper_server |
각종 플랫폼으로부터 데이터를 스크래핑하는 Fast API 파일 모음. $ python server.py |
monitoring |
이벤트 로깅(모니터링) 관련 파일 |