- Email: [email protected]
- Blog: https://mjrecord.tistory.com
- Github: https://github.com/kmj-1616
- LinkedIn: www.linkedin.com/in/미정-권-08bb5b251
2024년 하반기 데이터분석가/데이터엔지니어 취업을 목표로 공부하고 있습니다. (2025년 2월 졸업 예정, 현재 졸업 유예 상태) 가장 관심 있는 도메인은 e-커머스, 게임, 금융입니다.
- SQL을 통한 데이터 정제 및 가공, 분석 경험
- Google Colab, SQL을 이용한 RPG 게임 유저들의 활동 데이터의 탐색적 데이터 분석, 데이터 엔지니어링 경험
- Bigquery에서 SQL를 사용해 데이터 가공, 분석 경험
- MySQL을 이용한 DB 설계 및 데이터베이스 구현, 인사이트 도출 경험
- Kaggle을 이용한 머신러닝.딥러닝 경진대회의 탐색적 데이터 분석, 데이터 시각화, 베이스라인 모델, 성능 개선 경험
- Numpy, Matplotlib을 이용한 데이터 처리 경험
- Pandas를 이용한 데이터 처리 경험
- R을 이용한 데이터 이용 및 데이터 전처리 경험
- R을 이용한 T-test 및 분산분석
- Android Studio에서 Kotlin을 이용한 간단한 앱 개발 경험
- Python, Google Colab을 이용한 은행 앱 구글스토어 리뷰의 전처리, 텍스트마이닝 경험
- R을 이용한 네이버 블로그 영화 리뷰의 전처리, 텍스트마이닝 경험
- AWS DMS로 데이터를 수집하고 Amazon Kinesis로 스트리밍 데이터를 수집하는 경험
- AWS Step Function을 통한 간단한 데이터 파이프라인 오케스트레이션 설계 경험
- Amazon Comprehend로 호텔 리뷰 검토 및 Insight 도출 경험
- Tableau를 활용한 카페 매출 대시보드 설계 경험
- QGIS를 통한 2023 기준 GIS 데이터 shape 파일 단순화 작업 경험
- UTM 파라미터와 GA4를 활용해 웹사이트 유입경로 데이터 수집 및 분석 경험
- A/B 테스트 설계 및 결과 분석을 하고 프로덕트에 기능 적용 경험
- Python을 이용한 모델 개발 경험
- 고객 세그먼트 분석 경험
- 이커머스 프로젝트 수행 경험
- A/B 테스트, 앱 분석 툴을 기반한 분석 및 Insight 도출 경험
- 오브젠 주식회사(2024.01.01 ~ 2024.02.29)
- 현장실습생 2개월 근무
- 팀에서 개발 중인 BI 제품 관련 업무
- 기능 테스트 후 동작 에러 정리 및 보고
- GS인증을 위한 GS사용자취급설명서 내 오타/오류 검토
- 202312 기준 GIS 데이터 작업
- QGIS: 전국 17개 시도 법정동기초구역 shape 데이터 단순화, 전국행정동.gpkg 파일 및 집계구 shp 파일 수정
- Oracle SQL Developer: 건물원장, 법정동기초구역, 행정동, 집계구, 인구, 행정동-기초구역 관계 데이터를 내부 기준으로 수정, 매핑 후 테이블에 적재
동아대 경영정보학과(2020.03 ~ 2025.02 졸업예정)
- 전공필수: R기반통계분석(B+) / MIS원론(B+) / 데이터사이언스개론(A) / 데이터베이스시스템(B+) / 시스템 분석 및 설계(A+)
- 데이터사이언스 모듈: 프로그래밍 언어(A) / 빅데이터 분석(A+) / 데이터베이스 구축 및 활용(A+) / 유통/판매 데이터분석(A) / 텍스트 분석(A+) / 빅데이터 시각화(A+) / 고객데이터 분석(A+)
- 디지털비즈니스 모듈: 서비스 기획 및 UX/UI 디자인(A) / 엑셀기반의 경영데이터분석(A) / 네트워크의 이해(A+) / 디지털비즈니스모델(A+) / ERP(B+) / 프로젝트 관리(B) / 기술경영(A+)
Study 👥
-
AWS Korea 동아대 IT 취업 동아리(2022.03.21 ~)
- 공부하고 싶은 분야의 스터디를 만들어 리더로 활동함.
- 머신러닝 딥러닝 문제해결 전략 스터디(2022.09.05 ~ 2023.02.13)
- AWS 데이터엔지니어링 스터디(2023.01.06 ~ 2023.03.28)
- A/B 테스트 스터디(2023.06.27 ~ 2023.09.26)
- 그외 참여한 스터디
- 화요일엔 나도 SQL 요리사!(2022.04.12 ~ 2022.07.22)
- DB&SQL 스터디(2023.06.28 ~ 2023.09.15)
- 데이터엔지니어링 스터디(2024.08.30 ~ 2024.11.25)
- 공부하고 싶은 분야의 스터디를 만들어 리더로 활동함.
-
동아대 CDS 빅데이터 전문가 교육 과정(2023.07.24 ~ 2023.08.14)
- 멀티캠퍼스 [proDS] Brightics를 활용한 데이터 분석 실습 초급 이러닝 강의 수강
- 승학캠퍼스 대면 Brightics 강의
- CDS 경진대회 대비 문제풀이
-
챗봇(ChatBot)과 핀테크 기반기술 배우기 교육(2023.04.12 ~ 2023.09.30)
-
텍스트마이닝 스터디(2022.12.24 ~ 2023.02.20)
- 활용 강의: 동아대 INSPIRE - python 텍스트마이닝
-
안드로이드 스터디 for beginner(2022.08.20 ~ 2022.09.21)
- 커리큘럼: Android Basics in Kotlin
-
동아대 빅데이터 실무자 양성교육(2022.08.04 ~ 2022.08.06)
- 내용
- 빅데이터 통계적 분석 이론
- R을 이용한 데이터 이용 및 데이터 전처리
- 신뢰도 분석 및 교차 분석
- 집단간 대응변수 차이 분석
- T-test 및 분산분석
- R 패키지를 활용한 회귀분석
- 내용
- GAIQ (2022.12.06)
- SQLD(SQL 개발자) (2023.10.06)
- 경영정보시각화능력 (필기합격)
- 한국사능력검정시험 1급 (2024.10.31)
- 2주차 데이터 엔지니어링 수명 주기의 드러나지 않는 주요 요소(2024.09.24)
- 6주차 데이터 엔지니어링 수명 주기의 2단계: 데이터 저장(2024.11.05)
- 9주차 데이터 엔지니어링 수명 주기의 5단계: 데이터 서빙(2024.11.25)
- 동아대 IT 취업 동아리에서 진행하고 있는 팀/개인 회고 작성 웹사이트 개발 프로젝트로, 데이터팀의 팀원으로 참여함.
- 데이터팀 노션
- 데이터팀 깃헙, 백엔드팀 깃헙, 프론트엔드팀 깃헙
- PastForward Ver.1 데이터 분석 보고서
- 회원가입 버튼명 A/B테스트 보고서
- 성공지표 대시보드
- 23년 2학기 연구학점제를 통해 개인 프로젝트를 진행함.
- 사용한 데이터
- 2023/10/06 데이터의 이해
- 2023/10/29 탐색적 데이터 분석
- 2023/11/20 문파(길드) 데이터 엔지니어링
- 23년 2학기 연구학점제를 통해 개인 프로젝트를 진행함.
- 사용한 데이터
- 2023/09/25 탐색적 데이터 분석
- 주제: 국내 OTT 서비스들의 DB 설계
- MySQL WorkBench
- OTT 산업 트렌드 분석, 요구사항 수집 및 분석, DB 개념적 설계, DB 논리적 설계, DB 물리적 설계, 데이터베이스 구현, 인사이트 및 방향성 도출
- 발표 내용: <5부 20장 민감도 향상을 위한 트리거링> 트리거링의 예, 최적 및 보수적 트리거링, 전반적인 실험효과, 신뢰할 수 있는 트리거링, 일반적인 함정
- 발표 내용: <5부 17장 온라인 종합 대조 실험에 사용되는 통계 이론> 2표본 t검정, p값과 신뢰구간, 정규성 가정, 1종 및 2종 오류와 검정력, 편향, 다중 테스트, 피셔의 메타 분석
- 발표자료, 발표영상
- 발표 내용: <3부 11 관측 인과 연구> 종합 대조 실험이 불가능한 경우, 관측 인과 연구를 위한 설계, 함정, 단절적 시계열과 회귀 불연속 설계 사례-연구 논문
- 발표자료, 발표영상
- 발표 내용: <2부 07 실험을 위한 지표와 종합 평가 기준> 비즈니스 지표로부터 실험에 적절한 지표 작성하기, 주요 지표를 OEC로 결합하기, OEC 사례-아마존의 이메일
- 발표자료, 발표영상
- 13장 요약 블로깅, 13장 실습 블로깅, 14장 블로깅
- 발표 영상
- 내용
- 인공 지능(AI)과 ML이 조직에 중요한 이유와 여러 AI용 AWS 서비스 및 ML용 AWS 서비스
- Amazon Comprehend로 리뷰 검토 실습
- AWS 계정 정리 방법
- 실습 블로깅
- 발표 영상
- 내용
- 새 Lambda 함수 생성
- SNS 주제 생성 및 이메일 주소 구독
- 새 Step Function 상태 시스템 생성
- AWS CloudTrail 및 Amazon EventBridge 구성
- 주제: 코로나19 기간(2020~2022) 내 국내은행 및 미국은행은 각각 어떤 주제(이슈)가 언급이 되었는가?
- 내용
- google-play-scraper를 활용한 우리은행, 롯데캐피탈, Bank Of America의 구글스토어 리뷰 데이터를 수집함.
- 리뷰가 모두 출력되지 않고, 날짜별로 출력되지 않는 문제점을 개선함.
- 텍스톰(Texttom)을 활용한 은행 앱 리뷰 데이터의 텍스트마이닝, 매트릭스, 담론분석, 감성분석, 토픽분석을 진행함.
- Python을 활용해 BOA 리뷰 데이터 전처리를 하고, coherence 값을 구해 적절한 토픽 개수를 정하고 LDA 분석을 진행함.
- 전처리된 리뷰 데이터가 별점, 날짜와 태깅되도록 하여 코로나19 이전과 이후의 토픽 변화 및 부정적인 리뷰와 연관된 토픽은 어떤 것인지 분석함.
- 실습 블로깅
- 발표 영상
- 내용
- 새 MySQL 데이터베이스 인스턴스 생성
- Amazon EC2 인스턴스를 사용하여 데모 데이터 로드
- DMS에 대한 IAM 정책 및 역할 생성
- DMS 설정 구성 및 MySQL에서 S3로 전체 로드 수행
- Amazon Athena로 데이터 쿼리
- 블로깅
- 발표 영상
- 내용
- 데이터 파이프라인 아키텍처 접근
- 데이터 소비자 식별 및 요구 사항 이해
- 데이터 소스 식별 및 데이터 수집
- 데이터 변환 및 최적화 식별
- 데이터 마트에 데이터 로드
- 블로깅
- 내용
- 한글 파일 단어별 빈도세기 및 단어-빈도(TF) 만들기
- wordcloud 작성하기
- 블로깅
- 발표 영상
- 내용
- 데이터 수집을 위한 AWS 서비스 개요(Amazon DMS, Amazon Kinesis, Amazon MSK, Amazon AppFlow, Amazon Transfer Family, Amazon DataSync, AWS Snow 디바이스 제품군)
- 데이터 변환을 위한 AWS 서비스 개요(AWS Lambda, AWS Glue, Amazon EMR)
- 빅 데이터 파이프라인 조정을 위한 AWS 서비스 개요(AWS Glue Workflow, AWS Step Functions, MWAA)
- 데이터 소비를 위한 AWS 서비스 개요(Amazon Athena, Amazon Redshift 및 Redshift Spectrum, Amazon QuickSight)
- 블로깅
- 내용
- LDA 결과의 시각화 명령어
- 시각화 결과 분석
- 블로깅
- 내용
- Text Clustering 개념
- 거리 계산 방법
- 군집화 방법
- 블로깅
- 내용
- TF와 TF-IDF 개념
- 단어 연관 분석 실습
- Word Network 실습
- 블로깅
- 발표 영상
- 내용
- <안전 운전자 예측 경진대회> 베이스라인 모델
- <안전 운전자 예측 경진대회> 성능 개선 1: LightGBM 모델
- <안전 운전자 예측 경진대회> 성능 개선 2: XGBoost 모델
- <안전 운전자 예측 경진대회> 성능 개선 3: LightGBM과 XGBoost 앙상블
- 머신러닝 딥러닝 문제해결 전략 스터디 8주차 발표
- 발표 자료: 블로깅 1, 블로깅 2
- 발표 영상: 발표 영상
- 개발 언어/라이브러리: Kaggle, Jupyter Notebook
- 내용
- <범주형 데이터 이진분류 경진대회> 탐색적 데이터 분석
- <범주형 데이터 이진분류 경진대회> 데이터 시각화
- 머신러닝 딥러닝 문제해결 전략 스터디 5주차 발표
- 발표 자료: 블로깅
- 발표 영상: 발표 영상
- 개발 언어/라이브러리: Kaggle, Jupyter Notebook
- 내용
- 머신러닝 문제해결 프로세스 및 체크리스트
- 딥러닝 문제해결 프로세스 및 체크리스트
- 머신러닝 딥러닝 문제해결 전략 스터디 2주차 발표
- 공식 인스타그램: @dxchallenge-부산광역시, 패스파인더, 부산테크노파크 주관
- 개인 대외활동 인스타그램: @meez_activitiy
- 내용
- 7월: DX Sprint(데이터를 활용한 앱 개발 프로젝트) 홍보 카드뉴스 제작
- 8월: DX Sprint 참가자 및 멘토 인터뷰 진행, 우수 서포터즈 선정
- 9월: DX Camp 파이썬 교육 참가
- 9월: DX Camp(데이터 기반 기술 개발 및 창업지원 프로그램) 홍보 및 참가 후기 카드뉴스와 영상 기획 및 제작
- 10월: DX 관련 용어(DX, MVP, UX/UI)와 DX Camp 참가 팀이 출시한 앱 리뷰 카드뉴스 기획 및 제작
- 11월: 부산의 관광데이터 활용과 DX Camp 창업지원 홍보 카드뉴스 기획 및 제작, 우수 서포터즈 팀 선정
- 12월: 서포터즈 해단식 최우수 서포터즈 선정