Skip to content
View kmj-1616's full-sized avatar

Block or report kmj-1616

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
kmj-1616/README.md

데이터분석가 권미정입니다! 👋

Metrics

Summary ❕

2024년 하반기 데이터분석가/데이터엔지니어 취업을 목표로 공부하고 있습니다. (2025년 2월 졸업 예정, 현재 졸업 유예 상태) 가장 관심 있는 도메인은 e-커머스, 게임, 금융입니다.

Skills 💪

Tech : 한 번 이상 다루어 본 기술&툴들

  • SQL을 통한 데이터 정제 및 가공, 분석 경험
  • Google Colab, SQL을 이용한 RPG 게임 유저들의 활동 데이터의 탐색적 데이터 분석, 데이터 엔지니어링 경험
  • Bigquery에서 SQL를 사용해 데이터 가공, 분석 경험
  • MySQL을 이용한 DB 설계 및 데이터베이스 구현, 인사이트 도출 경험
  • Kaggle을 이용한 머신러닝.딥러닝 경진대회의 탐색적 데이터 분석, 데이터 시각화, 베이스라인 모델, 성능 개선 경험
  • Numpy, Matplotlib을 이용한 데이터 처리 경험
  • Pandas를 이용한 데이터 처리 경험
  • R을 이용한 데이터 이용 및 데이터 전처리 경험
  • R을 이용한 T-test 및 분산분석
  • Android Studio에서 Kotlin을 이용한 간단한 앱 개발 경험
  • Python, Google Colab을 이용한 은행 앱 구글스토어 리뷰의 전처리, 텍스트마이닝 경험
  • R을 이용한 네이버 블로그 영화 리뷰의 전처리, 텍스트마이닝 경험
  • AWS DMS로 데이터를 수집하고 Amazon Kinesis로 스트리밍 데이터를 수집하는 경험
  • AWS Step Function을 통한 간단한 데이터 파이프라인 오케스트레이션 설계 경험
  • Amazon Comprehend로 호텔 리뷰 검토 및 Insight 도출 경험
  • Tableau를 활용한 카페 매출 대시보드 설계 경험
  • QGIS를 통한 2023 기준 GIS 데이터 shape 파일 단순화 작업 경험
  • UTM 파라미터와 GA4를 활용해 웹사이트 유입경로 데이터 수집 및 분석 경험
  • A/B 테스트 설계 및 결과 분석을 하고 프로덕트에 기능 적용 경험

앞으로 공부할 것들 📝

  • Python을 이용한 모델 개발 경험
  • 고객 세그먼트 분석 경험
  • 이커머스 프로젝트 수행 경험
  • A/B 테스트, 앱 분석 툴을 기반한 분석 및 Insight 도출 경험

Career ⭐

  • 오브젠 주식회사(2024.01.01 ~ 2024.02.29)
    • 현장실습생 2개월 근무
    • 팀에서 개발 중인 BI 제품 관련 업무
      • 기능 테스트 후 동작 에러 정리 및 보고
      • GS인증을 위한 GS사용자취급설명서 내 오타/오류 검토
    • 202312 기준 GIS 데이터 작업
      • QGIS: 전국 17개 시도 법정동기초구역 shape 데이터 단순화, 전국행정동.gpkg 파일 및 집계구 shp 파일 수정
      • Oracle SQL Developer: 건물원장, 법정동기초구역, 행정동, 집계구, 인구, 행정동-기초구역 관계 데이터를 내부 기준으로 수정, 매핑 후 테이블에 적재

Education 📖

동아대 경영정보학과(2020.03 ~ 2025.02 졸업예정)

  • 전공필수: R기반통계분석(B+) / MIS원론(B+) / 데이터사이언스개론(A) / 데이터베이스시스템(B+) / 시스템 분석 및 설계(A+)
  • 데이터사이언스 모듈: 프로그래밍 언어(A) / 빅데이터 분석(A+) / 데이터베이스 구축 및 활용(A+) / 유통/판매 데이터분석(A) / 텍스트 분석(A+) / 빅데이터 시각화(A+) / 고객데이터 분석(A+)
  • 디지털비즈니스 모듈: 서비스 기획 및 UX/UI 디자인(A) / 엑셀기반의 경영데이터분석(A) / 네트워크의 이해(A+) / 디지털비즈니스모델(A+) / ERP(B+) / 프로젝트 관리(B) / 기술경영(A+)

Study 👥

  • AWS Korea 동아대 IT 취업 동아리(2022.03.21 ~)

  • 동아대 CDS 빅데이터 전문가 교육 과정(2023.07.24 ~ 2023.08.14)

    • 멀티캠퍼스 [proDS] Brightics를 활용한 데이터 분석 실습 초급 이러닝 강의 수강
    • 승학캠퍼스 대면 Brightics 강의
    • CDS 경진대회 대비 문제풀이
  • 챗봇(ChatBot)과 핀테크 기반기술 배우기 교육(2023.04.12 ~ 2023.09.30)

    • 동아대 DECO 비교과 프로그램 참가
    • 한국핀테크지원센터의 교육 플랫폼 ‘핀에듀’와 한국금융연수원의 챗봇 사이버연수 프로그램을 활용한 실무기반 집중 교육
    • 수료
      • 4월 핀테크 기반기술 과정 수료증
      • 5월 핀테크와 금융의 미래 수료증
      • 6월 데이터 사이언스 역량강화 과정
  • 텍스트마이닝 스터디(2022.12.24 ~ 2023.02.20)

    • 활용 강의: 동아대 INSPIRE - python 텍스트마이닝
  • 안드로이드 스터디 for beginner(2022.08.20 ~ 2022.09.21)

  • 동아대 빅데이터 실무자 양성교육(2022.08.04 ~ 2022.08.06)

    • 내용
      • 빅데이터 통계적 분석 이론
      • R을 이용한 데이터 이용 및 데이터 전처리
      • 신뢰도 분석 및 교차 분석
      • 집단간 대응변수 차이 분석
      • T-test 및 분산분석
      • R 패키지를 활용한 회귀분석

Certificate 💡

  • GAIQ (2022.12.06)
  • SQLD(SQL 개발자) (2023.10.06)
  • 경영정보시각화능력 (필기합격)
  • 한국사능력검정시험 1급 (2024.10.31)

Projects ✨

데이터 엔지니어링 스터디 <견고한 데이터엔지니어링> 발표

  • 2주차 데이터 엔지니어링 수명 주기의 드러나지 않는 주요 요소(2024.09.24)
  • 6주차 데이터 엔지니어링 수명 주기의 2단계: 데이터 저장(2024.11.05)
  • 9주차 데이터 엔지니어링 수명 주기의 5단계: 데이터 서빙(2024.11.25)

회고 웹사이트 프로젝트 Past Forward 1기 (2024.03.05 ~ 2024.08.26)

<블레이드앤소울 유저들의 이탈 시점 예측> (2023.10.06 ~ 2023.11.20)

<리니지 게임유저 잔존가치를 고려한 고객 이탈예측> (2023.09.11 ~ 2023.10.05)

DB&SQL 스터디 데이터베이스 구축 미니 프로젝트(2023.08.28 ~ 2023.09.15)

  • 주제: 국내 OTT 서비스들의 DB 설계
  • MySQL WorkBench
  • OTT 산업 트렌드 분석, 요구사항 수집 및 분석, DB 개념적 설계, DB 논리적 설계, DB 물리적 설계, 데이터베이스 구현, 인사이트 및 방향성 도출

A/B 테스트 스터디 10주차 20장 발표(2023.09.19)

  • 발표 내용: <5부 20장 민감도 향상을 위한 트리거링> 트리거링의 예, 최적 및 보수적 트리거링, 전반적인 실험효과, 신뢰할 수 있는 트리거링, 일반적인 함정

A/B 테스트 스터디 8주차 17장 발표(2023.08.29)

  • 발표 내용: <5부 17장 온라인 종합 대조 실험에 사용되는 통계 이론> 2표본 t검정, p값과 신뢰구간, 정규성 가정, 1종 및 2종 오류와 검정력, 편향, 다중 테스트, 피셔의 메타 분석
  • 발표자료, 발표영상

A/B 테스트 스터디 6주차 11장 발표(2023.08.15)

  • 발표 내용: <3부 11 관측 인과 연구> 종합 대조 실험이 불가능한 경우, 관측 인과 연구를 위한 설계, 함정, 단절적 시계열과 회귀 불연속 설계 사례-연구 논문
  • 발표자료, 발표영상

A/B 테스트 스터디 5주차 7장 발표(2023.08.08)

  • 발표 내용: <2부 07 실험을 위한 지표와 종합 평가 기준> 비즈니스 지표로부터 실험에 적절한 지표 작성하기, 주요 지표를 OEC로 결합하기, OEC 사례-아마존의 이메일
  • 발표자료, 발표영상

A/B 테스트 스터디 4주차 6장 발표(2023.07.25)

  • 발표 내용: <1부 06 조직 운영을 위한 지표> 지표의 분류, 공식화, 평가, 진화, 추가 facebook의 광고 게시물 참여 지표 사례
  • 발표자료, 발표영상

A/B 테스트 스터디 3주차 4장 발표(2023.07.18)

  • 발표 내용: <1부 04 실험 플랫폼과 문화>의 실험 성숙도 모델, 실험 플랫폼의 구성요소, 추가 여기어때와 우아한형제들 등의 사례
  • 발표자료, 발표영상

A/B 테스트 스터디 1주차 1장 발표(2023.06.27)

  • 발표 내용: <1부 01 소개와 동기>의 온라인 종합 대조 실험의 용어들, 흥미로운 AB테스트 사례들, 추가 netflix의 사례
  • 발표자료, 발표영상

『Amazon SageMaker를 사용하여 완전한 기계 학습 사기 탐지 솔루션 배포』 Workshop 실습(2023.05.24)

『Analytics on AWS』 Workshop 실습(2023.03.29)

Data Engineering with AWS 13장 『인공 지능 및 머신 러닝 활성화』, 14장 『학습 여정의 첫 번째 부분 마무리』 발표(2023.03.28)

Data Engineering with AWS 10장 실습 『데이터 파이프라인 오케스트레이션』발표(2023.03.14)

  • 실습 블로깅
  • 발표 영상
  • 내용
    • 새 Lambda 함수 생성
    • SNS 주제 생성 및 이메일 주소 구독
    • 새 Step Function 상태 시스템 생성
    • AWS CloudTrail 및 Amazon EventBridge 구성

텍스트마이닝 연구 논문 조교(2022.12.24 ~ 2023.03.18)

  • 주제: 코로나19 기간(2020~2022) 내 국내은행 및 미국은행은 각각 어떤 주제(이슈)가 언급이 되었는가?
  • 내용
    • google-play-scraper를 활용한 우리은행, 롯데캐피탈, Bank Of America의 구글스토어 리뷰 데이터를 수집함.
    • 리뷰가 모두 출력되지 않고, 날짜별로 출력되지 않는 문제점을 개선함.
    • 텍스톰(Texttom)을 활용한 은행 앱 리뷰 데이터의 텍스트마이닝, 매트릭스, 담론분석, 감성분석, 토픽분석을 진행함.
    • Python을 활용해 BOA 리뷰 데이터 전처리를 하고, coherence 값을 구해 적절한 토픽 개수를 정하고 LDA 분석을 진행함.
    • 전처리된 리뷰 데이터가 별점, 날짜와 태깅되도록 하여 코로나19 이전과 이후의 토픽 변화 및 부정적인 리뷰와 연관된 토픽은 어떤 것인지 분석함.

Data Engineering with AWS 6장 실습 『AWS DMS로 데이터 수집』발표(2023.03.07)

  • 실습 블로깅
  • 발표 영상
  • 내용
    • 새 MySQL 데이터베이스 인스턴스 생성
    • Amazon EC2 인스턴스를 사용하여 데모 데이터 로드
    • DMS에 대한 IAM 정책 및 역할 생성
    • DMS 설정 구성 및 MySQL에서 S3로 전체 로드 수행
    • Amazon Athena로 데이터 쿼리

python 텍스트마이닝 26강 『단어연관 및 word network』, 29강 『한글 Document cluster』 발표(2023.02.20)

Data Engineering with AWS 5장 『데이터엔지니어링 파이프라인 설계』발표(2023.02.08)

  • 블로깅
  • 발표 영상
  • 내용
    • 데이터 파이프라인 아키텍처 접근
    • 데이터 소비자 식별 및 요구 사항 이해
    • 데이터 소스 식별 및 데이터 수집
    • 데이터 변환 및 최적화 식별
    • 데이터 마트에 데이터 로드

python 텍스트마이닝 25강 『한글 빈도분석과 WordCloud』 발표(2023.02.06)

  • 블로깅
  • 내용
    • 한글 파일 단어별 빈도세기 및 단어-빈도(TF) 만들기
    • wordcloud 작성하기

『머신러닝 딥러닝 문제해결 전략』 11장 발표(2023.01.30)

  • 블로깅 1, 블로깅 2
  • 발표 영상
  • 내용
    • <항공 사진 내 선인장 식별 경진대회> 탐색적 데이터 분석, 베이스라인, 성능 개선
    • 머신러닝 딥러닝 문제해결 전략 스터디 11주차 발표

Data Engineering with AWS 3장 『데이터 엔지니어 도구 키트』발표(2023.01.25)

  • 블로깅
  • 발표 영상
  • 내용
    • 데이터 수집을 위한 AWS 서비스 개요(Amazon DMS, Amazon Kinesis, Amazon MSK, Amazon AppFlow, Amazon Transfer Family, Amazon DataSync, AWS Snow 디바이스 제품군)
    • 데이터 변환을 위한 AWS 서비스 개요(AWS Lambda, AWS Glue, Amazon EMR)
    • 빅 데이터 파이프라인 조정을 위한 AWS 서비스 개요(AWS Glue Workflow, AWS Step Functions, MWAA)
    • 데이터 소비를 위한 AWS 서비스 개요(Amazon Athena, Amazon Redshift 및 Redshift Spectrum, Amazon QuickSight)

python 텍스트마이닝 20강 『LDA 결과의 시각화』 발표(2023.01.16)

  • 블로깅
  • 내용
    • LDA 결과의 시각화 명령어
    • 시각화 결과 분석

python 텍스트마이닝 15강 『Text Clustering 개념 및 활용』 발표(2023.01.06)

  • 블로깅
  • 내용
    • Text Clustering 개념
    • 거리 계산 방법
    • 군집화 방법

python 텍스트마이닝 12강 『단어 연관 분석과 Word Network』 발표(2022.12.30)

  • 블로깅
  • 내용
    • TF와 TF-IDF 개념
    • 단어 연관 분석 실습
    • Word Network 실습

『머신러닝 딥러닝 문제해결 전략』 9장 발표(2022.11.28)

  • 블로깅 1, 블로깅 2
  • 발표 영상
  • 내용
    • <향후 판매량 예측 경진대회> 베이스라인 모델
    • <향후 판매량 예측 경진대회> 성능 개선
    • 머신러닝 딥러닝 문제해결 전략 스터디 10주차 발표

『머신러닝 딥러닝 문제해결 전략』 8장 발표(2022.11.14)

  • 블로깅
  • 발표 영상
  • 내용
    • <안전 운전자 예측 경진대회> 베이스라인 모델
    • <안전 운전자 예측 경진대회> 성능 개선 1: LightGBM 모델
    • <안전 운전자 예측 경진대회> 성능 개선 2: XGBoost 모델
    • <안전 운전자 예측 경진대회> 성능 개선 3: LightGBM과 XGBoost 앙상블
    • 머신러닝 딥러닝 문제해결 전략 스터디 8주차 발표

『머신러닝 딥러닝 문제해결 전략』 7장 발표(2022.10.04)

  • 발표 자료: 블로깅 1, 블로깅 2
  • 발표 영상: 발표 영상
  • 개발 언어/라이브러리: Kaggle, Jupyter Notebook
  • 내용
    • <범주형 데이터 이진분류 경진대회> 탐색적 데이터 분석
    • <범주형 데이터 이진분류 경진대회> 데이터 시각화
    • 머신러닝 딥러닝 문제해결 전략 스터디 5주차 발표

『머신러닝 딥러닝 문제해결 전략』 3장 발표(2022.09.12)

  • 발표 자료: 블로깅
  • 발표 영상: 발표 영상
  • 개발 언어/라이브러리: Kaggle, Jupyter Notebook
  • 내용
    • 머신러닝 문제해결 프로세스 및 체크리스트
    • 딥러닝 문제해결 프로세스 및 체크리스트
    • 머신러닝 딥러닝 문제해결 전략 스터디 2주차 발표

DX Challenge 서포터즈 (2022.07.25~2022.12.29)

  • 공식 인스타그램: @dxchallenge-부산광역시, 패스파인더, 부산테크노파크 주관
  • 개인 대외활동 인스타그램: @meez_activitiy
  • 내용
    • 7월: DX Sprint(데이터를 활용한 앱 개발 프로젝트) 홍보 카드뉴스 제작
    • 8월: DX Sprint 참가자 및 멘토 인터뷰 진행, 우수 서포터즈 선정
    • 9월: DX Camp 파이썬 교육 참가
    • 9월: DX Camp(데이터 기반 기술 개발 및 창업지원 프로그램) 홍보 및 참가 후기 카드뉴스와 영상 기획 및 제작
    • 10월: DX 관련 용어(DX, MVP, UX/UI)와 DX Camp 참가 팀이 출시한 앱 리뷰 카드뉴스 기획 및 제작
    • 11월: 부산의 관광데이터 활용과 DX Camp 창업지원 홍보 카드뉴스 기획 및 제작, 우수 서포터즈 팀 선정
    • 12월: 서포터즈 해단식 최우수 서포터즈 선정

『데이터분석을 위한 SQL 레시피』 6장 발표(2022.05.20)

  • 발표 자료: 블로깅
  • 발표 영상: 발표 영상
  • 내용
    • SQL을 통해 1회 방문당 페이지 뷰를 날짜별로 집계 및 데이터 추출
    • 용도에 따라 URL에서 필요한 데이터를 추출 및 집계
    • 유입원별로 방문 횟수 또는 CVR 집계
    • 데이터 분석 스터디 5주차 발표

『데이터분석을 위한 SQL 레시피』 4장 발표(2022.05.06)

  • 발표 자료: 블로깅 1, 블로깅 2
  • 발표 영상: 발표 영상
  • 내용
    • Google Bigquery에서 SQL을 사용해 시계열 기반으로 데이터 집계
    • Z차트를 작성하기 위한 매출과 관련된 데이터 추출
    • 상품의 카테고리, 가격 등을 조합해 데이터의 특징 추출
    • ABC 분석을 위한 매출 구성비누계와 ABC 등급 계산
    • 팬 차트 작성을 위한 데이터 집약
    • 히스토그램 작성을 위한 데이터 추출
    • 데이터 분석 스터디 3주차 발표

Pinned Loading

  1. blog-post blog-post Public

    Python

  2. R_BigData R_BigData Public

    R

  3. donga-it-club/ML_DL_Problemsolving_Study donga-it-club/ML_DL_Problemsolving_Study Public

    3 1