Day-Walk
diff --git a/‎.github/workflows/Deploy-ML-EC2.yml‎
Lines changed: 6 additions & 2 deletions b/‎.github/workflows/Deploy-ML-EC2.yml‎
Lines changed: 6 additions & 2 deletions
diff --git a/‎MLOps/app/main.py‎
Lines changed: 128 additions & 20 deletions b/‎MLOps/app/main.py‎
Lines changed: 128 additions & 20 deletions
diff --git a/‎MLOps/app/model/deepfm_model.pt.dvc‎
Lines changed: 5 additions & 0 deletions b/‎MLOps/app/model/deepfm_model.pt.dvc‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎MLOps/app/model/deepfm_train.py‎
Lines changed: 38 additions & 14 deletions b/‎MLOps/app/model/deepfm_train.py‎
Lines changed: 38 additions & 14 deletions
diff --git a/‎MLOps/app/model/key2index.pkl.dvc‎
Lines changed: 5 additions & 0 deletions b/‎MLOps/app/model/key2index.pkl.dvc‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎MLOps/app/model/label_encoders.pkl.dvc‎
Lines changed: 5 additions & 0 deletions b/‎MLOps/app/model/label_encoders.pkl.dvc‎
Lines changed: 5 additions & 0 deletions
@@ -15,18 +15,22 @@ jobs:
       uses: actions/checkout@v4
 
     - name: Deploy to EC2
-      uses: appleboy/[email protected]
+      uses: appleboy/[email protected]
+      env:
+        OPENAI_KEY: ${{ secrets.OPENAI_KEY }}
       with:
         host: ${{ secrets.EC2_HOST_ML }}
         username: ${{ secrets.EC2_USER }}
         key: ${{ secrets.EC2_SSH_KEY }}
-
+        port: 22
+        envs: OPENAI_KEY
         script: |
           # 프로젝트 디렉터리로 이동
           cd ~/MLOps
           
           # 최신 코드 받기
           git pull origin main
+          dvc pull
           
           # MLOps 디렉터리로 이동
           cd MLOps
 
@@ -1,26 +1,134 @@
-from fastapi import FastAPI, HTTPException
+"""
+MLOps 통합 API - 추천 시스템 + OpenAI 챗봇
+기존 추천 시스템과 새로운 OpenAI 챗봇을 하나의 API로 통합
+"""
+from fastapi import FastAPI, Request
+from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import JSONResponse
 import traceback
-from .schema.recommendation_schema import ReccomendRequest, ReccomendResponse
-from .services.elk_client import ELKClient
-from .services.deepctr_service import DeepCTRService
+import os
+from datetime import datetime
+
+# 라우터 임포트
+from app.routers import recommendation, chatbot
+
+# 환경 변수 설정
+OPENAI_API_KEY = os.getenv("OPENAI_API_KEY", "")
 
 app = FastAPI(
-    title="MLOps Recommendation API - Simple", 
-    version="1.0.0",
-    description="Place ID 기반 단순 추천 시스템"
+    title="MLOps 통합 API",
+    version="3.0.0",
+    description="추천 시스템 + OpenAI 데이트 코스 챗봇 통합 서비스"
 )
 
-# 서비스 초기화
-elk_client = ELKClient()
-deepctr_service = DeepCTRService()
-
-@app.get("/api/recommend", response_model=ReccomendResponse)
-async def recommend_places(request: ReccomendRequest):
-    """Place ID 리스트 기반 추천 API"""
-    try:
-        top_3_place_ids, other_places = deepctr_service.rank_places_by_ctr(request.user_id, request.query)
-        return JSONResponse(content={"top_3_place_ids": top_3_place_ids, "other_places": other_places})
-    except Exception as e:
-        traceback.print_exc()
-        raise HTTPException(status_code=500, detail=str(e))
+# CORS 설정 (백엔드 연동용)
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+
+# 전역 예외 핸들러
+@app.exception_handler(Exception)
+async def global_exception_handler(request: Request, exc: Exception):
+    print("=================== 에러 발생 ===================")
+    print(f"Request URL: {request.url}")
+    print(f"에러 타입: {type(exc).__name__}")
+    print(f"에러 메시지: {str(exc)}")
+    traceback.print_exc()
+    print("=============================================")
+    return JSONResponse(
+        status_code=500,
+        content={"detail": f"Internal Server Error: {str(exc)}"}
+    )
+
+# 라우터 등록
+app.include_router(recommendation.router)
+app.include_router(chatbot.router)
+
+@app.get("/")
+async def root():
+    """API 기본 정보"""
+    return {
+        "service": "MLOps 통합 API",
+        "version": "3.0.0",
+        "timestamp": datetime.now().isoformat(),
+        "services": {
+            "recommendation": {
+                "endpoint": "/api/recommend",
+                "description": "ELK + DeepCTR 기반 장소 추천",
+                "status": "active" if hasattr(recommendation, 'deepctr_service') else "inactive"
+            },
+            "chatbot": {
+                "endpoints": {
+                    "chat": "/api/chat",
+                    "stream": "/api/chat/stream",
+                    "stats": "/api/chat/stats"
+                },
+                "description": "OpenAI GPT 기반 데이트 코스 추천 챗봇",
+                "status": "active" if hasattr(chatbot, 'openai_service') else "inactive"
+            }
+        },
+        "documentation": "/docs"
+    }
+
+@app.get("/health")
+async def health_check():
+    """전체 서비스 헬스체크"""
+    # 추천 시스템 상태 확인
+    recommendation_status = "inactive"
+    if hasattr(recommendation, 'deepctr_service') and recommendation.deepctr_service:
+        recommendation_status = "active"
+    
+    # 챗봇 상태 확인
+    chatbot_status = "inactive"
+    if hasattr(chatbot, 'openai_service') and chatbot.openai_service:
+        chatbot_status = "active"
+    
+    # 전체 상태 결정
+    overall_status = "healthy" if (recommendation_status == "active" or chatbot_status == "active") else "unhealthy"
+    
+    return {
+        "status": overall_status,
+        "timestamp": datetime.now().isoformat(),
+        "services": {
+            "recommendation": recommendation_status,
+            "chatbot": chatbot_status
+        },
+        "active_chat_sessions": len(getattr(chatbot, 'active_sessions', {})),
+        "version": "3.0.0"
+    }
+
+@app.get("/stats")
+async def get_overall_stats():
+    """전체 서비스 통계"""
+    return {
+        "api_version": "3.0.0",
+        "services": {
+            "recommendation": {
+                "status": "active" if hasattr(recommendation, 'deepctr_service') else "inactive",
+                "type": "ELK + DeepCTR"
+            },
+            "chatbot": {
+                "status": "active" if hasattr(chatbot, 'openai_service') else "inactive",
+                "type": "OpenAI GPT",
+                "active_sessions": len(getattr(chatbot, 'active_sessions', {}))
+            }
+        },
+        "endpoints": {
+            "recommendation": ["/api/recommend", "/api/recommend/health"],
+            "chatbot": ["/api/chat", "/api/chat/stream", "/api/chat/stats", "/api/chat/health"]
+        },
+        "timestamp": datetime.now().isoformat()
+    }
+
+if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(
+        app,
+        host="0.0.0.0",
+        port=8000,
+        log_level="info"
+    )
@@ -0,0 +1,5 @@
+outs:
+- md5: b09e9178a0a585a1a42af895f763c06b
+  size: 191409
+  hash: md5
+  path: deepfm_model.pt
@@ -15,16 +15,16 @@ class DeepFMModdelTrain:
     def __init__(self, data_path):
         self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         self.data = pd.read_csv(data_path)
-        self.sparse_features = ["user_id", "user_name", "age", "gender", "place_id", "place_name","category", "sub_category"]
+        self.sparse_features = ["userid", "name", "age", "gender", "place_id", "place_name","category", "subcategory"]
         self.sequence_feature = "like_list"
         self.linear_feature_columns = None
         self.dnn_feature_columns = None
         self.feature_names = None
         self.model_input = None
         self.target = "yn"        
-        self.model_path = "/home/ubuntu/working/MLOps/MLOps/app/model/deepfm_model.pt"
-        self.encoders_path = "/home/ubuntu/working/MLOps/MLOps/app/model/label_encoders.pkl"
-        self.key2index_path = "/home/ubuntu/working/MLOps/MLOps/app/model/key2index.pkl"
+        self.model_path = "/home/ubuntu/MLOps/MLOps/app/model/deepfm_model.pt"
+        self.encoders_path = "/home/ubuntu/MLOps/MLOps/app/model/label_encoders.pkl"
+        self.key2index_path = "/home/ubuntu/MLOps/MLOps/app/model/key2index.pkl"
         self.model = None
         self.max_len = None
         self.label_encoders = {}
@@ -107,6 +107,24 @@ def predict(self, input_data):
             self.label_encoders = pickle.load(f)
         with open(self.key2index_path, 'rb') as f:
             self.key2index = pickle.load(f)
+
+        # 예측에 필요한 메타데이터 재구성
+        temp_like_list = self.data[self.sequence_feature].apply(ast.literal_eval)
+        self.max_len = max(len(x) for x in temp_like_list)
+
+        sparse_feature_names = ["userid", "name", "age", "gender", "place_id", "place_name", "category", "subcategory"]
+        
+        reconstructed_sparse_features = [SparseFeat(feat, vocabulary_size=len(self.label_encoders[feat].classes_), embedding_dim=4)
+                                         for feat in sparse_feature_names]
+        
+        reconstructed_sequence_feature = [VarLenSparseFeat(SparseFeat(self.sequence_feature,
+                                                                      vocabulary_size=len(self.key2index) + 1,
+                                                                      embedding_dim=4),
+                                                           maxlen=self.max_len, combiner='mean')]
+
+        self.linear_feature_columns = reconstructed_sparse_features + reconstructed_sequence_feature
+        self.dnn_feature_columns = reconstructed_sparse_features + reconstructed_sequence_feature
+        self.feature_names = get_feature_names(self.linear_feature_columns + self.dnn_feature_columns)
 
         # 입력 데이터를 DataFrame으로 변환
         if isinstance(input_data, dict):
@@ -115,13 +133,19 @@ def predict(self, input_data):
             input_df = input_data.copy()
 
         # sparse feature 전처리
-        sparse_feature_names = ["user_id", "user_name", "age", "gender", "place_id", "place_name","category", "sub_category"]
         for feature in sparse_feature_names:
-            input_df[feature] = input_df[feature].fillna("unknown")
-            # 학습 시 보지 못한 값은 'unknown'으로 처리
-            input_df[feature] = input_df[feature].apply(
-                lambda x: x if x in self.label_encoders[feature].classes_ else "unknown"
-            )
+            encoder = self.label_encoders[feature]
+            known_classes = set(encoder.classes_)
+            
+            # 'unknown'이 학습되었는지 확인
+            unknown_in_classes = 'unknown' in known_classes
+            
+            def transform_element(x):
+                if pd.isna(x) or x not in known_classes:
+                    return 'unknown' if unknown_in_classes else encoder.classes_[0]
+                return x
+
+            input_df[feature] = input_df[feature].apply(transform_element)
             input_df[feature] = self.label_encoders[feature].transform(input_df[feature])
 
         # sequence feature 전처리
@@ -153,19 +177,19 @@ def encode_sequence(x):
         return model.predict(model_input)
 
 if __name__ == "__main__":
-    deepfm_train = DeepFMModdelTrain("/home/ubuntu/working/MLOps/data/final_click_log.csv")
+    deepfm_train = DeepFMModdelTrain("../data/final_click_log.csv")
     deepfm_train.preprocess()
     model = deepfm_train.train()
     # 예시 데이터
     input_data = {
-        "user_id": ["0x06fa1ba7a7e44621a2338e6093e53341", "0x6d132cda535848e295b8e489486ea841", "0x0fa0a9c4a283451181b77d91e3229c91"],
-        "user_name": ["딩딩이", "댕댕이 언니", "에구궁"],
+        "userid": ["0x06fa1ba7a7e44621a2338e6093e53341", "0x6d132cda535848e295b8e489486ea841", "0x0fa0a9c4a283451181b77d91e3229c91"],
+        "name": ["딩딩이", "댕댕이 언니", "에구궁"],
         "age": [30, 60, 50],
         "gender": [1, 1, 0],
         "place_id": ["0xeb37b72b1fa54dc6a3867517ac2df6ef", "0x0528fbb073104d51974112a71d72b4e4", "0x1226fc5501194d2eba00383748045c20"],
         "place_name": ["롯데월드 쇼핑몰", "청아라 생선구이", "시골보쌈"],
         "category": ["쇼핑", "음식점&카페", "음식점&카페"],
-        "sub_category": ["전문매장/상가", "한식", "한식"],
+        "subcategory": ["전문매장/상가", "한식", "한식"],
         "like_list": ["[11, 12, 13, 14, 15, 16, 17, 18, 19, 20]", "[26, 22, 29, 44]", "[11, 28, 14, 29, 10, 22, 8, 25, 30]"]
     }
     prediction = deepfm_train.predict(input_data)
 
@@ -0,0 +1,5 @@
+outs:
+- md5: e0d99915c773ad623fb14d6e60f7b6d4
+  size: 216
+  hash: md5
+  path: key2index.pkl
@@ -0,0 +1,5 @@
+outs:
+- md5: 3c581e6414a751719352e4cd2c13f622
+  size: 17428
+  hash: md5
+  path: label_encoders.pkl