Skip to content

Latest commit

 

History

History
158 lines (105 loc) · 9.42 KB

Cold Start - Uber.md

File metadata and controls

158 lines (105 loc) · 9.42 KB
github
true

پیمان: 😕 بچه‌ها، من یه مشکل جدی پیدا کردم توی سیستم مسیریابی‌مون. هر وقت که سرویس‌مون رو ری‌استارت می‌کنیم، یا وقتی که یه نود جدید به کلاستر Redis اضافه می‌شه، برای چند دقیقه اول عملکرد سیستم خیلی کند می‌شه. انگار که Redis داره از صفر شروع می‌کنه به ساختن کش. این مشکل باعث می‌شه که کاربرا توی اون زمان تجربه خیلی بدی داشته باشن و ممکنه حتی نتونن از سرویس استفاده کنن. من نمی‌دونم چطور باید حلش کنیم.

حسین: 🤔 آها، فهمیدم پیمان جان. این مشکلی که داری توصیف می‌کنی، در دنیای مهندسی نرم‌افزار به "Cold Start" معروفه. این مشکل خصوصاً در سیستم‌های کش مثل Redis خیلی رایجه.

ماهان: 🙋‍♂️ ببخشید که می‌پرم وسط حرفتون، ولی می‌شه یه کم بیشتر توضیح بدین این Cold Start چیه؟ ترجیحاً با یه مثال کد؟

حسین: 😊 البته ماهان جان. ببین، Cold Start زمانی اتفاق می‌افته که سیستم کش ما، در این مورد Redis، خالیه یا داده‌های قدیمی داره. بذار با یه مثال کد توضیح بدم:

import redis
import time

r = redis.Redis(host='localhost', port=6379, db=0)

def get_user_data(user_id):
    # سعی می‌کنیم داده رو از کش بگیریم
    cached_data = r.get(f"user:{user_id}")
    
    if cached_data is None:
        # اگه داده توی کش نباشه، از دیتابیس می‌گیریم
        # این عملیات معمولاً کنده
        db_data = fetch_from_database(user_id)  # فرض کنید این تابع وجود داره
        
        # داده رو توی کش ذخیره می‌کنیم
        r.set(f"user:{user_id}", db_data)
        
        return db_data
    
    return cached_data

# شبیه‌سازی درخواست‌های کاربر
start_time = time.time()
for i in range(1000):
    get_user_data(i)
end_time = time.time()

print(f"زمان اجرا: {end_time - start_time} ثانیه")

توی این مثال، اولین بار که برنامه اجرا می‌شه، کش خالیه و برای هر کاربر باید از دیتابیس داده بگیریم. این باعث می‌شه که اجرای برنامه خیلی کند باشه.

پیمان: 😯 آها، حالا فهمیدم. پس مشکل ما اینه که وقتی سرویس رو ری‌استارت می‌کنیم، کش خالی می‌شه و باید از اول پر بشه. این باعث می‌شه که برای مدتی سیستم کند کار کنه. درسته؟

حسین: 👍 دقیقاً پیمان جان. حالا، برای حل این مشکل، ما می‌تونیم از تکنیک‌هایی به اسم "Cache Warming" یا "گرم کردن کش" استفاده کنیم. این تکنیک‌ها کمک می‌کنن که قبل از اینکه ترافیک واقعی به سیستم برسه، کش رو با داده‌های مهم پر کنیم. 🔗

ماهان: 🤓 می‌شه یه مثال کد از این Cache Warming هم بزنید؟

حسین: 😃 حتماً ماهان جان. ببین، ما می‌تونیم یه اسکریپت بنویسیم که موقع راه‌اندازی سیستم اجرا بشه و کش رو با داده‌های پرکاربرد پر کنه. مثلاً:

import redis
import threading

r = redis.Redis(host='localhost', port=6379, db=0)

def warm_cache():
    # لیستی از آیدی‌های کاربران پرکاربرد
    popular_user_ids = get_popular_user_ids()  # فرض کنید این تابع وجود داره
    
    def warm_user_data(user_id):
        if not r.exists(f"user:{user_id}"):
            data = fetch_from_database(user_id)
            r.set(f"user:{user_id}", data)
    
    # استفاده از چند thread برای سرعت بیشتر
    threads = []
    for user_id in popular_user_ids:
        t = threading.Thread(target=warm_user_data, args=(user_id,))
        t.start()
        threads.append(t)
    
    for t in threads:
        t.join()

# این تابع رو موقع راه‌اندازی سیستم صدا می‌زنیم
warm_cache()

این کد، کش رو با داده‌های کاربران پرکاربرد پر می‌کنه، که باعث می‌شه سیستم سریع‌تر به حالت بهینه برسه.

مارال: 🧐 این ایده خوبیه حسین. ولی آیا این روش می‌تونه مقیاس‌پذیری سیستم رو تحت تأثیر قرار بده؟

حسین: 🤔 سؤال خوبیه مارال جان. بله، این روش می‌تونه روی مقیاس‌پذیری تأثیر بذاره، خصوصاً اگه تعداد داده‌هایی که می‌خوایم پیش‌گرم کنیم زیاد باشه. برای حل این مسئله، ما می‌تونیم از چند تا تکنیک استفاده کنیم:

  1. Incremental Warming: به جای اینکه همه داده‌ها رو یکجا گرم کنیم، می‌تونیم این کار رو به تدریج انجام بدیم.

  2. Prioritized Warming: داده‌های مهم‌تر رو اول گرم کنیم.

  3. Distributed Warming: از چند نود برای گرم کردن کش استفاده کنیم.

پیمان: 😃 وای چقدر عالی! حسین جان، می‌شه یه کم بیشتر در مورد Incremental Warming توضیح بدی؟ فکر کنم این روش برای سیستم ما مناسب‌تر باشه.

حسین: 👨‍🏫 البته پیمان جان. Incremental Warming یعنی ما کش رو به تدریج و در طول زمان گرم می‌کنیم، نه یکهو. این روش کمک می‌کنه که فشار روی سیستم کمتر بشه. بذار یه مثال کد بزنم:

import redis
import time
import schedule

r = redis.Redis(host='localhost', port=6379, db=0)

def incremental_warm():
    # گرفتن لیست آیدی‌های کاربران که هنوز کش نشدن
    users_to_cache = get_users_not_in_cache()  # فرض کنید این تابع وجود داره
    
    # گرم کردن 100 کاربر در هر اجرا
    for user_id in users_to_cache[:100]:
        if not r.exists(f"user:{user_id}"):
            data = fetch_from_database(user_id)
            r.set(f"user:{user_id}", data)
    
    print(f"{len(users_to_cache[:100])} کاربر به کش اضافه شدند.")

# اجرای تابع هر 5 دقیقه
schedule.every(5).minutes.do(incremental_warm)

while True:
    schedule.run_pending()
    time.sleep(1)

این کد هر 5 دقیقه 100 کاربر رو به کش اضافه می‌کنه. این روش از overload شدن سیستم جلوگیری می‌کنه و اجازه می‌ده که سیستم به تدریج بهینه بشه.

ماهان: 🤯 وای چقدر جالب! ولی اگه یه کاربر درخواست داده‌ای رو بده که هنوز کش نشده چی می‌شه؟

حسین: 😊 سؤال خوبیه ماهان جان. در این حالت، ما از یه تکنیک به اسم "Cache-Aside" یا "Lazy Loading" استفاده می‌کنیم. یعنی اگه داده توی کش نبود، اون رو از دیتابیس می‌گیریم و بعد توی کش ذخیره می‌کنیم. بذار یه مثال کد بزنم:

import redis

r = redis.Redis(host='localhost', port=6379, db=0)

def get_user_data(user_id):
    # سعی می‌کنیم داده رو از کش بگیریم
    cached_data = r.get(f"user:{user_id}")
    
    if cached_data is None:
        # اگه داده توی کش نبود، از دیتابیس می‌گیریم
        db_data = fetch_from_database(user_id)
        
        # داده رو توی کش ذخیره می‌کنیم
        r.set(f"user:{user_id}", db_data)
        
        return db_data
    
    return cached_data

این روش اطمینان می‌ده که حتی اگه داده‌ای هنوز کش نشده باشه، کاربر می‌تونه بهش دسترسی داشته باشه. البته اولین درخواست ممکنه کمی کندتر باشه، ولی درخواست‌های بعدی سریع خواهند بود. 🔗

مارال: 👏 عالیه حسین. فکر می‌کنم با ترکیب Incremental Warming و Cache-Aside، ما می‌تونیم مشکل Cold Start رو حل کنیم و در عین حال مقیاس‌پذیری سیستم رو هم حفظ کنیم. پیمان، می‌تونی این راه‌حل رو پیاده‌سازی کنی و نتایج رو به تیم گزارش بدی؟

پیمان: 😃 حتماً مارال جان. ممنون حسین برای توضیحات کامل. من الان می‌رم روی پیاده‌سازی این راه‌حل کار می‌کنم و نتایج رو به زودی به همه گزارش می‌دم.

حسین: 🙌 خواهش می‌کنم پیمان جان. اگه حین پیاده‌سازی به مشکلی برخوردی، حتماً بهم بگو. موفق باشی!