על חוות שרתים מעל ומתחת לאדמה

כל מי שעקב אחר מכרז נימבוס לבחירת ספקי ענן ציבורי שיקימו בארץ Region, קרא או שמע בוודאי כל מיני עיתונאים ועיתונאיות שתהו בקול מדוע לא נבחר ספק ענן X או ספק ענן Y, ואם זה לא הספיק, באתרי חדשות שונים פורסמו מאמרי דעה וראיונות עם כל מיני אלופים לשעבר שתהו איך זה שמדינת ישראל בוחרת בספקים שיקימו את חוות השרתים שלהם מעל האדמה, ומדוע פסלו ספקים שבונים את חוות השרתים שלהם מתחת לאדמה. אתמול פורסם ב-דה מרקר ראיון עם אביתר פרץ, מנהל מחלקת חדשנות ודיגיטל במינהל הרכש הממשלתי במשרד האוצר שענה על התהיה הזו, ועל שאלות שהועלו בראיון.

אחת הבעיות עם טענות כאלו, ללא קשר למכרז נימבוס, היא שספקות כאלו שמטילים ספקי ענן מתחרים, שמנהלים אחרים בעסקים פרטיים, קוראים את הדברים, והם חושבים על שינוי החלטה קרובה להקים תשתית וירטואלית אצל ספק ענן זה או אחר, בגלל אותן טענות שהועלו. גם עבדכם הנאמן קיבל תהיות כאלו ואחרות מלקוחות פוטנציאליים וקיימים (שאינם ממשלתיים) לגבי הסיכון הקמת תשתית וירטואלית אצל ספקים כאלו, ורציתי לענות על כך.

התשובה עצמה – קצת מורכבת, וברשותכם – אפרט.

ישנם כאלו שמתכננים או משתמשים בענן, כאילו מדובר באיזו חוות שרתים של סלקום/נטויז'ן או פרטנר או בזק: הם מקימים פתרון DR שאמור לעבוד באופן ידני או אוטומטי, במקרה של תקלת חשמל, תקשורת וכו'. כלומר אותם לקוחות מראש "ננעלים" על חוות שרתים זו או אחרת של ספק ענן ציבורי, וכאן המציאות העגומה עלולה לטפוח בפרצופו של הלקוח שעובד כך: אם חיזבאללה מחר ירה טילים כבדים לאזורים בהם נמצאים חוות שרתים והוא יפגע באותו בניין או מבנה עם חוות שרתים – ישנו סיכוי גבוה מאוד כי חוות השרתים תושבת, בין אם השרתים נמצאים מעל האדמה או 20 קומות מתחת לאדמה! מה שלא מספרים לאנשים, זו העובדה הפשוטה שיש תשתית שלמה (שאינה כוללת שרתים) שנמצאת מעל האדמה (מה לעשות, אותה תשתית דורשת חמצן…) וכשטיל פוגע באותה חווה, יש סיכוי גבוה שאותה תשתית שנמצאת למעלה – תושבת, וכתוצאה מכך, גם השרתים שנמצאים למטה יהיו מושבתים או מנותקים, כך שבסופו של יום, בין אם השרתים נמצאים עמוק באדמה או מעליה, הסיכוי גדול כי הפגיעה תשבית את התשתית.

מה שתמיד מומלץ ללקוחות לעשות, זה לעבוד עם הכלים והפלטפורמות של ספקי הענן הציבורי הגדולים בכל הקשור לשרידות, ולהזניח את שיטות ה-DR הקלאסיות. שלושת ספקי הענן הגדולים, לדוגמא, מאפשרים להקים תשתית וירטואלית של שרותים ומכונות VM שפועלות במקביל במספר Availability zones (או Regions), כך שאם AZ או Region (תלוי בטרמינולוגיה של ספק הענן הציבורי) נופל או נפגע, התשתית הוירטואלית של הלקוח תמשיך לפעול מה-AZ או ה-Region האחר שנמצא גיאוגרפית במיקום שונה. לאלו שמוכנים להשקיע עוד, ניתן אפילו לבנות זאת בצורה של שימוש ב-3 Regions (או Region נוסף מחוץ לישראל ו-2 Availability zones), כך שלא חשוב מה יקרה בישראל, המערכת של הלקוח עדיין תמשיך לעבוד. אפשרות נוספת (ותמיד מומלצת) היא שימוש ב-Multi Cloud תוך שימוש בשרותים של ספקי ענן ציבורי שונים והקמה של התשתית אצל ספקי ענן ציבורי שונים, כך שאם קורה מקרה נדיר בה כל התשתית של ספק ענן ציבורי כלשהו נופלת – המערכת של הלקוח תפעל אוטומטית מהתשתית של ספק ענן ציבורי אחר.

לסיכום: בניגוד לכל מיני הצהרות של כל מיני אלופים, אנשי שיווק ואחרים, אפשר בהחלט לבנות שרידות נאה, תוך שימוש בכלים סטנדרטיים (Terraform ואחרים, לדוגמא), בשרותים ובפלטפורמות שספקי הענן הציבורי הגדולים מציעים, בין אם חוות השרתים והשרתים נמצאים מעל או מתחת לאדמה, ופתרונות אלו יוכלו לשרוד גם במתקפת טילים שתהרוס חוות שרתים זו או אחרת.

4 תגובות בנושא “על חוות שרתים מעל ומתחת לאדמה”

  1. נו-נו, זו קושיה נאה למהנדסים עם נסיון במיגון.  לענ"ד עדיף לקבור את השרתים (*) ומעליהם את מערכת ה UPS עם המצברים ו\או גנרטורים עם גלגלי תנופה להמשכיות עד שהדיזלים מותנעים.  הרבה יותר מורכב להצטייד בשרתים (לך תייבא בזמן מלחמה ואולי טאיוואן תהיה בבעיה בעצמה), לבנות לחווה קוהרנטית ולהרים אותה מגיבויים במקום אחר מול שיפצור אספקת חשמל או קירור שנפגעו – ידע וציוד זמינים למדי.זה לא אומר שלא כדאי לבזר כצעד מונע תלות במתקן פיזי מסויים.* יש תקורת קירור מסויימת למתקן עמוק מול כזה שעל פני הקרקע אבל זו זניחה למדי.  שוב שאלת הנדסה אזרחית ומכונות למומחי מיזוג אוויר.

  2. זהו כמובן בהחלט נושא למהנדסים, ואפשר להתווכח מה עדיף ומה לא, אך בסופו של יום, הנקודה העיקרית שלי בפוסט היא שלקוח שיעבוד עם השרותים והפלטפורמות של ספקי ענן ציבוריים גדולים וידועים, יוכל לבנות שרידות שבעצם "מדלגת" מעל בעיה זו.

    אגב, לגבי הצטיידות בשרתים – לפחות באמזון ובמיקרוסופט (ונראה לי שגם גוגל, אבל עליהם אני לא סגור) – אין צורך בהזמנה מטיוואן, הואיל והם מקבלים את הלוחות ב-Bulk בכמויות גדולות, מוכנים להכנסה למארז, להכניס ספק, זכרון, מעבד וציוד נוסף בהתאם לספק – ולארון. הלוחות נמצאים כבר מחוץ לטיוואן (הם למדו לקח). במקרה של גוגל, הרבה יותר קל להם לשנות הגדרות תוך דקות ספורות, כך שדברים ירוצו באזורים אחרים, בהתאם להסכמים עם הלקוח.

  3. בתור אחד שעובד בשירותי ה DR של aws אני יכול להגיד שהטענות האלה הזויות. אין שום בעיה להשתמש בamazon DRS (לשעבר cloudEndure) כדי להבטיח ששרתים שנפגעו באתר אחד יחזרו לעבוד באתר אחר תוך שניות.

    1. ואתה בהחלט צודק. יחד עם זאת, התכוונתי ל-DR "קלאסי", במובן של להקים לדוגמא vSphere, להשתמש ב-SRM וכו', במובן הזה של "נעילה". מה שאתם מוכרים אפשר כמובן להקים אוטומטית לכל מקום ואזור בעולם.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.