מעבדי Cooper Lake של אינטל (Xeon SP דור 3)

אינטל הציגה לאחרונה את מעבדי ה-Xeon SP דור 3. סביר להניח שאם אתם לא ממש בודקים חדשות לגבי מעבדים, לא ממש שמעתם הרבה דברים על כך, והסיבה לכך היא שהפעם אינטל החליטה לחלק את ההכרזה ל-2: מעבדים לשרתים בעלי 4 ו-8 מעבדים (שם קוד: Cooper Lake) עכשיו, ומעבדים לשרתים 1-2 מעבדים – שנה הבאה כנראה (שם קוד: Ice Lake). זו, אגב, הסיבה שרוב הגולשים כאן לא ממש שמעו מנציגי שיווק של יצרני השרתים, מכיוון שהיצרנים כמעט ולא הוציאו שרתים חדשים עם המעבדים החדשים, דגש על כמעט – כל היצרנים הגדולים הוציאו 1-2 דגמים עם תמיכה ברוב המקרים ל-4 מעבדים ותו לא (שרתים כאלו עם 8 מעבדים – הם מאוד פופולריים בסין, לא בשאר העולם).

מבחינת שינויים ושיפורים במעבדים החדשים – אין הרבה, ומה שיש, די מאכזב:

  • "פי 2 ביצועים" – כן, כשמשווים את המעבדים החדשים למעבדים מלפני 5 שנים, וגם אז – רק ב-workloads מסוימים בלבד.
  • bfloat, VNNI – אינטל מנסה שוב ושוב להיכנס לתום ה-Machine/Deep Learning/AI ומכניסה תמיכה במתודות נוספות לתמיכה בתחומים הנ"ל. הבעיה המרכזית: לקוחות רצו/רוצים/ירצו לעשות זאת דרך ה-GPU כי זה זמין (לא צריך לרכוש שרת שלם, אפשר פשוט לרכוש כרטיס), קל לשדרג (שוב, אפשר להחליף כרטיס, לא צריך להחליף שרת שלם) ויותר זול.
  • תמיכה בזכרון – אינטל סוף סוף החליטו להעלות את מהירות הזכרון הנתמך ל-3200 מגהרץ, שנה אחרי ש-AMD עשו זאת. מצד שני, כל מעבד תומך מקסימום 256 ג'יגהבייט זכרון, או איך אומרים בקומדיה "היהודים באים" – "איזה עולב".
  • תמיכה ב-Optane Persistent Memory 200. עוד משהו שלא ממש הולך איתו חזק לאינטל, אבל היי, סיבוב שלישי, אולי יצליח הפעם?

חלק מההכרזה יועד ל-SSD החדשים של אינטל, ה-D7-P5500, P5600. אלו באמת דיסקים SSD מעולים, עם בעיה קטנטנה שלא קשורה טכנית ל-SSD עצמו: בשביל לקבל ביצועים טובים, תצטרך שרתים עם … מעבדי EPYC של AMD, מכיוון שאינטל עדיין לא שחררה שום chipset שתומך ב-PCIe דור רביעי, ואותם SSD דווקא צריכים זאת כדי לתת את הביצועים המיטביים.

אחת ההפתעות לעיתונאים ולאלו שצפו בהכרזה (וקיבלו מידע מוקדם) – היתה שאינטל לא הכריזה על מעבדים חדשים עם 56 ליבות (אלו בעצם מארזים שמודבקים בהם 2 מעבדים עם 28 ליבות. מה שאינטל גיכחה על AMD – בסוף הם בעצמם עשו). ההערכה היא שאינטל בכל זאת תכריז על כך בשנה הבאה, כשהיא תכריז על Xeon SP דור 3-חלק-ב' (שם קוד: Ice Lake).

לסיכום: אני לא ממש מצליח להבין את אינטל. עם כל המשאבים שיש לחברה, עם כל מאגר המוחות העצום שעובד בחברה – זה הדור השלישי של Xeon SP שהחברה מצליחה להוציא? זה הכל? אם מעבדי ה-Ice Lake יהיו ללא תכונות חדשות, יותר ממה שאינטל מציעים ב-Cooper Lake, אני אתקשה להבין מדוע חברות ירצו לרכוש שרתים עם מעבדים כאלו, ובמקרה כזה עדיף יהיה כבר לרכוש את השרתים עם המעבדים הנוכחיים – Xeon SP דור שני או מעבדי AMD EPYC.

מעבר למעבדים אחרים – של אפל

אפל הודיעה אתמול רשמית (ומי שעוקב אחר השמועות – כבר שמע זאת לפני יותר מ-8 חודשים) שהם מתחילים תהליך מעבר (Transition) בין מעבדים של אינטל למעבדים שהחברה מפתחת (בניגוד לכל מיני שטויות שנכתבו באתרים שונים, החברה לא מייצרת מעבדים, חברת TSMC מייצרת עבור אפל).

תרשו לי לאמר על כך כמה מילים..

מבחינה טכנית, אפל משתמשת כיום באייפון ובאייפד במעבדים מתכנון שלה, ואותם מעבדים אכן נותנים ביצועים טובים, והם פחות או יותר באתה רמה של מעבדי ה-High End של קוואלקום (סידרה 865 או +865 לדוגמא). הסיבה שאפל מנצחת בבדיקות ביצועים קשורה יותר ל-OS: אי אפשר לבדוק מעבדים של קוואלקום על iOS ואנדרואיד די גרוע באופטימיזציה למעבד – בהשוואה ל-iOS (הסיבה קשורה לכך שאפל צריכה לעשות אופטימיזציה רק למשפחת מעבדים אחת שלהם, בשעה שאנדרואיד צריך לרוץ לא רק על מעבדים של קוואלקום אלא גם של מדיהטק ואחרים, וגוגל לא הולכת לעשות אופטימיזציות כאלו).

לא מעט אנשים יצביעו על כך שבמבחנים כמו Geek Bench המעבדים כמו A12X/A12Z של אפל "נותנים פייט" למעבדים של אינטל. אני בהחלט מאמין לתוצאות, אבל זה לא כל הסיפור.

מעבד טוב צריך לא מעט זכרון Cache בשלבים שונים כמו L1,L2,L3 בשביל לבצע עבודות שדורשות ריצה חוזרת לחלקי קוד שונים. אם נשווה את ה-A12Z של אפל ל-i9-9900 של אינטל, נראה כי ברמת L1, לאפל יש 128K להוראות ו-128K ל-DATA (שזה טוב), לאינטל יש 512K שמחולקים בצורה שונה. כשזה מגיע ל-L2, אפל כוללת 8 מגהבייט (אין פרסום איך החלוקה), ואילו אינטל כוללת 2 מגהבייט שמחולקים ל-256K פר ליבה. כשזה מגיע ל-L3, ל-A12Z אין את זה בכלל, ולאינטל יש 16 מגהבייט (כ-2 מגה פר ליבה), ול-L3 יש חשיבות מכרעת, ואת זה ניתן יהיה לראות בקרוב מבחינה מספרית גם במעבדים החדשים בדור הבא של אינטל ו-AMD.

ה-A12Z (זה המעבד שאפל החליטה לייעד בשלב זה במחשבי הפיתוח למפתחים שמעוניינים להמיר את האפליקציות שלהם לרוץ על מעבדים אלו) הוא מעבד טוב וחזק, אבל הוא חזק לדברים מוגבלים שניתן להריץ על אייפד. קחו לדוגמא את חלק ה-GPU שנמצא במעבד: יש בו 8 ליבות יעודיות ל-GPU. לאינטל, לדוגמא, עם ה-Iris Graphics יש 64 ליבות יעודיות לכך (זה נקרא שם Execution Units). ה-A12Z מציג ביצועים מרשימים על אייפד מבחינת ה-GPU, אבל בסופו של יום, אם אתה רוצה להריץ עבודות מורכבות שירוצו על מק עם מעבד A12Z, ה-GPU של אפל במעבד ה-A12Z לא יספק ביצועים גבוהים כי הוא פשוט לא בנוי לכך, ה-iPadOS של אפל גם כך מגביל פנימית את המערכת בחלוקת משאבים, בהשוואה למק עם iOS.

מי שהסתכל במצגת של אפל, אולי שם לב לכך שבמסגרת הצגת המעבר, לא נאמרה ולו פעם אחת אימרה כלשהי שה-A12Z מהיר יותר בהשוואה למה שאינטל כיום מוכרת לאפל, וזה בדיוק העניין: ה-A12Z רחוק מאוד מכך – ברגע שמתחילים לזרוק כמות עבודות גדולה או עבודה גדולה ומשולבת מאוד על ה-A12Z (ההדגמות אתמול על MAYA פוטושופ וכו' היו הדגמות מאוד סלקטיביות שמשתמשות ב-RAM כ-Cache) ואפל תצטרך לפתח מעבד חדש הרבה הרבה יותר רציני כדי לתת "פייט" למעבדי אינטל שאפל משלבת כיום במחשבים הניידים שלה.

במחשב הדסקטופ של אפל (ה-Mac Pro) – הסיפור אחר. המעבדים של אפל יכולים אולי להתחרות במעבדי הדסקטופ של אינטל במבחנים מסויימים (אלו עד 4 ליבות) אבל כשזה מגיע למעבדים עם 8 ליבות ומעלה, עם יותר זכרונות מטמון L1,L2,L3, עם מעבדי ה-Skylake X הישנים (מלפני 3 שנים) ועד מעבדי ה-Xeon מסידרה 31XX,32XX, ובקרוב ה-33XX – לאפל אין שום דבר שמתקרב לביצועים של המעבדים הנ"ל (ועוד לא הזכרתי את הפתרונות של המתחרים, AMD) ואפל תצטרך להוכיח לעולם ולמשקיעים שהם יכולים להוציא מעבדים שהם הרבה יותר חזקים ממה שהם מוציאים כיום.

אבל הבעיה המרכזית של אפל תהיה יותר קשורה ללקוחות, אותם לקוחות שרכשו בעשרות אלפי דולרים מחשבי מק פרו לעסק, ואפל פתאום מודיעה להם שהחברה הולכת לעבור תוך שנתיים למעבד וארכיטקטורה אחרת, וזאת בשעה שהם השקיעו סכומים גדולים רק בחודשים האחרונים. אפל מדברת על מעבר תוך שנתיים, אבל תוך שנתיים לא יהיה לאפל שום פתרון שיכול להתחרות במעבדי Xeon מ-10 ועד 28 ליבות (ובקרוב פי 2 יותר. משום מה אינטל לא הוציאו את המעבדים החדשים בשבועות האחרונים),תמיכה בכמות מרובה של נתיבי PCIe, תכנון תושבת חדשה למעבד (הפעם אי אפשר פשוט לקחת מאינטל), בכמות גדולה של זכרון ועוד ועוד, ולכן אפל תצטרך להמשיך גם הרבה לאחר השנתיים המתוכננות – לתמוך בפתרונות מבוססי אינטל ולוודא שכל מיני לקוחות לא יחשבו לקפוץ לכיוון ה-Windows.

לסיכום: בסופו של יום, אני בהחלט יכול להבין את המניע של אפל. חיי הסוללה של מעבדי אינטל עדיין נמוכים, גם כשהבעיה היתה ידועה לאינטל יותר מעשור (ואגב, צריכת החשמל במחשבים ניידים מבחינת החלקים "מסביב" דווקא ירדה – אין יותר דיסק מכני, פאנל התצוגה לוקח פחות חשמל) ואפל כבר לא אוהבת להיות תלויה באינטל לגבי פתרונות עיבוד (למרות שלחברת אינטל יש מחלקה שלמה לבניית גרסאות מעבדי Custom), אך יחד עם זאת, אפל צריכה להיות הרבה יותר ברורה כלפי לקוחותיה ולהצהיר כבר עכשיו – למשך כמה זמן היא הולכת לתמוך בפתרונות מבוססי אינטל וכמו כן לדבר על פתרונות המק-פרו ומה אפל הולכת לעשות בנידון.

כמה מילים על המעבדים החדשים לדסקטופ של אינטל

עדכון: בזמן שעבדכם הנאמן כותב פוסט זה, AMD הורידה את מחיר מעבד Ryzen 9 3900X ב-90 דולר (ל-410 דולר), כך שבעצם אם רוכשים את ה-10900K של אינטל, משלמים בערך 100$ יותר ומקבלים 2 ליבות פחות, בהשוואה ל-3900X.

אינטל הכריזה לפני מספר שבועות על סידרת המעבדים החדשים (שם קוד: Ice Lake) לדסקטופ, ואיפשרה רק אתמול להציג מבחני ביצועים. יצרן לוחות אם מסוים נתן לי גישה מרוחקת למכונות לינוקס עם מעבדים אלו וביצעתי מספר בדיקות. אמנם לא חתמתי שום NDA מול אינטל, אבל בשביל הריספקט, לא פרסמתי הרבה פרטים מעבר למה שכבר פורסם על ידי אחרים ברשת.

להלן רשימת המעבדים והמפרט שלהם (קרדיט: אתה יורו גיימר):

כפי שניתן לראות, הפעם אנחנו זוכים לראות במשפחת הדסקטופ מעבד עם 10 ליבות ב-2 גרסאות שונות – ה-Core-i9-10900K ואת ה-Core-i9-10900 כאשר ה-K מציין מעבד לא נעול שניתן לבצע לו Overclock. בשאר המעבדים ניתן לראות כי אינטל הפעם לא חסמה Hyper Threading במעבדים בקצה התחתון, והמהירות עלתה בחלק מהמעבדים (שימו לב שה-i9-Core-10900K יתן מהירות של 5.3 ג'יגהרץ רק לליבה אחת וגם זה רק בתנאים מסויימים (כמו: Thermal Velocity Boost (TVB) מופעל, החום הוא 70 מעלות ומטה ועוד). מבחינת מחירים – אינטל שמה לב שיש לה תחרות ולכן המחירים ירדו בהשוואה למעבדים דור תשיעי ומטה, ואת מעבד מגירסת ה-10 ליבות תוכלו לרכוש במחיר (בחו"ל) שינוע בסביבות ה-530 דולר (המחיר בטבלה זה בהזמנת 1000 חתיכות).

אחד הדברים הראשונים שכדאי לשים אליהם לב, לכל מי שמתעניין במעבד כמו ה-10900K הוא שיש לאינטל מעבד "קרוב משפחה" בשם 10900X. מבחינה טכנית הם "קרובי משפחה" (Ice Lake הוא נגזרת משופרת של Sky Lake) אבל מעבד 10900X לא יפעל על לוחות האם החדשים ש-10900K יפעל ולהיפך. מבחינת ביצועים, ה-10900X קיבל ציון "Dead On Arrival" איך שהוא יצא כמעט מכל אתר סקירות/בחינות מקצועי בהשוואה למה ש-AMD הציעו, ולכן ההמלצה הגורפת היתה לקחת מעבדים אחרים של אינטל או להסתכל על ההצעות של AMD.

למי אינטל מייעדת את המעבדים החדשים? בהחלט לא לאלו שרכשו את המעבדים מדור תשיעי. השיפורים בביצועים הם יחסית מינוריים (ה-9900KS יתן לכם 5.0 ג'יגהרץ על כל הליבות ו-5.1 על ליבה אחת), ואין אפשרות לשדרג ממחשבים עם מעבדים דור תשיעי ומטה, יש להחליף לוח אם ואם רוכשים את גירסת ה-10900K, ודאו כי ספק הכח שלכם הוא לפחות עם אספקה של 700 וואט (אם יש GPU מכובד בתוך המחשב), הואיל וכשמעבד ה-10900K מתאמץ, הוא צורך חשמל כאילו אין מחר (זה נע בין 180 ל-260 וואט. אל תאמינו אף פעם למספר ה-TDP המופיע במפרט).

אינטל מייעדת את המעבדים הללו למי שרכש מעבדים כמו Coffee Lake משנת 2017 ואחורה. כשמשווים את הביצועים של המעבדים החדשים למעבד כמו i7-7700K, יש בהחלט שיפור מרשים בכל פרמטר אפשרי, אבל מצד שני – אם אתה הולך להחליף חצי מחשב בתהליך השדרוג, הייתי ממליץ גם להסתכל על המתחרים ממול.

המעבדים החדשים של אינטל גורמים לכל הסוקרים לחזור על אותם מסקנות שוב ושוב כמו תוכי: אם אתה גיימר שמחפש את כמות הפריימים המקסימלית שניתן להוציא ממשחקים פופולריים רבים, אז אין ספק – המעבדים של אינטל הם בשבילך. אם אתה מריץ אפליקציות פרודוקטיביות שרצות כ-Single Threaded ואתה מחפש את המקסימום ביצועים, אז גם כאן – המעבדים החדשים יתאימו לך.

אם לעומת זאת אתה רוצה לשדרג את המחשב ואתה משתמש בו לצרכי פיתוח, יצירת/עריכת תכנים, ופה ושם קצת משחקים – הפתרונות מבוססי AMD יתאימו לך יותר מבחינת ביצועים, צריכת חשמל, מחיר נמוך יותר וכו'. עובדה פשוטה: במחיר שאינטל מבקשת עבור 10900K עם 10 ליבות, אתה יכול לקנות את Ryzen 9 3900X עם 12 ליבות וישאר לך עודף (מבחינת רכישת מעבד. בכל מקרה תצטרך לרכוש לוח אם וגם כאן ההצעות שמבוססות על שבב B450 של AMD – זולות יותר)

בכל הקשור למעבדים החדשים עם 6 ליבות (10600/10500 עם או בלי K) המבחנים המשווים מול Ryzen 5 3600X מראים משהו מעניין: אינטל עדיין מובילה בכל הקשור לביצועים של משחקים, אבל דווקא בקטגוריית אפליקציות Single Threaded, הביצועים של 3600X יותר גבוהים, ושוב – במחיר של 10600K שמגיע עם 6 ליבות, אפשר לרכוש את ה-Ryzen 7 3700X עם 8 ליבות וישאר לך עודף.

וכאן אנחנו מגיעים לנקודה שאותי היא הכי מתמיהה: היכן ההנהלה באינטל (יש שם מהנדסים סופר מוכשרים שיש לי המון הערכה אליהם)? מ-Coffee Lake שיצא ב-2017 ועד Ice Lake שרשמית מתחיל להימכר הבוקר, השיפורים והשינויים בין הדורות הם מינוריים. עדיין יצור ב-14 ננומטר +++++, עדיין PCIe דור 3 (מי שקונה לוח אם חדש עבור המעבדים החדשים, יקבל לוח אם עם חלק מהתושבות שהם PCIe דור רביעי, אבל זה לא מופעל כי .. באינטל החליטו לא להפעיל ולחכות עם זה למעבד הבא). גם בתחום ה-HEDT (כלומר High End Desktop) עם Sky Lake X – אינטל כבר עושה "סיבוב שלישי" שכל ההבדל בין הדורות – זה עוד 100 או 200 מגהרץ מהירות, ובדור האחרון הם חתכו את המחיר בחצי – בגלל AMD (אינטל כמובן לא מודים בכך). אינטל יכלה לדוגמא להכליל טכנולוגיות שונות במעבדים או ב-Chipset כמו Thunderbolt או תמיכת DCPMM (שלא קיימת, אגב, גם בקצה הכי גבוה של מעבדי אינטל, גם לא במעבדים לתחנות עבודה) – אבל בשביל מה להתאמץ….

לסיכום: גם הפעם, בדור החדש של המעבדים, השיפורים הם מינוריים בהשוואה לדור תשיעי. יש מעבד עם 10 ליבות, אבל אם כל מה שרצית זה מעבד של אינטל עם הרבה ליבות, אינטל ממזמן מציעה את מעבדי ה-Sky Lake X לדסקטופ או מעבדי Xeon W לתחנות עבודה. לאינטל דווקא יש רעיונות ויש טכנולוגיות חדשות, אבל הן עדיין לא ממומשות בצורה טובה במעבדים החדשים, הן בדסקטופ והן בתחנת עבודה (רמז: הרצת קוד AVX 512 תמורת הנחתת ביצועי המעבד בחצי?). כולי תקווה שבאינטל יתחילו להתעורר ולהוציא מעבדים קצת יותר מרשימים…

קצת על מעבדי ה-Ryzen 4000G וחישוב מחירי מחשבים

שוק המעבדים למחשבים נייחים וניידים מחולק לסגמנטים ורבים ושונים, בין אם מדובר במחשבי דסקטופ ב-Enterprise, מחשבים נייחים לשוק הביתי, שוק בתי הספר, שוק מחשבים ניידים, שוק HTPC (שהולך ונכחד לטובת פתרונות שנותנים את הכל בעשירית המחיר) ועוד ועוד.

סגמנט גדול הוא שוק ה-OEM במקומות גיאוגרפיים גדולים, בהם כל סנט שאפשר לחתוך – נחתך. מדובר במקומות כמו הודו, חלק מ-סין, אפריקה, דרום אמריקה וכו'. במקומות אלו, יצרני המחשב המקומיים קובעים עבור יצרני הלוחות איזה פורטים ישארו או יעופו, ובמקרים רבים מדובר בהחלטות של סנטים בודדים, לדוגמא: להשאיר HDMI, להעיף DVI – זה חוסך 3 סנט בעלות הלוח (להעיף HDMI יחסוך עוד יותר אולם רוב המסכים הזולים כיום יוצאים עם כניסות DP ו-HDMI או VGA במקום DP) ומכיוון שיצרני מחשב אלו רוכשים עשרות אלפי לוחות אם מיצרני הלוחות, אף אחד לא מתווכח.

בדיוק באותם שווקים זולים ובסגמנטים הקשורים למחשבים אישיים היתה לאינטל עד לאחרונה עדיפות מוחצת. מדוע? חוץ מהסיבה הברורה של MDF שבהחלט מתקבל בברכה ע"י מחלקות שיווק שונות של יצרני מחשבים, הסיבה השניה היתה שאינטל כורכת מעבד גרפי בתוך ה-CPU מה שחוסך הרבה כספים מבחינת רכישת חלקי מחשב עבור יצרני המחשבים. נכון, זה לא ממש יתן ביצועים גבוהים למשחקים, אבל בשווקים הללו התחרות היא To the Bottom: אם אני יכול להוריד את המחיר שלי ב-10$ בהשוואה למתחרה שלי ובכך לזכות בחוזה מכירות כמות גדולה של מחשבים לארגון גדול, לרשת מחשבים וכו' – אז למה לא?

ל-AMD היו תמיד פתרונות מתחרים: מעבדים הכוללים עיבוד גרפי. אלו נקראים מעבדי APU ובדרך כלל המחירים שלהם היו נמוכים בהשוואה למתחרים והם נמכרו בכמות קטנה בשוק החופשי, אבל בהשוואה לאינטל – AMD תפסה אחוזים בודדים.

ואז לפני קצת יותר משנתיים החלו בעיות היצור של אינטל ובמעבר מ-14 ננומטרים וכתוצאה מכך קיבולת היצור של אינטל ירדה בצורה משמעותית ואינטל קיבלה החלטה שמעבדים ייוצרו לפי סולם רווח, כלומר מעבדי Xeon יקבלו עדיפות גבוהה יותר ומעבדי דסקטופ (i7, i5, i3 ומטה) יקבלו עדיפות הרבה יותר נמוכה. כך נוצר מצב שיצרניות גדולות כמו HP, Dell, Lenovo ואחרים מצאו את עצמם בסיטואציות מוזרות: לקוחות רוצים לקנות מהם מחשבי דסקטופ, אבל אותן יצרניות לא יכולות למכור כי אינטל לא יכלה לייצר כמות מספקת של מעבדים. בחברת HP נשלחו הודעות בהולות למנהלי המכירות באזורים גיאוגרפיים שונים – להתחיל "להמליץ בחום" על פתרונות של החברה עם מעבדי AMD (הן לדסקטופ והן לשרתים), וחברות כמו לנובו ואפילו Dell החלו "לגשש" אצל היצרן הטקסני (AMD) לגבי מרכולתו ולגבי פתרונות עתידיים.

התשובה של AMD לסיטואציה תוצג בקרוב לציבור הרחב תחת השם: 4XXXG. החברה תציג 12 מעבדי APU חדשים שמבוססים על ארכיטקטורת הדור הנוכחי (Zen 2) אשר יכללו יחידה גרפית מובנית במעבד ואשר תהיה מהירה בצורה משמעותית בהשוואה למה שאינטל מציעים במעבדיהם. מעבדים אלו יוצעו עם כמות ליבות משתנה (בין 4 ל-8) ועם מעטפת צריכת חשמל (TDP) של 64 וואט ו-35 וואט (שיתחרו בדגמי T של אינטל).

היתרון במעבדים אלו, כמו במעבדים למחשבים ניידים – כרוך במחיר ובמה אפשר לקבל תמורת מחיר נמוך: לראשונה, צרכנים יוכלו לקבל עד 8 ליבות עם GPU מכובד (זה לא מתחרה בשום מצב בכרטיסי ה-GPU של AMD או nvidia) או כפי שאמר הסלוגן של אטארי ז"ל: Power without the price. המחירים של AMD עדיין לא פורסמו (כל הנתונים יפורסמו בקרוב) אבל רק לשם השוואה: אינטל מבקשת על מעבד עם 8 ליבות בין 340-400 דולר (המחירים שמפורסמים באתרים שונים הם מחירי K, כלומר מחירים של 1000 חתיכות).

האם לך כצרכן יהיה כדאי לרכוש אחד מהמעבדים הללו? אם אתה מסתכל רק על ההצעות של AMD – זה תלוי. אם 1000-2000 שקל בשביל GPU טוב זו תוספת שאין באפשרותך לשלם עליה, אז כן, לך על ה-4XXXG עם כמות הליבות שתרצה. לעומת זאת, אם אתה חושב לבנות מחשב עם GPU יעודי ועם עוד כרטיסים נוספים במחשב בהמשך – לך על מעבדי ה-Ryzen הרגילים. אם לעומת זאת, מהירות הליבות פר ליבה היא הדבר הכי חשוב לך (או שאתה מריץ פוטושופ רוב הזמן) – לך על המעבדים של אינטל בסידרה 10 החדשה (פרטים על ביצועי המעבדים של אינטל בסידרה החדשה יפורסמו עד יום ה' או ו' השבוע).

השוק משתנה: מעבדי ה-Ryzen Mobile, המחיר והתחרות

אינטל שולטת בשוק המחשבים הניידים שנים רבות. עד לפני בערך כ-3 שנים, אפשרויות הבחירה שלך נעו בין מחשב זול עם 2 ליבות (או 4 ליבות במהירות נמוכה) או 4 ליבות במהירות רצינית ובמחיר שמתחיל ב-1200$ ומעלה. היית יכול למצוא מחשבים ניידים עם שש ליבות – אבל המחירים של אותם מחשבים ניידים התחיל בערך ב-2000$ ומעלה לתצורות הבסיסיות, ובקיצור – אם רצית מחשב עם כח עיבוד רציני, היית צריך לשלם כמה אלפי דולרים. לכל השאר – אינטל יצרה מעבדים שננעלו במהירויות נמוכות יותר, מה שכמובן לא הצריך מצד היצרן פתרון קירור רציני.

מי שעוקב אחרי סדרות המעבדים למחשבים הניידים של אינטל, יראה כי אינטל בדור התשיעי הוציאה מעבדים למחשבים ניידים עם 8 ליבות, אבל אלו היו מעבדים מסידרה H, כלומר מעבדים שצורכים לא מעט חשמל (בהתחשב בכך שמעבד זה מיוחד למחשב נייד ולא נייח) והם אינם מתאימים להרצה על מחשבים קלי משקל ודקים. בדור העשירי והאחרון שאינטל הוציאה לפני שבועות ספורים, כבר ישנם מעבדי i7 עם 8 ליבות למחשבים ניידים דקים, אבל המחיר גם כאן – מאוד גבוה, בד"כ מתחיל ב-1700$ ומעלה.

אינטל יכלה כמובן להוריד את המחירים ולהציע גם לסקטור ה-Value מעבדים עם יותר מ-4 ליבות ועם ביצועים יותר גבוהים, אבל אינטל החליטה שלא. למה? הסיבה לא תשנה. לא היתה תחרות, אז אינטל יכולה לעשות מה שבא לה.

וכאן נכנסה לשוק AMD בשנתיים האחרונות.

הדור הקודם של מעבדי Ryzen למחשבים ניידים היה זול, איך הביצועים לא היו כה מרשימים, והמבחנים הראו שמעבדים אלו נמצאים אי שם באמצע מבחינת כח CPU ובמקום גבוה מבחינת GPU (בהשוואה ל-GPU הפנימי של מעבדי אינטל). AMD לא דרשה מחיר גבוה, ויצרני המחשבים הניידים יצרו מספר דגמים מצומצם עם מעבדים אלו והם מצאו בדרך כלל פופולריות במחשבים הניידים הזולים.

https://i0.wp.com/pcinfo.co.il/wp-content/uploads/2020/03/AMD-Ryzen-4000-Renoir-Specs-1.jpg?w=840&ssl=1

הדברים החלו להשתנות כש-AMD הוציאו את משפחת המעבדים הניידים (שם קוד: רנואר). בדיקות ביצועים מאתרים ומגזינים מקצועיים שונים הראו כי המעבדים החדשים מתחרים בצורה חזקה מאוד ומביסים ברוב המקרים הן את המעבדים הניידים מדור 9 ומדור 10 של אינטל (חלק מהמבחנים עדיין לא פורסמו והם יפורסמו במהלך חודש יוני – בכל הקשור למעבדים עם צריכת מעטפת של 45 וואט) והמחירים ליצרנים – זולים בצורה מאוד משמעותית בהשוואה למה שאינטל מבקשת כיום. AMD גם הוציאה סידרת מעבדי Ryzen Mobile Pro הכוללים ניהול מרוכז עבור ארגונים הדורשים זאת (משהו זהה ל-vPro של אינטל) ולקינוח – AMD יכריזו בחודש הבא על מעבדי APU (מעבדים הכוללים יחידת GPU קטנה) שתתחרה במעבדים זולים של אינטל – עד 8 ליבות (עדיין לא ניתן להרבות בפרטים, הם יפורסמו רשמית כבר בקרוב).

התוצאה? בחודשים האחרונים צרכנים מגלים כי גם במחשבים ניידים זולים (600-800$) הם יכולים למצוא דגמים עם 6 או 8 ליבות ועם ביצועים חזקים, דבר שלא נשמע כמוהו בעבר, והמכירות – בהתאם. חברת Lenovo לדוגמא יצאה עם ה-IdeaPad סדרות 3 ו-5 עם מספר דגמים, חלק מהם עם מעבדי Ryzen החדשים של AMD וחלק מהם עם מעבדים דור 10 למחשבים ניידים של אינטל. כשמחפשים לרכוש את הדגמים עם מעבדי AMD, מוצאים כמעט בכל מקום כי המלאי אזל, ומה שזמין לרכישה – הם הדגמים עם מעבדי אינטל. גם חברת ASUS וגם חברת Acer דיווחה על כך. החברות שמו בהחלט לב לכך ו-Lenovo לדוגמא כבר מוציאה החודש מחשבים ניידים מסידרת Legion עם מעבדי Ryzen החדשים כאשר רק בחודש ינואר אפילו לא היתה תוכנית לתכנן מחשב נייד כזה.

כתוצאה מהסיטואציה החדשה, דברים אחרים מקבלים יותר תשומת לב ברכישה. אתה יכול למצוא מחשב נייד זול עם 6 או 8 ליבות במחיר של 600-800$, אבל לא מומלץ לרכוש את המחשבים הללו רק בגלל המעבדים! כדאי לבדוק את המקלדות, את ה-Track Pad והכי חשוב – איכות מסך ובהירות, ועדיף שיהיה כמה שיותר זכרון, מכיוון שבמחירים אלו, לא ניתן להרחיב את הזכרון במחשבים ניידים אלו.

לסיכום: הגענו למצב חדש, שבו תמורת כמה מאות דולרים אפשר לרכוש מחשב נייד עם כח עיבוד כזה חזק, שרק לפני שנים ספורות היינו צריכים לשלם $2000 ומעלה כדי לקבל את אותו כח עיבוד, ועתה, תודות לתחרות – לא צריך לשלם כל כך הרבה על פתרונות כאלו.

הולכים לרכוש דיסקים קשיחים? שימו לב!

כל מי שנמצא בסקטור ההיי-טק בתחום ה-IT, מודע בוודאי לכך שהיום הדיסקים שנמכרים הכי הרבה – הם דיסקים אלקטרוניים (SSD). אתה מקבל מהירות גבוהה מאוד של קריאה/כתיבה, הבקרים באותם דיסקים שופרו כך שתוכל לקבל אורך חיים מכובד לאותו SSD. מהצד השני, יצרניות גדולות של דיסקים מכניים מנסים למכור את הדיסקים שלהם לצרכי Capacity. אחרי הכל – שום SSD לא נותן מחיר משתלם מבחינת כמות אחסון כמו דיסק קשיח מכני.

יצרניות הדיסקים הקשיחים מנסים כל הזמן להגדיל את כמות האחסון פר דיסק ואחת השיטות שכל יצרני הדיסקים הטמיעו נקראת SMR או Shingled Magnetic Recording. בשיטה זו, כשכותבים נתונים על הדיסק ובאותו אזור שבו הדיסק רוצה לכתוב, כבר קיימים נתונים – אז הבקר של הדיסק יורה למערכת לקרוא את הנתונים הקיימים בדיסק, לצרף אותם (בזכרון המכונה) לנתונים שצריכים להיכתב – ולכתוב את הכל מחדש. כל התהליך הזה לא קיים בדיסקים קשיחים רגילים שמשתמשים בשיטת קריאה/כתיבה שנקראת PMR ולפיכך דיסקים קשיחים שעובדים בשיטת SMR מתאימים יותר לצרכי גיבוי ארכיבאי, הווה אומר: אם אתה רוצה לגבות כמות גדולה של מידע בצורה חד פעמית ולהכניס לאחר מכן את הדיסק לארון או כספת או לשלוח את הדיסק Off Site – אז דיסקים כאלו מעולים לכך. בקיצור – אלו דיסקים שמתאימים כ-WORM.

מכאן נעבור לשוק ה-NAS, השוק בו אותן חברות בדרך כלל מוכרות ללקוחות וליצרני קופסאות NAS דיסקים קשיחים בגדלים של 2-8 טרהבייט. חברות כמו Western Digital גם מייצרת 2 משפחות דיסקים ל-NAS, האחת היא סידרת RED והשניה היא סידרת Red Pro, כאשר ה-Red Pro יותר מתאים ל-Enterprise הואיל והדיסקים שם מגיעים בחיבור SAS ולא SATA. יצרנים אחרים גם יעדו דגמים ומשפחות שונים של דיסקים לשוק ה-NAS. אחרי הכל זהו שוק שגודל וסקטור ה-SMB קונה המון ממנו מחברות כמו Synology או QNAP.

וכאן הגיע תחמון חדש מצד יצרני הדיסקים.

כפי שציינתי לעיל, דיסק מבוסס SMR מתאים לצרכים של קריאה מרובה אך אינו מתאים לצרכים של כתיבה מרובה (גם לא כתיבה של 50% ומטה!) ולכן אם אתם רוצים לרכוש דיסקים לשרתים שלכם (מצד ג') או דיסקים ל-NAS שלכם, חשוב יהיה לוודא שהדיסקים עובדים בשיטה כמו PMR, CMR או שיטות מתקדמות אחרות (יש שיטות כאלו אולם עדיין לא יצאו לשוק המסחרי דיסקים המבוססים בשיטות החדשות) ולא SMR.

אז יצרני הדיסקים החליטו לעשות משהו פשוט: מכיוון שהם בטוחים ש-NAS זה רק לשוק ה-SOHO/SMB שלא מצריך כתיבה מרובה, אפשר לדחוף להם דיסקים קשיחים שהם SMR מבלי לגלות ללקוח שהדיסקים הם SMR. מדוע? כי לאותם לקוחות יש "פעילות מועטה".

חמור מכך: חברות כמו Western Digital טענה כי רק הדיסקים בגודל 20 טרהבייט שלהם עובד ב-SMR, אבל כפי שתוכלו לראות כאן וכאן, הם לא בדיוק אומרים את האמת – וגרוע מכך, הם מסרבים לענות כששואלים אותם מהי שיטת הקריאה/כתיבה של דגם ספציפי. אם יש לכם דיסקים של WD, אז אם אותם דיסקים מסתיימים ב-EFRX אז אלו דיסקים שעובדים PMR/CMR ואין שום בעיה לעבוד איתם, הם מעולים. אם לעומת זאת הדגם שלהם מסתיים ב- EFAX – אז כדאי להחליף אותם.

מאז שהתפוצצה הפרשה הזו – גם Seagate וגם טושיבה הודו שגם הם משתמשים בטריק הזה. כאן אפשר לראות לגבי הדיסקים של Seagate וכאן אפשר לראות לגבי הדיסקים של טושיבה.

לכן – אם קנית או שאתה מתכנן לרכוש דיסקים קשיחים מכניים – בקש בהצעה את שמות הדגמים ובדוק אותם לפי הלינקים לעיל. אני לא יודע לגבי ישראל, אבל יש לי תחושה שבארה"ב זה הולך להגיע לבית המשפט.

האם שווה לרכוש VxRail או Nutanix Appliance?

כל חברה כיום שמתעניינת במעבר מפתרון וירטואליזציה "קלאסי" שכולל אחסון עצמאי לפתרון HCI, תשמע בוודאי מנציגי פתרונות ה-HCI הצעות "מפתות" לרכוש Appliances, קופסאות שהם בעצם שרתים שהמכנה המשותף לכולם הוא שאותם Appliances עברו בדיקות מחמירות מצד יצרן פתרון הוירטואליזציה, נעשו אופטימיזציות שונות לקופסאות, החיבור והציוות שלהם שלהם לשרתים אחרים הוא קל ומהיר והניהול הרבה יותר נוח.

מהצד של VMWare חברת Dell מציעה מספר מערכות תחת שם המטריה VxRail. מהצד של Nutanix, כל היצרנים הגדולים מציעים קופסאות שעברו את כל מה שתיארתי לעיל והן מוכנות לקבלת הגדרות ראשוניות ולהתחלת עבודה. בשתי סוגי הפתרונות, מחכים לאיש ה-IT חיים קלים, מבטיחים היצרנים.

אבל האם בעצם שווה לרכוש את אותן קופסאות במקום לרכוש שרתים רגילים מיצרן השרתים שאנחנו עובדים איתו? האם הפרש המחירים מצדיק את הרכישה?

לפני שנוכל לענות על כך, ננסה להסתכל במבט על – על התשתית ב-DC המקומי של החברה. בכל ארגון גדול בדרך כלל תהיה תשתית Life cycle management כלשהי שנועדה בראש ובראשונה להציג לנו את מצב החומרה שיש ב-DC, בין אם מדובר במתגים, אחסון, שרתים, UPS וכו'. יצרניות השרתים לדוגמא כוללות גירסה פשוטה של ניהול השרת וגירסת Enterprise בתוספת תשלום. אותו ניהול יתריע בפנינו אם יש תקלת חומרה, אם יש צורך להחליף חומרה וכו'. בפתרונות אחסון יש משהו קרוב שמתריע שעלינו להחליף דיסק או להתייחס לבעיה אחרת, וכנ"ל במתגים, UPS וכו'. בדרך כלל אנחנו נחבר את כל המערכות הללו למערכת ניטור מרכזית אחת שתוציא לנו התראות לכל הדברים הנדרשים.

נחזור לקופסאות. אותן קופסאות בדרך כלל כוללות ממשק וובי ושורת סקריפטים, וכל הפתרון הזה מבצע אוטומציה להקמה של פתרון ה-HCI, להוספת שרתים וכו', כך שלא תצטרך להגדיר כל דבר ידני וכתוצאה מכך – ההקמה תהיה הרבה יותר זריזה מאשר הגדרה ידנית של כל דבר וזה היתרון היחיד שיש לקופסאות כאלו, כלומר אם תרכוש שרת מיצרן שרתים כלשהו, עם אותו מפרט כמו של הקופסא המוצעת, תקבל את אותם ביצועים, רק שכמות הזמן שתצטרך להשקיע חד פעמית בהקמה וציוות השרת לפתרון ה-HCI – תהיה יותר ארוכה.

היתרון השני שעליו מדברים יצרני הקופסאות הוא ניהול הרבה יותר קל של אותן קופסאות. בקופסאות עם VxRail לדוגמא, יש את תוכנת VxRail Manager (הנה הדגמה) שנותנת לך לא רק לחבר שרת חדש ל-Cluster קיים, אלא גם להתקין תוכנות מה-Market, לתחזק את השרתים, לכבות, להדליק וכו'. אבל כפי שציינתי לעיל – חברות מעדיפות לנהל את הדברים במרוכז, כך שאם לחברה יש נניח מערכת iDrac Enterprise, עדיף לחבר את כל קופסאות ה-VxRail ל-iDrac Enterprise ולנהל משם, ולא דרך ה-VxRail Manager, ואותו דבר לגבי קופסאות שמריצות פתרון HCI של Nutanix.

אז למי בעצם כדאי לרכוש את הקופסאות הללו? אני חושב שקופסאות כאלו מתאימים ל-2 סיטואציות:

  • הסיטואציה הראשונה – כשמקימים מערכת שהיא נפרדת לחלוטין משאר המערכות. נניח וחברה מעוניינת לנסות פתרון HCI כלשהו מבלי יותר מדי לשבור את הראש על הגדרות והקמה מורכבת של המערכות.
  • הסיטואציה השניה – הפרשי המחירים בין קופסא לבין שרת באותה תצורה אינו כה גבוה עבור הרוכש. אם לדוגמא ההפרשה הוא 3,000 דולר וללקוח לא אכפת לשלם את ההפרש, אז בהחלט, שיקח את הקופסאות.

לעומת זאת, למי לא כדאי לרכוש את הקופסאות הללו:

  • אם יש בחברה ידע רציני לגבי אותו פתרון HCI, אז קופסאות כאלו הן לא יותר מבזבוז כספים. לחבר שרת ל-Cluster קיים של vSAN לא לוקח יותר מחצי שעה עבודה (למישהו מקצועי). עדיף לרכוש שרתים רגילים שאותם אפשר בהמשך הדרך להרחיב ולייעד לצרכים אחרים אם יהיה צורך בכך.
  • אם הפרש המחירים גבוה מדי בין שרת רגיל לבין קופסא – אז עדיף ללקוחות לרכוש או להשמיש שרתים קיימים ולרכוש את התוכנה לפי ליבות או מעבדים (תלוי בפתרון ה-HCI)

לסיכום: במעבר ל-HCI החברות מנסות למכור ללקוחות גם שרתים כקופסאות (Appliances) עם הבטחות רבות שה-Appliance הוא הרבה יותר טוב בהשוואה לרכישת שרת רגיל עם אותו מפרט. הדבר נכון אולי לגבי הגדרות ראשוניות והקמה (אם כי אפשר לעשות את הכל, אחד לאחד, בדרכים אחרות) אבל לגבי שאר ההבטחות – הן לא ממש רלוונטיות. מי שיש לו את התקציבים לכך – יכול בהחלט לרכוש את אותן קופסאות במקום שרתים רגילים, אבל אם יש לך ידע מקצועי בתוך החברה לגבי אותו פתרון HCI, זו תהיה זריקת כספים לפח.

הכנות לסיטואציית בידוד

כמו שכולנו יודעים, COVID-19 (או כמו שהוא ידוע יותר בכינויו "קורונה-וירוס") נמצא ומתפזר במקומות שונים בארץ ובעולם, מדי יום מתגלים מקרים חדשים של הידבקות, מוות, ובהתאם – אנשים נשלחים על ימין ועל שמאל לשבועיים בידוד בבית (יש לי כמה וכמה דברים לאמר בנידון, אבל לא אעשה זאת כאן, אולי יותר מאוחר בבלוג הפרטי שלי), כך שיכול להיות בהחלט מצב שקבוצות שלמות או חברות שלמות יקבלו "המלצה" מהמטה בחו"ל לעבוד מהבית, או משהו קצת פחות נעים שיכול לקרות – שיוכרז "עוצר" כללי במדינה. אחרי הכל, אתמול קיבלנו הכרזה על כך שכל מי שחוזר מחו"ל – מוזמן להיכנס לבידוד ל-14 יום.

בקיצור – צריך להכין את התשתית לעבודה מרחוק, עם כמות מאוד גדולה של משתמשים, דבר שברוב החברות לא היה בעבר ולכן אולי כדאי לעבור על הנקודות הבאות:

  • רוחב פס: יש לכם 100 מגה או 1 ג'יגה או יותר – רוחב פס לחיבור לאינטרנט, ועליו אתם מחברים משתמשים דרך VPN. גם אם יש לכם 1 ג'יגה, זה לא אומר שיש לכם 1 ג'יגה נטו ל-VPN, רחוק מכך: כל VPN מממש הצפנה בדרך משלו (עם Ciphers שונים, תלוי במעבד שיש בקופסא או מה שהוגדר ב-Appliance הוירטואלי וכו') כך שעם חיבור 1 ג'יגה לדוגמא, יכול להיות שיש לכם אולי 500-600 מגהביט ברוטו. אם יש לכם כמה עשרות משתמשים שמתחברים לחיבור כזה (ונוסיף לכך את הגלישה באינטרנט שתעבור דרך החיבור הזה) אתם תמצאו את עצמכם מהר מאוד בבעיה של איטיות גלישה/התחברות/גישה לקבצים.
    אפשר לשם הניסוי לחבר מספר משתמשים סימולטנית ל-VPN שיש ברשותכם ולנסות לבצע חישוב מהירות כמה כל משתמש מקבל ולחלק את זה תיאורתית בהמשך, אבל תצטרכו בהמשך לקחת כאופציה את העניין שתצטרכו מהר מאוד לשכור רוחב פס הרבה יותר גדול ולבדוק שהתשתית VPN שלכם יכולה לעמוד בכמות גדולה של חיבורים.
  • ענן ציבורי ו-VPN משני: אפשרות נוספת לגבי חיבורי VPN של המשתמשים, אם הקמתם כבר תשתית בענן ציבורי כלשהו (אני מדבר על השלישיה, לא על "עננים" מקומיים ישראליים) – אפשר להקים VPN בתשתית הוירטואלית, לחבר את אותה תשתית וירטואלית ב-Site to site אל ה-VPN המקומי בארץ בארץ ולאפשר למשתמשים להתחבר דרך הענן אל התשתית המקומית שלכם. אתם תשלמו על התעבורה ועל שרות ה-VPN בענן, אבל אתם תשלמו רק על השימוש, לא תשלום חודשי/שנתי.
  • העברת חלק מהתשתית לענן ציבורי: תלוי בחברה ובתשתית, בחלק מהמקרים ניתן לשכפל מספר מערכות או פשוט להעביר מספר מערכות לתשתיות וירטואליות בענן הציבורי ואותן תשתיות יתנו שרות למשתמשים מבחוץ. חשוב לדאוג לסינכרוניזציה בשני הכיוונים (בין הענן לתשתית On Prem). לעניות דעתי, כדאי לחשוב על כך.
  • בדיקת תשתיות ניטור: במשרד רואים על מסכים גדולים את התקלות, מה רץ, מה לא. בבית – לא רואים כלום, ולכן חשוב לבדוק שאפליקציות הניטור שולחות התראות דרך תשתיות חיצוניות (מייל, SMS, וואצאפ וכו') ושיש מי שיטפל בתקלות (עבודה מהבית במקרים רבים אצל לא מעט אנשים היא סיבה מצויינת "להבריז" לטובת דברים אחרים).
  • צפו לתקלות תקשורת: אם בעתיד יוכרז במדינה "עוצר" (כפי שהוכרז אתמול באיטליה), תקלות תקשורת לא יהיו "אם" אלא "מתי" (פה בישראל, אל תאמינו לשום ספק תקשורת לגבי שרידות, ראינו את זה רק לפני שבועיים כמדומני, בתשתית של בזק/מטרו) ולכן כדאי לתת את הדעת על פעילות המערכת On Prem כשאין תקשורת ומה כדאי להוציא החוצה לענן הציבורי בחשבונכם וב-VPC שלכם שימשיך לעבוד.

לסיכום: לפני כחודש בערך בחדשות היה סיפור מעניין על כך שכמה מאות אנשים בסין באזור מסוים חטפו איזו מחלה עם שמועות שזה מגיע מעטלפים. חודש אחרי וכל העולם בהיסטריה על כך ואנחנו עכשיו בתוך הסיפור, עסקים וחברות מושבתים לשבועיים על ימין ועל שמאל והאנדרלמוסיה חוגגת. גם אם התשתית IT שלכם בחברה עובדת כיום וכולם (או כמעט כולם) מגיעים, אתם יכולים לקבל הודעה להיכנס מיידית לבידוד של 14 יום, ולכן חשוב להכין את התשתית כדי שכל מי שצריך יוכל לעבוד מרחוק.

בהצלחה.

על דיסקים ואחסון

אחת הטכנולוגיות שתמיד נצטרך בכל DC ובכל תשתית IT – תהיה תשתית האחסון, בין אם מדובר באחסון קופסתי סגור, דיסקים מכניים או דיסקים SSD בכל סוג חיבור. אנחנו צריכים לכתוב ולקרוא נתונים וסביר להניח שגם אם נעביר תשתית לענן, נרצה איזה משהו "מקומי" שיחסוך לנו Latency.

אחד הדברים הראשונים שצריכים לקחת בחשבון כשבונים אחסון כחלק ממערכת – בשרתים (אחסון Scale Out לדוגמא) – הוא מחיר דיסקים, אחריות, שרות וכו' ובעצם – כמה זה עולה לנו. אם צריך לשם הפרויקט לרכוש מספר בודד של דיסקים, אז עדיף לסגור את עניין רכישת הדיסקים יחד עם השרתים ושרות מול המפיץ.

אבל מה קורה אם יש צורך להזמין כמות גדולה של דיסקים? (ב"גדולה" אני מדבר על כמויות של 30 ומעלה – בתור התחלה). ניקח את זה יותר לכיוון המציאות: אתם רוצים להקים תשתית וירטואליזציה Scale Out עם vSAN או Nutanix. אתם לא רוצים עדיין לרוץ לכיוון All Flash ולכן אתם רוצים לשלב דיסקים מכניים גדולים יחד עם SSD שישמשו כ-Cache. ב-2 הפתרונות המתחרים, כמות ה"ברוטו" מבחינת הדיסקים שתכניסו – רחוקה מאוד מכמות ה"נטו" שתקבלו בפועל לשימוש, ולכן אם נרצה כמות תלת ספרתית של אחסון נטו פנוי, נצטרך לרכוש לא מעט דיסקים עבור מינימום 3 שרתים. נניח לשם הפוסט – שנצטרך 21 דיסקים מכניים ו-3 SSD (כלומר 7 מכניים ו-1 SSD פר שרת).

לפני שנעבור לחישובים שונים, בוא נשנה לרגע נושא ונדבר על שרידות: כיום בשוק, אצל רוב מוחלט של החברות, מצב השרידות שקיים הוא מצב שהמערכת יכולה להמשיך לעבוד, כל עוד דיסק אחד הוא תקול. במקרה והתקלקל דיסק, מפעילים את ה-SLA ותוך 4 שעות יגיע טכנאי ויתן לכם דיסק חלופי, תחליפו את הדיסק בשרת/מערך אחסון, הפעילו תהליך Rebuild. מה יקרה אם יתקלקל עוד דיסק עוד לפני שהקודם הוחלף ובוצע Rebuild? תקוו שהגדרתם דיסק אחד כ-Hot Spare – אחרת אתם בצרות.

נחזור לחישובים: כיום, בין אם מדובר בישראל או כמעט בכל מקום אחר בעולם, רכישת דיסק קשיח, בין אם מדובר ב-SSD או מדובר בדיסק מכני, תעלה אצל יצרן שרתים פי 2-3 בהשוואה לרכישה מיבואן רשמי בארץ. תרגום: אם דיסק כלשהו עולה $100 אצל יבואן רשמי, אצל יצרן שרתים, אותו דיסק יעלה 300-$200. את ההבדל הזה די קל לבלוע כשמדובר על רכישה של שרת אחד עם 4-5 דיסקים. ראש שקט, רכישה חד פעמית, תשלום חד פעמי, לא עושים מזה סיפור.

אבל אם נסתכל על הדוגמא לעיל עם ה-Scale Out בשביל ה-Nutanix/vSAN (או GlusterFS, או Ceph), אנחנו מדברים על 21 דיסקים, ואנחנו נשלם בפועל מחיר של 50-60 דיסקים. אתם לא צריכים להאמין לי, אתם יכולים ליצור קשר ישירות עם היבואנים בארץ:

  • דיסקים של חברת טושיבה – חברת CRG
  • דיסקים של חברות Seagate, Western Digital – חברת ח.י.

(שימו לב – חברות אלו בד"כ לא ימכרו ללקוחות קצה או כמות קטנה של דיסקים בודדים, אבל אתם יכולים לשאול אותם לגבי מחירים, כדי שיהיה לכם מושג.)

אז במקרים שהרעיון של תשלום סכום כה מטורף קצת מפריע לכם – אפשר לחשוב על שרידות ברמה אחרת: במקום לרכוש 21 דיסקים מיצרן השרתים, אפשר לרכוש נניח 25 דיסקים מהיבואן (כל עוד לא מדובר עבור שרתי HPE – הם לא מקבלים דיסקים שאינם בעלי קושחה של HPE), ולאחסן 4 דיסקים בארון. במקרה והתקלקל דיסק, מוציאים אחד מהארון ובמקביל יוצרים קשר עם היבואן כדי לתאם שליחות/קבלה של דיסק חלופי אחר. במקרים כאלו, גם אם עוד דיסק ילך במהלך ה-Rebuild, יהיו לכם מספיק דיסקים חלופיים ועל הדרך תחסכו לא מעט כספים.

לסיכום: יש אנשים וחברות שירצו ויסכימו לשלם מחיר מאוד גבוה, ובלבד שהכל יהיה תחת קורת גג אחת מבחינת תמיכה, שרות ואחריות, וזה בסדר גמור. מצד שני – יש כאלו שלא יסכימו לשלם מחיר כה גבוה אם אפשר לחסוך סכום ניכר מהמחיר תמורת שיחת טלפון והוצאת שליח כדי להחליף דיסק במקרה של תקלה. כל אחד והחלטותיו, רק חשוב לזכור – לבדוק את האלטרנטיבות לפני שסוגרים עיסקה.

על אחסון, וירטואליזציה, ובעיות ביצועים

כמעט כל ארגון שמריץ פתרון וירטואליזציה (vSphere, Hyper-V, Xen, ואחרים) בדרך כלל משתמש בפתרון אחסון משותף לשרתים, בין אם מדובר בפתרון "הרכבה עצמית" (FreeNAS), פתרון קופסתי זול (Synology, Asustor, QNAP וכו') ובין אם מדובר במשהו קצת יותר גדול מצד חברות כמו HPE, IBM, Lenovo, Dell, NetApp, EMC וכו'. יש פתרון לכל תקציב.

עם כל הכוונות הטובות והגדרות שונות שיבוצעו, תקלות תמיד תתרחשנה (וחוק מרפי אומר: הן תתרחשנה בדיוק בזמן הכי לא מתאים), ולא חשוב כמה כסף השקעתם בפתרון האחסון או איזו רמת שרידות בניתם/הגדרתם את אותו אחסון.

אפשר לקטלג את סוגי התקלות ל-2 סוגים עיקריים. לסוג הראשון אני קורא "תקלות אבסולוטיות" ולסוג השני – "תקלות מעורפלות".

בסוג הראשון – התקלות עצמן קלות לצפיה: שרת לא מצליח להתחבר לאחסון, השרת מתחבר אבל לא רואים את ה-Datastore, השרת מחובר אבל משום מה התקשורת בין השרת לאחסון נפלה, אף שרת לא מצליח להתחבר לאחסון, וכו'. בדרך כלל הפתרונות לסוג תקלות כאלו לא יקח זמן רב (אלא אם אתם נופלים על תומך מטומטם מחו"ל שרוצה שתכבו ותפעילו מחדש כמעט את כל התשתית שלכם, וראיתי כבר הצעות כאלו לפתרון – או שיעבירו את התקלה שלכם בין תומכים, בשיטת ה"פינג פונג") וסביר להניח שתוך דקות או שעות ספורות תהיו בחזרה באויר והכל יפעל.

הסוג השני לעומת זאת – הרבה יותר ערמומי. יש תקשורת בין האחסון לשרתים, מכונות ה-VM פעילות וכלי הניטור לא מדווחים על תקלות מיוחדות, ובכל זאת – אתם רואים שהכל זוחל. אלו בדיוק התקלות שלא רק קשה לאבחן, קשה גם לתקן אותם מבלי שיש ידע רציני למי שמטפל בתקלה.

אני רוצה לתת דוגמא מה-LAB שלי. לפניכם צילום מסך מתוך מכונת VM ב-vSphere 6.7 שמריצה Windows 10 עם Crystal Diskmark 7. השרתים מחוברים לשרת ZFS עם 8 דיסקים מכניים ואין בו שום SSD, בחיבור 10 ג'יגהביט +SFP. על הנייר, כל מי שמבין באחסון, יאמר שהמספרים מעולים – 1.2 ג'יגהבייט קריאה/כתיבה על חיבור של 10 ג'יגהביט – זה המקסימום שאפשר לקבל.

הסיבה שהרצתי את אותה בדיקה בצילום מסך היתה קשורה לבעיה אחרת: כל מכונת VM שכיביתי או הפעלתי מחדש – עלתה בצורה מאוד איטית. זה לא היה קשור לשרתים כי לא היה עומס עליהם וגם כשביצעתי Migrate ל-VM לשרת אחרת והפעלתי מחדש, היתה אותה איטיות. בשרת ZFS לא היה שום עומס, וגם הסוויצ' לא דיווח של איטיות או הצפה כלשהי, ובכל זאת – אתם רואים את המספרים לעיל, לא רואים בעיה.

במקרה שלי – לקח לי בערך שעתיים וחצי למצוא אחרי חיפושים בשיטת "מחט בערימת שחת" שאחת המכונות הגדרתי אותה לשמש כנתב בין מספר חיבורים פיזיים ומספר הגדרות וניתובים לא היו מוגדרים בצורה נכונה ומשכך אותה מכונה פיזית (לא שרת שהריץ מכונות VM) התחיל "לשגע" את כל הרשת (זה הגיע למצב שגם רשתות ה-1 ג'יגהביט שלי החלו להיות איטיות בטירוף).

המקרים היותר מסובכים קשורים לכך שמריצים מכונות VM שונות שפותחות/יוצרות/קוראות אלפי קבצים בזמן קצר והאחסון לא ממש יודע לעמוד בכך (במיוחד כשמריצים RDS כ-VM עם אחסון מבוסס דיסקים מכניים) ואז כשמנסים להבין מדוע הדברים איטיים – כל גוף יפיל את זה על השני: ספק האחסון על ספק פתרון הוירטואליזציה, ספק פתרון הוירטואליזציה על מיקרוסופט ומיקרוסופט – על כולם. אז איך פותרים את זה?

לצערי, אין שום "פתרון קסם" לבצע תהליכים X,Y,Z והכל חוזר לעבוד בצורה תקינה. יש דברים אחרים שאפשר לבצע שתיכף אפרט, אבל מי שהכי יעזור לך – זה אותו אחד מקצועי שעושה לך את האינטגרציה בין החלקים השונים. אל תבנה יותר מדי על התמיכה של יצרן האחסון שלך – ככל שהתקלה שיש לך יותר מורכבת, הסיכוי שהם יעזרו לך – קטן יותר, ושוב – תתכונן בלא מעט מקרים לתהליך של "פינג פונג" (ד"ש חם ל-HPE).

במקום פתרון קסם, יש כמה דברים שאפשר לעשות, שיצריכו מעט "הפשלת שרוולים", וקצת הכרה של  לינוקס ואולי ידע בסקריפטים (במיוחד אם רוצים לשלב זאת כחלק מפתרון הניטור שיש):

  • הדבר הראשון שאני ממליץ, זה להשתמש בכלי בשם FIO. את הקוד של הכלי הזה אני ממליץ לקמפל באופן סטטי (בשימוש הפרמטר build-static– ), לפתוח תיקיה ב-Datastore כלשהו ולהעלות את הקובץ FIO הבינארי שקומפל לשם, ולוודא שיש לו הרשאות Executable. את הקובץ נריץ דרך SSH.
    הכלי (FIO) נותן לנו למדוד את מהירות הקריאה והכתיבה שיש לנו עם מדדים ופרמטרים שונים ובכך נוכל לדעת מהי מהירות הקריאה והכתיבה בין האחסון לשרת עצמו ישירות. כך נוכל לדעת אם הבעיה קשורה בתקשורת בין האחסון לשרת ולא בין האחסון למכונת VM כלשהי. חשוב: לבצע את הבדיקה עם כמה שפחות מכונות VM רצות על אותו שרת.
  • אנחנו יכולים להשתמש באותו כלי (ולחובבי Windows – יש את IOMeter שמבוסס על הקוד של FIO. את הכלי הזה, אגב, אפשר להריץ ישירות על Windows Server פיזי אם מדובר במכונה שנותנת שרותים דרך Hyper-V) כדי למדוד את אותם דברים שמדדנו קודם – אך הפעם אנחנו נמדוד בין מכונת ה-VM לאחסון, תוך שימוש ב-Datastore ובדיסק הקשיח הוירטואלי של אותו VM. שימו לב: התוצאות יכולות להיות שונות מהתוצאות שנקבל כתוצאה מבדיקה דרך הסעיף הקודם, הואיל והתרגום לדיסק הוירטואלי גובה מספר אחוזים בביצועים.
  • אם אתם מאלו שאוהבים כמה שיותר DATA כדי לאסוף כמה שיותר תובנות, בנו לעצמכם סקריפט שמשתמש ב-FIO כדי לבצע דגימות שונות ולאסוף את הנתונים לקובץ מסוים כדי לנתח אחר כך ולבדוק דגרגציה של פתרון האחסון ועוד.
  • אם הבעיה קיימת רק עם מכונות VM מסויימות, אז הבעיה אינה ממש קשורה לתקלות באחסון אלא יותר בכח של פתרון האחסון. הגיע הזמן להחליף למשהו יותר לכיוון ה-All Flash או לפחות עם פתרון Flash לכתיבה ו-Caching.
  • זה ישמע טריוואלי – אבל תפרידו תקשורת ברמה של פורטים ואם אפשר גם ברמה של סוויצ' – בין התקשורת מהאחסון לשרתים, לבין כל שאר הדברים. אני משער שחלק מהקוראים יאמרו "מה הבעיה עם VLAN?", אין בעיה – רק שבמקרים רבים אותם אלו שמגדירים נוטים לחתוך פינות ולפעמים ההגדרות לא יהיו נכונות ולא יסייעו. מצד שני – סוויצ' 10 ג'יגה כיום הוא דבר די זול.
  • דבר אחרון – כלים רגילים שמודדים ביצועים של דיסקים מכניים או SSD לא רלוונטיים במקרים של התקלות המדוברות בפוסט זה. זה נחמד להציג תמונות (או כדי למכור ללקוחות מצגת על פתרון) אבל התוצאות לא יהיו באמת נכונות (אתם באמת חושבים שמכונת ה-ZFS  הנ"ל בפועל יכולה לכתוב 1.2 ג'יגה בשניה בשעה שאין שום SSD? לא ממש, אבל ZFS יכול "לעבוד" על VMWare ובכך אפשר להציג את התוצאות הנ"ל, אם יש מספיק RAM בשרת, ובמקרה הזה – יש, 256 ג'יגה).

לסיכום: תקלות קרו, קורות ויקרו בהמשך. בחלק מהמקרים יקח כמה דקות לתקן ובחלק מהמקרים יהיה צורך לשרוף ימים כדי לגלות את התקלה. במקום לשרוף יותר מדי זמן, תתחילו להשתמש במתודות שונות – של דגימה ומעקב אחר תוצאות הדגימה כדי לדעת מה מקבלים בכל זמן ובכך להימנע מהפתעות בדרך.