תחזיקו חזק: מתברר שגוגל עדיין משתמשת בכונני HDD
גוגל חשפה שהיא עדיין מפעילה את רוב מערכותיה עם כונני HDD ולא SSD, אבל רותמת את ה-AI כדי לשלב בין השניים

solid-state-drive, תמונה: Pixabay
למרות שמהפכת ה-SSD שינתה את עולם האחסון, גוגל חשפה שהיא עדיין מפעילה את רוב מערכותיה עם כוננים קשיחים (HDD). היא לא עושה את זה מטעמי נוסטלגיה – אלא כי היא בונה על היגיון כלכלי וטכנולוגי: כונני HDD מספקים עלות נמוכה מאוד לג'יגהבייט, ולכן הם מתאימים לאחסון המוני. הבעיה? הם עובדים לאט. מאוד לאט.
כונני HDD משתמשים בתנועה מכנית – זרוע שקוראת מידע מדיסק מסתובב. לכן הם מגיבים לאט, כותבים וקוראים לאט, ונפגעים בקלות מזעזועים. לעומתם, SSD מבוססים על זיכרון פלאש, בלי חלקים נעים. הם מגיבים מהר, מתמודדים טוב עם עומסים, ושומרים על ביצועים עקביים גם בגישה אקראית.
מי שרוצה אחסון זול – בוחר HDD. מי שצריך מהירות – עובר ל-SSD. גוגל, לעומת זאת, בחרה בדרך השלישית: היא שילבה את שתי הטכנולוגיות והכניסה בינה מלאכותית שתנהל את השכבות.
Colossus ו-L4: כך גוגל מנתבת את המידע
מערכת האחסון Colossus מריצה את כל שירותי הענן של גוגל ומכילה עשרות אקסה-בייט של נתונים. גוגל מאחסנת את רוב המידע ב-HDD, אבל מערכת ניהול פנימית בשם L4 מנתחת דפוסי שימוש, מפעילה אלגוריתמים ולמידת מכונה – ומחליטה אילו נתונים להעביר ל-SSD כדי לשפר את הביצועים ולקצר זמני תגובה.
כל העדכונים של ITtime עכשיו גם בערוץ הטלגרם שלנו
לדוגמה, כשמשתמשים צורכים שוב ושוב קובץ סטטי ביוטיוב – L4 מזהה את הדפוס ומעבירה את הקובץ ל-SSD. היא מתחזקת אינדקס שמתעדכן כל הזמן, כך שכאשר שירות מבקש קובץ, הוא מקבל הפניה ישירה ל-SSD. אם הנתון לא נמצא שם – L4 טוענת אותו מה-HDD ומחליטה אם שווה להקפיץ אותו לזיכרון המהיר.
לא הכול מושלם – והפערים מורגשים
למרות ההצלחות, גוגל מודה שגם למערכת הזו יש מגבלות. כשאפליקציה יוצרת קובץ, קוראת אותו ומוחקת אותו תוך זמן קצר – כמו בתהליכי עיבוד זמניים או לוגים של מסדי נתונים – L4 לא תמיד מספיקה להגיב בזמן. לכן היא פחות יעילה בסוגי מידע כאלה.
בנוסף, למרות שמחירי SSD יורדים, העלות עדיין גבוהה משמעותית לעומת דיסקים קשיחים. לכן גוגל שואפת למקסם את היתרונות של כל טכנולוגיה – ולהתאים כל סוג מידע למיקום שיספק את הביצועים הכי טובים במחיר המשתלם ביותר.
תכנון חכם, קבלת החלטות מהירה, חיסכון אמיתי
היתרון הגדול של L4 לא מסתכם בתגובה לדפוסי שימוש – היא גם יודעת לחזות קדימה. כשאפליקציה יוצרת קובץ חדש, היא מעבירה למערכת רמזים – כמו סוג הקובץ או מידע על טור במסד נתונים – ו-L4 מריצה סימולציה של מדיניות אחסון: למשל, "שמור על SSD לשעה", "לשעתיים" או "אל תעלה ל-SSD בכלל". על סמך התוצאות, היא בוחרת את המדיניות האופטימלית.
גוגל גם משתמשת בסימולציות כדי לחשב כמה עומסי I/O היא יכולה להסיט מה-HDD אל ה-SSD – בהתאם לנפח הזמין. כך היא מתכננת רכישות חומרה, ומקצה משאבים בין שירותים כדי להגדיל את היעילות.
נכון לעכשיו, גוגל ממשיכה לדבוק בגישה ההיברידית – רק עם הרבה יותר אינטליגנציה בצד של ניהול הנתונים. היא שואפת לשמור על יחס עלות-תועלת מדויק, בלי לוותר על ביצועים במקומות הקריטיים.