כך הפכנו מחברה עם תשתית מקומית לכזו עם תשתית עולמית

התרחבות ענן היא אתגר לא פשוט, קבלו מספר לקחים ותובנות מאחד שעשה זאת

רותם הוכמן
24.2.25

מסע שהתחיל כפרויקט טכני לכאורה. תמונה: dreamstime

מאת: רותם הוכמן

העולם הטכנולוגי מתפתח במהירות, והרחבת תשתיות ענן לאזורים גיאוגרפיים חדשים מציבה אתגרים מורכבים ומרתקים. כמהנדס באוטודסק ישראל, הובלתי פרויקט להרחבת תשתיות AWS ל-Regions נוספים ומצאתי את עצמי צולל לעומקם של אתגרים ארכיטקטוניים ותפעוליים שלא צפיתי מראש. המסע הזה, שהתחיל כפרויקט טכני לכאורה, התגלה כהזדמנות ייחודית לרכוש תובנות מהותיות על תכנון מערכות גלובליות, ניהול תשתיות מבוזרות ואופטימיזציה של תהליכי עבודה בסביבה רב-אזורית.

בתחילת הפרויקט התברר כי ארכיטקטורת Region בודד אינה מספקת. נדרשנו לתכנן מחדש את תשתיות הענן מתוך ראייה גלובלית, מה שהוביל לפיתוח מודל שכבתי. המודל כולל חמש שכבות: תשתיות תקשורת בסיסיות (VPC, Subnets), משאבים משותפים, שירותים ייעודיים, בסיסי נתונים ותקשורת חוצת אזורים.

השכבה הראשונה, תשתיות התקשורת הבסיסיות, מהווה את הבסיס לכל הארכיטקטורה. בשכבה זו הגדרנו CIDR blocks ייחודיים לכל region, תוך שמירה על טופולוגיה אחידה שמקלה על ניהול ה-routing וה-security groups. הקפדנו על הפרדה לוגית באמצעות subnets ייעודיים עבור שירותים פנימיים וחיצוניים, עם תכנון מוקפד של טבלאות ניתוב ו-NAT Gateways.

בשכבת המשאבים המשותפים, מיקמנו שירותים כמו monitoring, logging ו-security tools שמשרתים את כלל הסביבה. הקמנו מערכת ניטור מרכזית המבוססת על CloudWatch עם dashboards אחידים לכל Region, ומערכת logging מרכזית המנתבת את כל הלוגים ל-centralized log repository. בנוסף, הטמענו כלי אבטחה אחידים כמו WAF ו-GuardDuty בכל Region.

שכבת השירותים הייעודיים תוכננה עם דגש על גמישות והתאמה לצרכים מקומיים. כל שירות מוגדר כ-microservice עצמאי עם קונפיגורציה משלו, אך עם ממשקים סטנדרטיים לתקשורת בין שירותים. השתמשנו ב-ECS ו-Kubernetes להרצת containers, עם יכולת לשנות פרמטרים כמו replica count ו-resource allocation לפי העומסים הספציפיים בכל region.

ההחלטה הכרחית שקצת האטה אותנו

ההחלטה להשקיע בהקמת תשתית (Infrastructure as Code (IaC מקיפה האטה את קצב ההתרחבות המיידי, אך התבררה כהכרחית. המערכת שנבנתה מאפשרת הקמה, ניהול ומחיקה של סביבות באופן מהיר, תוך הפחתת טעויות אנוש וייעול תהליכי העבודה. תהליכי ה-Deployment דרשו התאמות משמעותיות. שילוב GitOps עם Canary Deployment יצר מערכת פריסה שיטתית ומבוקרת. שימוש ב-ArgoCD אפשר סטנדרטיזציה של תהליכי הפריסה בין הסביבות, כשיכולת Rollback אוטומטית מספקת רשת ביטחון.

ניהול בסיסי הנתונים הציב אתגרים ייחודיים. פיתחנו אוטומציה מקיפה הן עבור שירותים מנוהלים כמו Aurora והן עבור בסיסי נתונים על EC2. מודולי Terraform מבצעים חישובי פרמטרים אוטומטיים, פונקציות Lambda מטפלות בהתקנות ראשוניות, וקוד Ansible מנהל קונפיגורציה מותאמת. הפרויקט חייב תיאום בין צוותי פיתוח, אבטחת מידע וניהול מוצר. צוות ה-DevOps פעל כמתכלל, תוך איזון בין דרישות גמישות ומהירות, אילוצי אבטחה ורגולציה, ויעדים עסקיים. התיאום בין הצוותים הוכח כגורם מכריע בהצלחת הפרויקט.

השפעה עסקית משמעותית על יכולת אספקת השירותים. תמונה: dreamstime

תהליך ההתרחבות הגלובלית הניב השפעה עסקית משמעותית על יכולת אספקת השירותים. הפריסה הגיאוגרפית המבוזרת, אפשרה אופטימיזציה של זמני תגובה באמצעות מיקום תשתיות בקרבת מוקדי הפעילות העסקית. בנוסף, התשתית המבוזרת מספקת גמישות בהתאמה לדרישות רגולטוריות מקומיות, במיוחד בתחומי אבטחת מידע, פרטיות ושמירת נתונים. ארכיטקטורת המולטי-ריג'ן תורמת משמעותית לשיפור השרידות התשתיתית באמצעות יתירות גיאוגרפית, המצמצמת את ההשפעה הפוטנציאלית של תקלות אזוריות על הפעילות העסקית הגלובלית. שילוב היתרונות הללו מייצר ערך עסקי משמעותי ומחזק את היכולת להתחרות בשוק הגלובלי.

בפרויקט מורכב בחברה גלובלית וגדולה יש השפעה מרכזית לתקשורת עם הצוותים השונים בארגון. שיתוף של סטטוס הפרויקט, ובניית פתרונות על בסיס הפידבק של הצוותים גרם לשיפור מתמיד בתהליך. בנוסף, ראינו ערך רב בתיעוד של תהליכים ויצירת Self Service Wikis עבור מענה על שאלות ותשובות שחזרו על עצמם, ושיתוף ידע. יצרנו אוטומציה על גבי Slack שבפניה ל Channal ייעודי יוצרת טיקטים ב Jira, הפעולה הזאת חסכה לנו עבודה ידנית של ניהול משימות, ובנוסף יצרה עבור הצוותים מקור ידע נגיש וקל לחיפוש. כרגע אנו עובדים על הוספת כלי AI שבהתבסס על שאלות עבר ב Slack ומידע מ Confluence ידע להשיב אוטומטית לשאלות.

שינויים גדולים מאלצים אותנו לצאת מאזור הנוחות – הם דורשים מאמץ, יצירתיות ותעוזה, אך בתוכם טמון פוטנציאל אדיר לצמיחה. הפרויקט הזה המחיש לי עד כמה הסתגלות, למידה מתמשכת ושיתוף פעולה הם המפתח להצלחה בסביבה טכנולוגית דינאמית. מעבר לפתרונות הארכיטקטוניים והטכנולוגיים, המסע הזה לימד אותי שהשקעה בתהליכים, בתקשורת ובאנשים היא לא פחות חשובה מהשקעה בתשתיות עצמן. חדשנות אמיתית נוצרת במקום שבו אתגר הופך להזדמנות, ושם בדיוק בחרנו לפעול.

הכותב הוא מהנדס DevOps באוטודסק ישראל

משרות פתוחות

קטגוריות

זה המקום להכיר את החברות, המשרדים וכל מי שעושה את ההייטק בישראל (ויש גם מלא משרות פתוחות!) #תוכן מקודם