תיאור תפקיד:
- תמיכה, פתרון תקלות ותחזוקה של מערכות HPC/AI בסביבת מעבדת מחקר
- פריסה וניהול מערכות כולל וירטואליזציה וסביבות אחסון on-prem ובענן
- עבודה בכלי DevOps כמו Ansible, Kubernetes, OpenShift
- הבטחה פרואקטיבית של רמות הזמינות הגבוהות ביותר של מערכות ותשתיות
- תחזוקת תזמון HPC/AI לאיזון אופטימלי של עומסי GPU/CPU
- יצירה וקידום של מדריכים ותיעוד
- עבודה ישירה עם מדענים לפתרון בעיות טכניות
דרישות:
- ניסיון של מעל 2-3 שנים בתחום
- השכלה רלוונטית בתחומי מערכות מידע / הנדסת תוכנה / הנדסת אלקטרוניקה / הנדסת מחשבים
- ניהול מערכות Linux
- ניסיון בחקירה וטיפול בבעיות ביצועים ותקלות מערכתיות מורכבות
- ניסיון עם טכנולוגיית מחשוב עתיר ביצועים, אשכולות חישוב וטכנולוגיית GPU
- ניסיון עם מערכות HPC/AI כולל עבודה עם כלים כגון Slurm/PBS/LSF
- ניסיון עם כלי פיתוח כגון VSCode, Pycharm כולל debug של תוכנות בשפת Python
- ניסיון בעבודה עם טכנולוגיות וירטואליזציה ואורקסטרציה Dockers, Openshift etc
- ניסיון בכתיבת סקריפטים Bash/ Python /Terraform
- ניסיון עם כלי DevOps כמו Ansible, Kubernetes, OpenShift
- ניסיון בעבודה עם כלי Azure DevOps, Git, JFrog artifactory
- נסיון בהקמת Pipelines ו Release pipelines מול שירותי ענן מנוהלים
- שליטת בשפות עברית ואנגלית ברמה גבוהה
היקף משרה:
משרה מלאה
קוד משרה:
JB-02265
אזור:
מרכז - תל אביב, פתח תקווה, רמת גן וגבעתיים, בקעת אונו וגבעת שמואל, חולון ובת-ים, מודיעין, שוהם
שרון - חדרה וזכרון יעקב, נתניה ועמק חפר, רעננה, כפר סבא והוד השרון, ראש העין, הרצליה ורמת השרון
דרום - אשדוד, קרית גת, אשקלון, קרית מלאכי
השפלה - ראשון לציון ונס- ציונה, רמלה לוד, רחובות, יבנה
|