استخدام مهندس ارشد قابلیت اطمینان سایت (Senior SRE-مشهد)
شرح موقعیت شغلی
مهندس ارشد قابلیت اطمینان سایت (Senior SRE) - پایش، تحلیل و بهینهسازی سرویسها
ما در گرین پلاس به دنبال یک Senior SRE هستیم که با استفاده از ابزارهای مانیتورینگ، تحلیل عمیق خطاها و ارائه راهکارهای بهینهسازی، به افزایش پایداری و کارایی سرویسهای ابری و توزیعشده کمک کند. این موقعیت برای فردی مناسب است که تجربه گستردهای در تحلیل عملکرد سیستمها، رفع مشکلات زیرساختی و بهینهسازی فرآیندهای مانیتورینگ دارد.
مسئولیتها:
- پایش و تحلیل عملکرد سرویسها و زیرساختها با ابزارهایی مانند Grafana و OpenSearch.
- بررسی و رفع مشکلات سطح سه (L3 Support) مربوط به عملکرد و پایداری سیستمها.
- اجرای فرآیندهای تحلیل علل ریشهای مشکلات (RCA) و ارائه راهکارهای اصلاحی.
- بهینهسازی SLAها و SLOها برای افزایش کیفیت و قابلیت اطمینان سرویسها.
- توسعه داشبوردهای مانیتورینگ و هشداردهی برای مشاهدهپذیری بهتر سیستمها.
- خودکارسازی فرآیندهای پایش و پاسخگویی به رخدادهای بحرانی.
- همکاری نزدیک با تیمهای DevOps، کلود و محصولی برای بهبود عملکرد سیستمها.
مهارتها و شرایط:
- حداقل ۵ سال تجربه در حوزه SRE، مانیتورینگ، DevOps یا تحلیل عملکرد سیستمها.
- تسلط بر ابزارهای مانیتورینگ مانند Grafana و OpenSearch.
- تجربه در تحلیل لاگها و تریسینگ خطاها برای رفع مشکلات سطح سه.
- تسلط بر کوبرنتیز و فناوریهای مجازیسازی.
- آشنایی با سیستمهای توزیعشده، شبکه و پایگاه داده.
- آمادگی برای حضور در شیفتهای آنکال (On-Call) و رسیدگی به رخدادهای بحرانی.
چرا به تیم ما بپیوندید؟
چالشهای فنی هیجانانگیز در بهینهسازی سرویسهای ابری و توزیعشده
همکاری با تیمهای پیشرو در حوزه Cloud و DevOps
حقوق و مزایای رقابتی + مسیر رشد حرفهای در تیم SRE
چالشهای فنی هیجانانگیز در بهینهسازی سرویسهای ابری و توزیعشده
همکاری با تیمهای پیشرو در حوزه Cloud و DevOps
حقوق و مزایای رقابتی + مسیر رشد حرفهای در تیم SRE
مهارتهای مورد نیاز
- SRE
- مانیتورینگ
- DevOps
حداقل سابقه کار
- سه تا شش سال
جنسیت
- مهم نیست
وضعیت نظام وظیفه
- مهم نیست