استخدام کارشناس SRE Tier 1
شرح موقعیت شغلی
اطلاعات شغل
- حداقل 2 سال تجربه ی کار
- موقعیت حضوری و تمام وقت
- ترجیحا زیر 30 سال
- امکان کار شیفتی
هدف شغل
جمع آوری داده از سیستم های مختلف، ایجاد پایگاه اطلاعاتی در راستای گزارش گیری و تحلیل آنها برای ایجاد اطلاعات قابل استفاده در تصمیمات سازمانی و خودکار سازی این فرآیند ها در تعامل با تیم های مختلف
مهارت های مورد نیاز
- توانایی کار تیمی
- مسئولیت پذیری و توانایی خود راهبری در امور محوله
- علاقه مند به حل چالش ها و یادگیری مباحث جدید
- تمرکز بالا
- توانایی حل مسئله
- رویکرد خلاقانه در حل مساله
- توانایی فعالیت در فشار کاری زیاد
- توانایی اضافه کاری با توجه به نظر مدیر پیشبرد پروژه
- دانش کافی از سیستم های distributed، معماری میکروسرویس ها و تکنولوژی های Cloud-Native
- درک عمیق مفاهیم سیستم عامل، شبکه و معماری کامپیوتر
- تجربه با ابزار های Ingress از قبیل Nginx, HA Proxy, IIS و …
- تجربه کار با ابزار های Cloud محور از قبیل Docker, K8S و …
- تجربه ی کار با ابزار های CI/CD از قبیل Jenkins, Gitlab Runner و …
- تسلط بر برنامه نویسی (Script) با حداقل یکی از ابزار های Python, .NET, Bash, Node.js
- تجربه ی کار با ابزار های مانیتورینگ مانند Zabbix, Prometheus, Grafana
- توانمند در حوزه ی مدیریت رخداد (incident) و توانایی Triage و عیب یابی
- تسلط بر مفاهیم ارائه خدمات و تعریف متریک های عملیاتی ارزیابی عملکرد سیستم (Reliability, Availability)
- آشنایی با مدیریت پایگاه های داده و performance tuning
- توانمندی در راه اندازی و پیکربندی سیستم های لینوکس و ویندوز
وظایف
- همکاری با تیم های توسعه در راستای حصول اطمینان از Reliability, Availability, Performance سیستم های طراحی شده
- بررسی مداوم وضعیت سرویس ها، شناسایی مشکلات احتمالی، گزارش وضعیت و برنامه ریزی در راستای ظرفیت و مدیریت رخداد
- شرکت در برنامه های On-Call و پاسخگویی به رخداد ها در سریع ترین زمان
- همکاری در برنامه ریزی و نگهداری SLI, SLO های سیستمی
- اعمال best practice های SRE در چرخه ی توسعه ی سیستم ها
- طراحی و پیاده سازی راهکار های مانیتورینگ و اطلاع رسانی جامع در راستای شناسایی سریع رخداد ها و مشکلات احتمالی
- اجرای Post-mortem و RCA به منظور کشف دلایل احتمالی رخداد ها، شناسایی دلایل ریشه ای و برنامه ریزی اقدامات اصلاحی در همکاری با تیم های برنامه ریزی
- خودکار سازی فرآیند های عملیاتی در راستای کاهش خطای انسانی و افزایش بهره وری
- پیاده سازی و نگهداری اقدامات تعریف شده در BCP و DRP
- همکاری با سایر متخصصان برای ارائه بهترین محصولات و خدمات مطابق با چشم انداز و ماموریت های شرکت
- بروزرسانی مستمر فرآیند ها، ابزار ها و مستندات برای ارتقای دانش شخصی و جمعی اعضای تیم (Workflow, Toolchain, Documents)
آموزش های قبل از شروع کار
- آشنایی با شرکت، ساختار سازمانی
- آشنایی با محصولات و خدمات
- آشنایی با ابزار ها و روش های کاری
- آشنایی با سیاست های سازمانی
- آشنایی با زیرساخت فعلی
آموزش های حین کار
- برنامه و اسکریپت نویسی
- مفاهیم پیشرفته ابری
- برخی مهارت های امنیتی
- مهارت های نرم و شخصیتی
- فقدان هر یک از صلاحیت های فوق با توجه به مسیر شغلی
مهارتهای مورد نیاز
- SRE
- tier 1
- Docker
- ZABBIX
- Grafana
حداقل سابقه کار
- سه تا شش سال
جنسیت
- مهم نیست
وضعیت نظام وظیفه
- مهم نیست