




الملخص: يضمن مهندس موثوقية المواقع (SRE) موثوقية الأنظمة الإنتاجية وقابليتها للتوسع وأدائها من خلال الأتمتة واستجابة الحوادث وقابلية المراقبة. أبرز النقاط: ١. ضمان موثوقية الأنظمة الإنتاجية وقابليتها للتوسع وأدائها. ٢. تصميم البنية التحتية الإنتاجية والأتمتة وبناؤها والحفاظ عليها. ٣. قيادة استجابة الحوادث واتخاذ الإجراءات التصحيحية لتعزيز موثوقية الأنظمة. **مهندس موثوقية المواقع (SRE) — وصف الوظيفة** **نظرة عامة** * ضمان موثوقية الأنظمة الإنتاجية وقابليتها للتوسع وأدائها من خلال تطبيق هندسة البرمجيات على عمليات التشغيل، وبناء أنظمة الأتمتة، وتحسين استجابة الحوادث وقابلية المراقبة. **المهام الرئيسية** * تصميم البنية التحتية الإنتاجية والأتمتة وأدوات المنصة وبناؤها والحفاظ عليها لتقليل المهام الروتينية وتحسين الموثوقية. * تحديد مقاييس مستوى الخدمة (SLOs) ومؤشرات مستوى الخدمة (SLIs) وتتبعها، وقياس ميزانيات الأخطاء، واتخاذ إجراءات التصحيح لتحقيق أهداف التوافر. * تنفيذ خطوط أنابيب التكامل المستمر/التسليم المستمر (CI/CD) والتشغيل الآلي للنشر واستراتيجيات الإصدار (الأزرق/الأخضر، الاختباري). * بناء أنظمة المراقبة وتسجيل السجلات والتتبع والإشعارات؛ وإنشاء لوحات التحكم والتعليمات التشغيلية (Runbooks) للفِرق المتاحة للعمل في نوبات الاستدعاء. * قيادة استجابة الحوادث، وتنسيق المراجعات ما بعد الحوادث (تحليل الجذور/محاضر ما بعد الحوادث دون توجيه اللوم)، ودفع الإجراءات التصحيحية. * إجراء تخطيط السعة وضبط الأداء وتحسين الموارد للخدمات والبنية التحتية. * إدارة ومناولة منصات تنسيق الحاويات (Kubernetes/EKS/GKE/AKS) والخدمات الداعمة لها. * أتمتة توفير التكوين باستخدام منهجية البنية التحتية كـكود (IaC) (Terraform، CloudFormation، Ansible) وإدارة الأسرار والتكوين بشكل آمن. * تنفيذ معماريّات قادرة على التحمل أمام الأعطال، واستراتيجيات التعافي من الكوارث، والاستراتيجيات الاحتياطية، والتصاميم متعددة المناطق. * التعاون مع المطورين لتحسين قابلية المراقبة والموثوقية والاستعداد التشغيلي للخدمات. * تأمين الأنظمة وفق متطلبات الأمان والامتثال؛ وتنفيذ عمليات التحديث، وفحص الثغرات، وضوابط الوصول. * توجيه الفرق الهندسية بشأن أفضل الممارسات المتعلقة بالموثوقية والمساهمة في ثقافة مهندسي موثوقية المواقع (SRE) وأدواتها. **المهارات والمؤهلات المطلوبة** * خبرة تتراوح بين ٣–٦ سنوات أو أكثر في مجال مهندسي موثوقية المواقع (SRE) أو عمليات التطوير والتشغيل (DevOps) أو هندسة عمليات الإنتاج (حسب المستوى المطلوب). * خبرة قوية في منصات السحابة (AWS، GCP، Azure) والخدمات المُدارة. * إتقان تقنيات حاويات التطبيقات والتنسيق (Docker، Kubernetes) والأدوات المرتبطة بها (Helm، Istio/Linkerd اختياري). * خبرة في منهجية البنية التحتية كـكود (Terraform، CloudFormation) وإدارة التكوين. * مهارات برمجية/نصوصية قوية (Python، Go، Bash) للأتمتة وتطوير الأدوات. * دراية بمحطات قابلية المراقبة (Prometheus، Grafana، Datadog، ELK/Opensearch، Jaeger/Zipkin). * فهم عميق للشبكات وتوزيع الحمل والتخزين وتفاصيل أنظمة التشغيل (Linux). * خبرة في تنفيذ خطوط أنابيب التكامل المستمر/التسليم المستمر (GitHub Actions، Jenkins، GitLab CI) وأتمتة عمليات الإصدار. * خبرة مثبتة في إدارة الحوادث والقدرة على العمل تحت الضغط. * مهارات تعاونية وتواصلية وتوثيقية قوية. **مفضّل** * خبرة في تحديد أطر مقاييس مستوى الخدمة (SLO/SLA) ودفع اعتمادها على نطاق المؤسسة. * خلفية في الأنظمة الموزعة أو الخدمات الإنتاجية ذات النطاق الواسع أو هندسة المنصات. * خبرة في هندسة الفوضى أو حقن الأعطال أو اختبار المرونة. * دراية بمنهجية السياسات كـكود (OPA، Sentinel) وشبكات الخدمات وسير عمل GitOps. * شهادات معتمدة (CKA، أو شهادات AWS/Azure/GCP) أو مساهمات في أدوات مفتوحة المصدر لمجال مهندسي موثوقية المواقع (SRE). الراتب: ١٥٬٣٢١٫٤٤ ر.ق. إلى ٢٢٬٢١٤٫٠٩ ر.ق. شهريًا مكان العمل: شخصيًا


