




الملخص: مهندس رئيسي لموثوقية المواقع (SRE) مسؤول عن تحديد استراتيجية موثوقية المواقع، وبناء قدرات المنصة، ودفع الثقافة لتحسين وقت التشغيل وقابلية التوسع للأنظمة الموزَّعة. أبرز النقاط: ١. القيادة في التصميم والتنفيذ والتشغيل لأنظمة عالية التوفر. ٢. تحديد وامتلاك استراتيجيات مؤشرات الأداء التشغيلي (SLOs/SLIs) والرصد والتنبيه. ٣. توعية وتنمية مهندسي موثوقية المواقع (SRE) ومهندسي المنصات؛ والقيادة في التوظيف والتطوير. **مهندس رئيسي لموثوقية المواقع (SRE) — وصف الوظيفة وملخّص الدور** قيادة موثوقية وقابلية التوسع وسهولة التشغيل للأنظمة الموزَّعة من خلال تحديد استراتيجية موثوقية المواقع، وبناء قدرات المنصة، ودفع الثقافة والعمليات التي تقلل من المهام الروتينية وتحسّن وقت التشغيل. **المهام الرئيسية** * قيادة التصميم والتنفيذ والتشغيل لأنظمة إنتاج عالية التوفر وقابلة للتوسع عبر بيئات السحابة والبيئات المحلية (on-prem). * تحديد وامتلاك مؤشرات الأداء التشغيلي (SLOs/SLIs) وميزانيات الأخطاء واستراتيجيات الرصد والتنبيه؛ ودفع اعتماد مؤشرات الأداء التشغيلي عبر الفرق. * قيادة استجابة الحوادث، ومراجعات ما بعد الحوادث، وتحليل الأسباب الجذرية، والإجراءات التصحيحية؛ وتنفيذ التدابير الوقائية. * بناء وصيانة مكدسات إمكانية المراقبة (القياسات، السجلات، التتبع) ولوحات التحكم (Prometheus، Grafana، ELK/EFK، OpenTelemetry). * تصميم وتشغيل منصات التكامل المستمر/النشر المستمر (CI/CD) والنشر (ArgoCD، Spinnaker، GitHub Actions، GitLab CI) التي تتيح عمليات نشر آلية وآمنة (مثل النشر التدريجي، والنشر الأزرق/الأخضر، وعلمات الميزات). * تصميم وتنفيذ وصيانة أدوات المنصة ذاتية الخدمة للمطورين (Kubernetes/EKS/GKE/AKS، شبكات الخدمات، المشغلين). * دفع ممارسات البنية التحتية كـكود (Infrastructure as Code) (Terraform مطلوب؛ وCloudFormation/Pulumi ميزة إضافية)، وإدارة دورة حياة البنية التحتية وكشف الانحرافات والامتثال. * أتمتة كتب الإرشادات التشغيلية، والإجراءات التصحيحية، وتخطيط السعة، والصيانة الروتينية لتقليل المجهود اليدوي إلى أدنى حد. * امتلاك الممارسات الأمنية المرتبطة بالموثوقية: إدارة الأسرار، وإدارة هوية الوصول (IAM)، وسياسات الشبكة، وفحص الثغرات، والتكوينات الآمنة. * توعية وتنمية مهندسي موثوقية المواقع (SRE) ومهندسي المنصات؛ والقيادة في التوظيف، ومراجعات الأداء، والتطوير المهني. * التعاون مع فرق الهندسة والمنتج والأمن للتأثير في قرارات التصميم المتعلقة بالتحمل العطالي وسهولة التشغيل. * إدارة جداول الاستدعاء (on-call)، وسياسات التصعيد، وضمان التغطية الكافية؛ والتنسيق بين الفرق أثناء الحوادث الكبرى. * دفع تحسين الكفاءة التكلفة، ومراقبة الإنفاق السحابي، والتنبؤ بالسعة. **المؤهلات المطلوبة** * ٧ سنوات أو أكثر في أدوار هندسة موثوقية المواقع أو هندسة المنصات أو هندسة ديف أوبس مع مسؤوليات قيادية متزايدة. * خبرة مثبتة في تشغيل أنظمة إنتاج موزَّعة على نطاق واسع على أحد موفري الخدمات السحابية الرئيسيين (AWS، GCP، أو Azure). * خبرة عميقة في Kubernetes وأنظمة الحاويات؛ وخبرة في تشغيل مجموعات كبيرة وبيئات متعددة المجموعات. * خبرة قوية في البنية التحتية كـكود (IaC) (Terraform مطلوب؛ وCloudFormation/Pulumi ميزة إضافية). * خبرة واسعة في أدوات إمكانية المراقبة (Prometheus، Grafana، ELK/EFK، OpenTelemetry) ومنصات إدارة الحوادث (PagerDuty، Opsgenie). * مهارات قوية في هندسة البرمجيات (Python، Go، أو ما يعادلهما) لأتمتة العمليات وتطوير الأدوات وهندسة الموثوقية. * خبرة مُثبتة في وضع وفرض مؤشرات الأداء التشغيلي (SLOs/SLIs) وتقليل متوسط زمن الاستعادة (MTTR) من خلال الممارسات الهندسية. * خبرة في أنظمة التكامل المستمر/النشر المستمر واستراتيجيات النشر (Argo CD، Spinnaker، Flux، Git Ops). * أساسيات قوية في الأنظمة والشبكات والأمن. * مهارات قيادية واتصالية ممتازة وإدارة أصحاب المصلحة؛ وقدرة مُثبتة على التأثير عبر التنظيمات. * خبرة في توجيه المهندسين وقيادة المبادرات متعددة الوظائف. أنواع الوظائف: دوام كامل، دائم الراتب: ٢٣٫٧١ ر.ق. – ٨٦٫٤٥ ر.ق. لكل ساعة عدد الساعات المتوقع: ٤٠ ساعة أسبوعيًا مكان العمل: شخصي


