




الملخص: نبحث عن مهندس ديف أوبس لقيادة نشر وتكوين وتشغيل حمولات العمل الخاصة بالذكاء الاصطناعي، والافتراض باستخدام KVM، والبيئات المدعومة بوحدات معالجة الرسومات (GPU) لاستنتاج النماذج اللغوية الكبيرة (LLM). أبرز النقاط: 1. قيادة نشر وتكوين المنصات المحلية القائمة على لينكس الخاصة بحمولات العمل الخاصة بالذكاء الاصطناعي. 2. تصميم وتنفيذ البيئات المدعومة بوحدات معالجة الرسومات (GPU) لاستنتاج النماذج اللغوية الكبيرة (LLM). 3. تطبيق ممارسات قوية في مجال DevSecOps واستراتيجيات التوفر العالي/الاستعادة من الكوارث (HA/DR). المسمى الوظيفي: مهندس ديف أوبس المدة: شهرين الموقع: قطر (في الموقع) سنوات الخبرة: 5\+ سنوات فترة الإشعار: فورًا المهام والمسؤوليات * قيادة نشر وتكوين المنصات المحلية القائمة على لينكس الخاصة بحمولات العمل الخاصة بالذكاء الاصطناعي. * تصميم وتكوين الافتراض باستخدام KVM. * تصميم وتنفيذ بيئات مدعومة بوحدات معالجة الرسومات (GPU) للاستنتاج الإنتاجي للنماذج اللغوية الكبيرة (LLM). * نشر وتشغيل مكدس خدمة النماذج اللغوية الكبيرة (LLM) المعتمد على الحاويات في بيئة الإنتاج. * تصميم والتحقق من استخدام وحدات معالجة الرسومات (GPU) والعزل الخاص بها ورصد صحتها. * دمج عمليات النشر مع خطوط أنابيب التكامل المستمر/التوصيل المستمر (CI/CD) والضوابط الأمنية. * تطبيق تقنيات تأمين الأنظمة، وضبط الوصول القائم على الأدوار (RBAC)، والتشفير، والتكوينات الجاهزة لمراجعة السجلات (audit-ready). * تصميم استراتيجيات التوفر العالي (HA) والاستعادة من الكوارث (DR) وإعداد الأنظمة للتوسع المستقبلي. * قيادة عمليات استكشاف الأخطاء وإصلاحها، وضبط الأداء، وتثبيت الأنظمة. * إعداد وثائق التصميم المعماري، والكتيبات التشغيلية (runbooks)، ومواد التسليم. * المهارات الأساسية * خبرة لا تقل عن 5\+ سنوات في مجالات ديف أوبس أو هندسة المنصات أو هندسة البنية التحتية. * مهارات قوية في إدارة أنظمة لينكس، بما في ذلك الشبكات، والتخزين، وضبط الأداء، وتأمين الأنظمة.environments.equivalent).runtimes.Inference Server.vector databases (e.g., Qdrant), and observability tools. * خبرة عملية في نشر وتشغيل النماذج اللغوية الكبيرة (LLM) في بيئة الإنتاج على الأنظمة المحلية. * خبرة مُثبتة في إدارة بنية تحتية مزودة بوحدات معالجة الرسومات (GPU) من شركة إنفيديا (NVIDIA) (مثل H100، A100، H200 أو ما يعادلها). * خبرة عملية في تثبيت وتكوين وتصحيح أخطاء برامج تشغيل CUDA ووحدات معالجة الرسومات (GPU). * خبرة في التعامل مع حمولات العمل المعتمدة على الحاويات باستخدام Docker أو بيئات تشغيل متوافقة مع معيار OCI. * خبرة عملية في إطارات خدمة النماذج اللغوية الكبيرة (LLM) مثل vLLM أو TensorRT-LLM أو Triton Inference Server. * خبرة في تصميم ودعم رصد استخدام وحدات معالجة الرسومات (GPU) والعزل الخاص بها وأداء هذه الوحدات. * خبرة قوية ومباشرة في استخدام تقنية الافتراض باستخدام KVM في بيئة الإنتاج. * خبرة في التعامل مع مكدس تطبيقات الذكاء الاصطناعي الحديث، بما في ذلك واجهات برمجة التطبيقات الخلفية (backend APIs)، وPostgreSQL، * خبرة قوية في استخدام أدوات البنية التحتية كشيفرة (Infrastructure as Code) وأدوات الأتمتة، ومنها Ansible. * خبرة عملية في تصميم وتشغيل خطوط أنابيب التكامل المستمر/التوصيل المستمر (CI/CD) في البيئات المؤسسية. * خبرة عملية في استخدام Kubernetes في البيئات المحلية (on-premises). * فهم قوي وخبرة عملية في تطبيق ممارسات DevSecOps، * بما في ذلك خطوط الأنابيب الآمنة، ودمج أدوات تحليل الشيفرة الثابتة (SAST)، وإدارة الأسرار، والوصول ذي الصلاحية الدنيا (least-privilege access). * خبرة في تصميم أو دعم استراتيجيات التوفر العالي والاستعادة من الكوارث، بما في ذلك مفهوم النسخ الاحتياطي والاسترجاع والتبديل التلقائي (failover). * خبرة قوية في العمل ضمن بيئات محلية (on-prem)، أو بيئات معزولة تمامًا (air-gapped)، أو البيئات الخاضعة للتنظيم. مكان العمل: شخصيًا


