الوصف الوظيفي
اغمر نفسك وقدم أفضل عمل في حياتك المهنية في DigitalOcean. انطلق بجانب مجتمع قوي من أفضل المواهب الذين لا يكلون في سعيهم لبناء سحابة قابلة للتوسع بأبسط الطرق. إذا كان لديك عقلية نمو، وتحب التفكير بشكل كبير وجريء، وتستمد طاقتك من بيئة سريعة الوتيرة لمخترق حقيقي في الصناعة، فستجد مكانك هنا. نحن نقدر الفوز معًا - بينما نتعلم، ونستمتع، ونحدث فرقًا عميقًا للمبدعين والبنائين في العالم.
تسعى منظمتنا لمحرك الاستنتاج إلى تعيين مدير هندسة ذو خبرة لقيادة فريق عالي الأداء من المهندسين أثناء تصميمهم وتطويرهم وتوسيع منصة استنتاج نموذج اللغة الكبير (LLM) عبر طبقات الخدمة والتنظيم والاستضافة. هذا الفريق هو قلب مهمتنا لجلب بساطة DigitalOcean الشهيرة إلى عالم استنتاج LLM المحسن. في هذا الدور، ستعمل على سد الفجوة بين استراتيجية المنتج والتنفيذ الفني، وتعزيز ثقافة التميز أثناء تقديم أنظمة قوية تتعامل مع ملايين المستخدمين حول العالم.
ما ستقوم به:قيادة الفريق وتطويره: توظيف وتوجيه وتدريب المهندسين في الفريق، وتعزيز ثقافة الملكية والتفوق الفني والتحسين المستمر.التنفيذ والتسليم: امتلاك تنفيذ مشاريع الفريق، وترجمة الأهداف التجارية العليا إلى خرائط طريق تقنية واضحة، ومعالم قابلة للقياس، وتسليم ناجح في الوقت المحدد.الشراكة عبر الوظائف: التعاون مع إدارة المنتجات، وفرق الهندسة الأخرى، وأصحاب المصلحة الرئيسيين لتنسيق الأولويات، وإدارة التبعيات، والتواصل بشأن التقدم والمخاطر.الصحة التشغيلية: ضمان صحة الإنتاج، والاستقرار، ودوران الخدمة لجميع الخدمات المملوكة لفريق تنظيم الاستنتاج.الإشراف على تصميم النظام: بالتعاون مع القادة الفنيين في فريقك، توجيه العمارة وتنفيذ منصة استنتاج موزعة محسنة لمنصات GPU المتنوعة (NVIDIA وAMD). ضمان أن تكون المنصة فعالة وقابلة للتوسع وموثوقة.دعم أفضل الممارسات: مؤسسية أطر القياس، والرصد، وقدرات الضبط التلقائي لتوجيه جهود ضبط النظام والبنية التحتية. تشجيع المساهمات في محركات الاستنتاج مفتوحة المصدر لتعزيز قدراتنا.العمارة والتخطيط الاستراتيجي: تحديد خريطة الطريق التقنية والإشراف على عمارة أنظمة جدولة عالية الإنتاجية لمجموعات Kubernetes الضخمة (1000+ عقد، 10000+ حاوية)، مع التركيز على تقنيات القابلية للتوسع مثل عمارة متعددة المجدولين وإرسال دفعات.زيادة استخدام GPU: تصميم حلول لمشكلات الأداء المعقدة، بما في ذلك تحسينات طبقة الانتباه، وإدارة الذاكرة والدقة، والتوازي المتقدم عبر مجموعات GPU متعددة العقد. القضاء على هدر GPU في البيئات متعددة المستأجرين من خلال تنفيذ تخصيص GPU جزئي، واستغلال آليات مثل وحدات حجز KAI-Scheduler أو أدوات العزل الصارمة مثل HAMi، وتكوين جدولة عادلة زمنياً لتحقيق توازن الوصول إلى مجموعات فوق الحصة.تنسيق استنتاج معقد: تنفيذ وإدارة خطوط أنابيب استنتاج AI مفككة باستخدام أطر مثل NVIDIA Grove، وتنسيق نشرات متعددة المكونات (مثل قادة التهيئة، وعمال فك التشفير، وموجهات KV) مع توسيع تلقائي متعدد المستويات وترتيب بدء صريح.تحسين التوزيع والتوبولوجيا: نشر جدولة واعية بالتوبولوجيا لتوافق توزيع الحاويات مع أبعاد الأجهزة الفيزيائية، مثل اتصالات NVLink، ومسارات PCIe، وعقد NUMA، مما يقلل من زمن التواصل لعمليات متعددة GPU.أداء النظام وموثوقيته: قيادة المبادرات لتعزيز الأداء العام للمجموعة، بما في ذلك تحسين زمن جدولة الطلبات، وحمل خادم API، وتنفيذ آليات تحمل الأخطاء مثل Checkpoint/Restore للوظائف التدريبية الطويلة الأمد.إدارة تخزين AI وتحمل الأخطاء: تنسيق توزيع وزن النموذج بكفاءة باستخدام OCI Image Volumes وتنفيذ قدرات Checkpoint/Restore (عبر CRIU وNVIDIA cuda-checkpoint) لاستعادة الأخطاء في التدريب الطويل الأمد.الأمان والعزل: تحديد وإنفاذ أفضل الممارسات الأمنية لأحمال العمل AI، وضمان نشر بيئات عزل متعددة الطبقات وصناديق رملية للوكيل لتنفيذ التعليمات البرمجية غير الموثوق بها بأمان (مثل استخدام حاويات Kata، gVisor، أو microVMs).ما ستضيفه إلى DigitalOceanالخبرة: 10+ سنوات من الخبرة في هندسة البرمجيات، مع 6+ سنوات في دور قيادي تقني أو إداري، ويفضل أن يكون ذلك في بنية تحتية AI/ML أو منصات سحابية.العمق الفني: خبرة عميقة في تصميم الأنظمة الموزعة، وتقنيات AI/ML الحديثة، وKubernetes على نطاق واسع، واستنتاج LLM، وتنظيم أحمال العمل AI، والجدولة، وإدارة الموارد. القدرة على الانخراط في مناقشات فنية عميقة مع فريقك بشأن برمجة GPU (CUDA، ROCm)، ومحركات الاستنتاج (vLLM، SGLang)، والبنية التحتية على نطاق واسع.تحسين واعي بالأجهزة: معرفة استراتيجية بهندسة GPU (NVIDIA و/أو AMD)، والاتصالات (مثل NVLink)، وتوبولوجيا الأجهزة وتأثيرها المباشر على أداء التدريب والاستنتاج AI.هندسة الأنظمة والأمان: إلمام بالمفاهيم في داخل تشغيل الحاويات، والعزل النظامي، وسياقات الأمان لإدارة المخاطر في البنية التحتية المشتركة.الرصد وSLOs: خبرة في تحديد وتتبع وتشغيل مقاييس البنية التحتية العميقة ومقاييس الاستنتاج (مثل TTFT، TPOT) لدفع تحسينات الأداء وتحقيق أهداف مستوى الخدمة.عقلية المنتج: القدرة المثبتة على ترجمة المتطلبات الفنية المعقدة إلى ميزات منتج تركز على المستخدم. فهم التوازن بين الابتكار والموثوقية.التواصل: مهارات تواصل ممتازة، مع القدرة على شرح القرارات الفنية لأصحاب المصلحة غير الفنيين وتنسيق الفرق المتنوعة حول رؤية مشتركة.الملكية: شعور قوي بالملكية ودافع استباقي لتحديد وحل المشكلات التي تمنع فريقك من تقديم القيمة.*هذه الوظيفة تقع في بنغالور، الهند
JR: 2026-7839
#LI-Hybrid
لماذا ستعجبك العمل في DigitalOceanنحن نبتكر بهدف. ستكون جزءًا من شركة تكنولوجيا متطورة ذات مسار تصاعدي، تفخر بتبسيط السحابة والذكاء الاصطناعي حتى يتمكن البناؤون من قضاء المزيد من الوقت في إنشاء البرمجيات التي تغير العالم. كعضو في الفريق، ستكون سمكة قرش تفكر بشكل كبير وجريء ومبدع، مثل مالك يميل إلى العمل ولديه شعور قوي بالمسؤولية تجاه العملاء والمنتجات والموظفين والقرارات.نحن نعطي الأولوية لتطوير المسيرة المهنية. في DO، ستقوم بأفضل عمل في حياتك المهنية. ستعمل مع بعض من أذكى وأكثر الأشخاص إثارة في الصناعة. نحن منظمة عالية الأداء ستتحدى دائمًا تفكيرك بشكل كبير. سيوفر لك فريق تطوير المنظمة موارد لضمان استمرار نموك. نحن نقدم للموظفين تعويضات عن المؤتمرات والتدريب والتعليم ذي الصلة. جميع الموظفين لديهم الوصول إلى أكثر من 10000 دورة تدريبية على LinkedIn Learning لدعم نموهم وتطورهم المستمر.نحن نهتم برفاهيتك. بغض النظر عن موقعك، سنوفر لك مجموعة تنافسية من الفوائد لدعمك من خلال برنامج مساعدة الموظفين إلى لقاءات الموظفين المحليين إلى سياسة الإجازات المرنة، على سبيل المثال. بينما تظل الفلسفة حول فوائدنا هي نفسها في جميع أنحاء العالم، قد تختلف الفوائد المحددة بناءً على القوانين المحلية والتفضيلات.نحن نكافئ موظفينا. نطاق الرواتب لهذه الوظيفة يعتمد على بيانات السوق، وسنوات الخبرة ذات الصلة، والمهارات. قد تتأهل للحصول على مكافأة بالإضافة إلى الراتب الأساسي؛ تحدد مبالغ المكافأة بناءً على أداء الشركة والفرد. نحن نقدم أيضًا تعويضات الأسهم للموظفين المؤهلين، بما في ذلك منح الأسهم عند التوظيف وخيار المشاركة في برنامج شراء الأسهم للموظفين.DigitalOcean هي صاحب عمل يساوي الفرص. نحن لا نميز على أساس العرق أو الدين أو اللون أو النسب أو الأصل الوطني أو الطبقة أو الجنس أو التوجه الجنسي أو الهوية أو التعبير عن الجنس أو العمر أو الإعاقة أو الحالة الطبية أو الحمل أو التركيبة الجينية أو الحالة الاجتماعية أو الخدمة العسكرية.حدود التقديم: يمكنك التقديم على حد أقصى 3 وظائف خلال أي فترة 180 يومًا. تعزز هذه السياسة مطابقة أفضل بين الأدوار والمرشحين وتشجع على تقديم طلبات مدروسة حيث تتماشى مؤهلاتك بشكل أقوى.
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.