الوصف الوظيفي
يرجى تقديم سيرتك الذاتية باللغة الإنجليزية وتحديد مستوى إتقانك للغة الإنجليزية.
تربط Mindrift المتخصصين بفرص الذكاء الاصطناعي القائمة على المشاريع لشركات التكنولوجيا الرائدة، مع التركيز على اختبار وتقييم وتحسين أنظمة الذكاء الاصطناعي.
المشاركة قائمة على المشاريع، وليست توظيفًا دائمًا.
ما تتضمنه هذه الفرصة نحن نبني مجموعة بيانات لتقييم وكلاء البرمجة الذكية - مدى جودة تعامل النموذج مع مهام المطورين في العالم الحقيقي.
ستقوم بإنشاء مهام صعبة ومعايير تقييم ضمن بيئات محاكاة واقعية: بناء بيئات تطوير واقعية - شركة افتراضية مع قاعدة بيانات، وبنية تحتية، وسياق (تذاكر، مستندات، محادثات) تشكل تاريخ تطوير مقنع تصميم المهام من الحالات المتوسطة لهذه البيئات - صياغة المطالبات، تحديد ما يعنيه "محلول"، وضمان أن المهمة قابلة للحل بواسطة وكيل الذكاء الاصطناعي كتابة اختبارات تتحقق من حلول الوكلاء - قبول جميع الأساليب الصحيحة ورفض غير الصحيحة، لا صارمة جدًا ولا متساهلة تكرار المهام والاختبارات بناءً على ملاحظات ضمان الجودة - مراجعة حلول الوكلاء، تحليل الإخفاقات، وتحسين حتى يصبح التقييم عادلاً وقويًا ما ليس هذا ليس تصنيف بيانات ليس هندسة مطالبات ليس كتابة كود من الصفر - يكتب الوكيل معظم الكود؛ أنت توجه وتقيم ما نبحث عنه 5+ سنوات في تطوير البرمجيات مجموعة أساسية: بايثون (FastAPI)، جافا سكريبت/TypeScript (React)، دوكر، بوستجرس، كافكا، ريديس خبرة في كتابة الاختبارات (وظيفية، تكامل) إتقان اللغة الإنجليزية - B2+ لماذا هذا صعب النماذج المتقدمة جيدة بالفعل في البرمجة.
إنشاء مهمة تتحدى حقًا أفضل النماذج ليس بالأمر السهل.
تحتاج إلى فهم عميق لمكان فشل النماذج وما هي السيناريوهات التي تكشف الفرق بين الحل الجيد والسيئ.
تحتوي المهام على العديد من الحلول الصحيحة - كتابة اختبارات تقبل جميع الحلول الصحيحة وترفض غير الصحيحة أصعب مما يبدو.
كيف يعمل التقديم اجتياز المؤهلات الانضمام إلى مشروع إكمال المهام الحصول على الأجر تقدير الجهد المهام لهذا المشروع مقدرة لتستغرق 20 ساعة لإكمالها، اعتمادًا على التعقيد.
هذا تقدير وليس متطلبًا للجدول الزمني؛ يمكنك اختيار متى وكيف تعمل.
يجب تقديم المهام بحلول الموعد النهائي وتلبية معايير القبول المدرجة ليتم قبولها.
التعويض يصل إلى 50 دولارًا في الساعة، حسب المستوى والسرعة.
المهام مقدرة بحوالي 20 ساعة لكل منها؛ تحدد جدولك الزمني الخاص.
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.