الوصف الوظيفي
تبحث Mindrift عن مهندسي بيانات خادم بايثون أول ذوي مهارات عالية للعمل في مشروع Tendem ودفع تدفقات العمل المتخصصة في استخراج البيانات ضمن نظامنا الهجين من الذكاء الاصطناعي + البشر.
في هذا الدور، كطيار ذكاء اصطناعي - هذا هو الاسم الذي نطلقه على هذا الدور في Mindrift - ستتعاون مع وكلاء Tendem الذين يتعاملون مع المهام المتكررة، بينما تقدم التفكير النقدي، وخبرة المجال، ومراقبة الجودة لتقديم نتائج دقيقة وقابلة للتنفيذ.
هذه الفرصة عن بُعد بدوام جزئي مثالية للمهنيين الفنيين ذوي الخبرة العملية في استخراج البيانات ومعالجتها.
ماذا نفعل منصة Mindrift تربط المتخصصين بمشاريع الذكاء الاصطناعي من كبار مبتكري التكنولوجيا.
مهمتنا هي فتح إمكانيات الذكاء الاصطناعي التوليدي من خلال الاستفادة من الخبرات الواقعية من جميع أنحاء العالم.
هذه وظيفة مستقلة لمشروع Tendem.
كمهندس بيانات خادم بايثون أول، ستتعامل مع مهام استخراج البيانات التي تتطلب دقة تقنية لاستخراج البيانات من الويب ومعالجتها، باستخدام أدوات مختلفة مثل Apify و OpenRouter المقدمة من قبلنا بالإضافة إلى أساليبك الخاصة.
المسؤوليات الرئيسية: امتلاك تدفقات العمل لاستخراج البيانات من البداية إلى النهاية عبر مواقع الويب المعقدة، مع ضمان التغطية الكاملة، والدقة، والتسليم الموثوق لمجموعات البيانات المنظمة.
الاستفادة من الأدوات الداخلية (Apify، OpenRouter) جنبًا إلى جنب مع تدفقات العمل المخصصة لتسريع جمع البيانات، والتحقق، وتنفيذ المهام مع تلبية المتطلبات المحددة.
ضمان استخراج موثوق من مصادر الويب الديناميكية والتفاعلية، وتكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعروض بواسطة JavaScript وسلوك الموقع المتغير.
فرض معايير جودة البيانات من خلال فحوصات التحقق، وضوابط التناسق عبر المصادر، والامتثال لمواصفات التنسيق، والتحقق المنهجي قبل التسليم.
توسيع عمليات الاستخراج لمجموعات البيانات الكبيرة باستخدام التجميع الفعال أو التوازي، ومراقبة الفشل، والحفاظ على الاستقرار ضد التغييرات الطفيفة في هيكل الموقع.
المتطلبات: خبرة لا تقل عن 5 سنوات في هندسة البيانات، استخراج البيانات، الأتمتة، أو تطوير البرمجيات (مطلوب).
درجة البكالوريوس أو الماجستير في الهندسة، الرياضيات التطبيقية، علوم الحاسوب، أو المجالات التقنية ذات الصلة تعتبر ميزة.
يجب أن يكون لدى المرشحين أساس تقني قوي وخبرة عملية في البرمجة النصية، والأتمتة، وتدفقات العمل المدعومة بالذكاء الاصطناعي.
نحن نبحث عن متخصصين يمكنهم حل المشكلات غير التافهة، والعمل بثقة مع LLMs، وجمع، هيكلة، والتحقق من البيانات من مصادر متنوعة بشكل منهجي.
نهج منهجي ودقيق وقدرة على العمل بشكل مستقل أمران أساسيان.
خبرة قوية في استخراج البيانات باستخدام بايثون (BeautifulSoup، Selenium أو ما شابه)، بما في ذلك المحتوى الديناميكي (JS، AJAX، التمرير اللانهائي) وواجهات برمجة التطبيقات عبر البروكسيات. قدرة مثبتة على استخراج البيانات من هياكل معقدة (الهياكل الهرمية، الصفحات المؤرشفة، HTML غير المتسق). خلفية قوية في تنظيف البيانات، والتطبيع، والتحقق، وتقديم مجموعات بيانات منظمة (CSV، JSON، Google Sheets). خبرة مثبتة في التعامل مع آليات مكافحة الروبوتات والهياكل الديناميكية للمواقع على نطاق واسع. خبرة في البنية التحتية السحابية (AWS أو ما يعادلها) والتعبئة (Docker) كجزء من تدفقات العمل الحقيقية. خبرة عملية مع أطر LLM (LangChain، OpenRouter، أو ما شابه) المطبقة على مهام الأتمتة. اهتمام قوي بالتفاصيل والتزام بدقة البيانات. أخلاقيات عمل ذاتية التوجيه مع القدرة على استكشاف الأخطاء وإصلاحها بشكل مستقل. رابط إلى GitHub يعتبر ميزة. إجادة اللغة الإنجليزية: متوسطة عليا (B2) أو أعلى (مطلوب). توقعات الوقت للمشروع: بالنسبة لهذا المشروع، يُقدر أن المهام ستتطلب حوالي 10-20 ساعة في الأسبوع خلال المراحل النشطة، بناءً على متطلبات المشروع.
هذا تقدير، وليس عبء عمل مضمون، وينطبق فقط أثناء نشاط المشروع.
التعويض: في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 37 دولارًا في الساعة، حسب مستوى مساهمتهم وسرعتها.
يختلف التعويض عبر المشاريع حسب النطاق، التعقيد، والخبرة المطلوبة.
يرجى ملاحظة أن المشاريع الأخرى على المنصة قد تقدم مستويات ربح مختلفة بناءً على متطلباتها.
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.