كلما زادت طلبات التقديم التي ترسلينها، زادت فرصك في الحصول على وظيفة!

إليك لمحة عن معدل نشاط الباحثات عن عمل خلال الشهر الماضي:

عدد الفرص التي تم تصفحها

عدد الطلبات التي تم تقديمها

استمري في التصفح والتقديم لزيادة فرصك في الحصول على وظيفة!

هل تبحثين عن جهات توظيف لها سجل مثبت في دعم وتمكين النساء؟

اضغطي هنا لاكتشاف الفرص المتاحة الآن!
نُقدّر رأيكِ

ندعوكِ للمشاركة في استطلاع مصمّم لمساعدة الباحثين على فهم أفضل الطرق لربط الباحثات عن عمل بالوظائف التي يبحثن عنها.

هل ترغبين في المشاركة؟

في حال تم اختياركِ، سنتواصل معكِ عبر البريد الإلكتروني لتزويدكِ بالتفاصيل والتعليمات الخاصة بالمشاركة.

ستحصلين على مبلغ 7 دولارات مقابل إجابتك على الاستطلاع.


تم إلغاء حظر المستخدم بنجاح
https://bayt.page.link/rmw9sGXZzhLwqsyV6
العودة إلى نتائج البحث‎

مهندس بيانات متقدم في استخراج البيانات باستخدام بايثون (حر)

في الامس 2026/10/17
عن بُعد
خدمات الدعم التجاري الأخرى
أنشئ تنبيهًا وظيفيًا لوظائف مشابهة
تم إيقاف هذا التنبيه الوظيفي. لن تصلك إشعارات لهذا البحث بعد الآن.

الوصف الوظيفي

تبحث شركة ميندريفت عن مهندسي بيانات متقدمين في استخراج البيانات باستخدام بايثون للعمل على مشروع تندم ودفع سير العمل المتخصص في استخراج البيانات ضمن نظامنا الهجين للذكاء الاصطناعي + البشر.
في هذا الدور، كطيار ذكاء اصطناعي - هذا هو الاسم الذي نطلقه على هذا الدور في ميندريفت - ستتعاون مع وكلاء تندم الذين يتعاملون مع المهام المتكررة، بينما تقدم التفكير النقدي، والخبرة في المجال، ومراقبة الجودة لتقديم نتائج دقيقة وقابلة للتنفيذ.
هذه الفرصة عن بعد بدوام جزئي مثالية للمهنيين الفنيين ذوي الخبرة العملية في استخراج البيانات، واستخراج البيانات ومعالجتها.
ما نقوم به: تربط منصة ميندريفت المتخصصين بمشاريع الذكاء الاصطناعي من مبتكري التكنولوجيا الرئيسيين.
مهمتنا هي فتح إمكانيات الذكاء الاصطناعي التوليدي من خلال الاستفادة من الخبرة الواقعية من جميع أنحاء العالم.
هذا دور حر لمشروع تندم.
كمهندس بيانات متقدم في استخراج البيانات باستخدام بايثون، ستتعامل مع مهام استخراج البيانات التي تتطلب دقة تقنية لاستخراج البيانات من الويب ومعالجتها، باستخدام أدوات متنوعة مثل أداة Apify وOpenRouter المقدمة من قبلنا إلى جانب أساليبك الخاصة.
المسؤوليات الرئيسية: امتلاك سير عمل استخراج البيانات من البداية إلى النهاية عبر مواقع الويب المعقدة، مع ضمان التغطية الكاملة، والدقة، والتسليم الموثوق لمجموعات البيانات المنظمة.
الاستفادة من الأدوات الداخلية (Apify، OpenRouter) إلى جانب سير العمل المخصص لتسريع جمع البيانات، والتحقق، وتنفيذ المهام مع تلبية المتطلبات المحددة.
ضمان استخراج موثوق من مصادر الويب الديناميكية والتفاعلية، مع تكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعتمد على JavaScript وسلوك الموقع المتغير.
فرض معايير جودة البيانات من خلال فحوصات التحقق، وضوابط الاتساق عبر المصادر، والامتثال لمواصفات التنسيق، والتحقق المنهجي قبل التسليم.
توسيع عمليات استخراج البيانات لمجموعات بيانات كبيرة باستخدام التجميع الفعال أو التوازي، ومراقبة الفشل، والحفاظ على الاستقرار ضد التغييرات الطفيفة في هيكل الموقع.
المتطلبات: خبرة لا تقل عن 5 سنوات في هندسة البيانات، استخراج البيانات، الأتمتة، أو تطوير البرمجيات (مطلوب).
درجة البكالوريوس أو الماجستير في الهندسة، الرياضيات التطبيقية، علوم الكمبيوتر، أو المجالات التقنية ذات الصلة تعتبر ميزة.
يجب أن يكون لدى المرشحين أساس تقني قوي وخبرة عملية في البرمجة النصية، والأتمتة، وسير العمل المدعوم بالذكاء الاصطناعي.
نحن نبحث عن متخصصين يمكنهم حل المشكلات غير التافهة، والعمل بثقة مع نماذج اللغة الكبيرة، وجمع البيانات، وهيكلتها، والتحقق منها بشكل منهجي من مصادر متنوعة.
نهج منهجي، واهتمام بالتفاصيل والقدرة على العمل بشكل مستقل أمران أساسيان.
خبرة قوية في استخراج البيانات باستخدام بايثون (BeautifulSoup، Selenium أو ما شابه)، بما في ذلك المحتوى الديناميكي (JS، AJAX، التمرير اللانهائي) وواجهات برمجة التطبيقات عبر الوكلاء.
قدرة مثبتة على استخراج البيانات من الهياكل المعقدة (التسلسلات الهرمية، الصفحات المؤرشفة، HTML غير المتسق).
خلفية قوية في تنظيف البيانات، والتطبيع، والتحقق، وتقديم مجموعات بيانات منظمة (CSV، JSON، جداول بيانات جوجل).
خبرة مثبتة في التعامل مع آليات مكافحة الروبوتات وهياكل المواقع الديناميكية على نطاق واسع.
خبرة في البنية التحتية السحابية (AWS أو ما يعادلها) وحاويات (Docker) كجزء من سير العمل الحقيقي.
خبرة عملية مع أطر نماذج اللغة الكبيرة (LangChain، OpenRouter، أو ما شابه) المطبقة على مهام الأتمتة.
اهتمام قوي بالتفاصيل والتزام بدقة البيانات.
أخلاقيات العمل الذاتية مع القدرة على استكشاف الأخطاء وإصلاحها بشكل مستقل.
رابط إلى GitHub يعتبر ميزة.
إتقان اللغة الإنجليزية: مستوى فوق المتوسط (B2) أو أعلى (مطلوب).
توقعات الوقت للمشروع: بالنسبة لهذا المشروع، يُقدر أن المهام تتطلب حوالي 10-20 ساعة في الأسبوع خلال المراحل النشطة، بناءً على متطلبات المشروع.
هذا تقدير، وليس عبء عمل مضمون، وينطبق فقط أثناء نشاط المشروع.
التعويض: في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 37 دولارًا في الساعة، حسب مستوى مساهمتهم وسرعتها.
يختلف التعويض عبر المشاريع حسب النطاق، والتعقيد، والخبرة المطلوبة.
يرجى ملاحظة أن المشاريع الأخرى على المنصة قد تقدم مستويات كسب مختلفة بناءً على متطلباتها.
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.
لقد تجاوزت الحد الأقصى المسموح به للتنبيهات الوظيفية (15). يرجى حذف أحد التنبيهات الحالية لإضافة تنبيه جديد.
تم إنشاء تنبيه وظيفي لهذا البحث. ستصلك إشعارات فور الإعلان عن وظائف جديدة مطابقة.
هل أنت متأكد أنك تريد سحب طلب التقديم إلى هذه الوظيفة؟

لن يتم النظر في طلبك لهذة الوظيفة، وسيتم إزالته من البريد الوارد الخاص بصاحب العمل.