Data Science بالعربي

أدوات هتغير حياتك كعالم بيانات


Listen Later

تناقش الحلقة فكرة أن نجاح مشاريع علم البيانات لا يعتمد فقط على مهارة كتابة الكود (مثل Python وSQL)، بل على استخدام الأدوات المناسبة لتنظيم العمل وجعله قابلًا للتطوير (Scalable).الأدوات الثلاثة التي تم تسليط الضوء عليها هي:

  1. Polars (السرعة هي الملك):
    • الوصف: مكتبة بُنيت بلغة Rust وتُعتبر "المستوى التالي" بعد Pandas، خاصةً عند التعامل مع مجموعات البيانات الكبيرة.
    • الميزة الرئيسية: تعتمد على خاصية الـ Lazy Evaluation (التقييم الكسول)، مما يجعل تنفيذ الكود أسرع بكثير من Pandas من خلال إنشاء خطة تنفيذ ذكية (Execution Plan).
    • الفوائد: التعامل مع الملفات الكبيرة (Multi-GBs)، كتابة كود أنظف وأسرع (Multithreading)، والعمل بكفاءة مع تحسين الاستعلامات (Query optimization).
  2. MLflow (وداعاً لعشوائية التجارب):
    • الوصف: أداة أساسية في مجال الـ MLOps لتنظيم وإدارة دورة حياة نماذج التعلم الآلي.
    • الميزة الرئيسية: تضمن عدم ضياع تفاصيل النماذج والتجارب المختلفة.
    • الفوائد:
      • Experiment Tracking: تسجيل كل تجربة (المعاملات، المقاييس، الرسوم البيانية).
      • Model Registry: تتبع حالة النموذج (Staging أو Production).
      • Reproducibility: ضمان قدرة أي عضو في الفريق على إعادة تنفيذ النموذج بنفس النتائج.
  3. Streamlit (حول الكود لمنتج):
    • الوصف: أداة لسحر "Data Monetization" تسمح لعلماء البيانات بتحويل الكود إلى منتج ملموس (App) يمكن عرضه على أصحاب المصلحة (Stakeholders).
    • الميزة الرئيسية: لا تتطلب معرفة بالـ Front-end (HTML/CSS/JS)، ويتم بناء التطبيقات التفاعلية بالاعتماد على Python فقط.
    • الفوائد: بناء لوحات معلومات (Dashboards) تفاعلية وكاملة في بضعة أسطر من الكود، وممتازة لإنشاء النماذج الأولية (Prototypes) ومنتجات الحد الأدنى القابلة للتطبيق (MVP).

الخلاصة: يؤكد تأكد الحلقة أن استخدام هذه الأدوات يُسهل عمل عالم البيانات ويساعده على الانتقال من مجرد "تجربة كود" إلى "بناء منتجات بيانات حقيقية" لاتخاذ القرارات.

استخدم Polars عشان تنجز في الوقت والـ Performance.

https://www.youtube.com/playlist?list=PLo9Vi5B84_dfAuwJqNYG4XhZMrGT

استخدم MLflow عشان تنظم تجاربك وتبقى محترف MLOps.

https://youtu.be/VokAGy8C6K4?si=HFK9vXNjcyBvlwsa

استخدم Streamlit عشان تظهر قيمة شغلك وتخليه ملموس

https://youtu.be/D0D4Pa22iG0?si=3t2Y3ld9GGNb0R4p

LinkedIn Profile: Data Science بالعربي: Company Page Admin | LinkedIn

Facebook Page: https://www.facebook.com/Data-Science-Belarabi-101963665978677

‘RSSVERIFY’

...more
View all episodesView all episodes
Download on the App Store

Data Science بالعربيBy Mohamed Abdel Salam