polars
اعمل مع DataFrames من Polars بكفاءة
متاح أيضًا من: davila7
عالج مجموعات البيانات الكبيرة في الذاكرة باستخدام Polars، وهي مكتبة DataFrames عالية الأداء. تتميز بالتقييم الكسول، والتنفيذ المتوازي، وواجهة Apache Arrow لعشر عمليات أسرع من pandas.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "polars". حمّل ملف CSV وصفّر الصفوف حيث العمر أكبر من 25
النتيجة المتوقعة:
- تم إنشاء DataFrame مع الأعمدة: name, age, city
- تم التصفية إلى صفين حيث age > 25
- الأعمدة المحددة: name, age
استخدام "polars". جمّع بيانات المبيعات حسب فئة المنتج واحسب إجمالي ومتوسط المبيعات
النتيجة المتوقعة:
- تم التجميع حسب product_category
- تم حساب المجموع والمتوسط لـ sales_amount
- النتيجة تشمل: category, total_sales, avg_sales
استخدام "polars". اقرأ ملف Parquet باستخدام التقييم الكسول واجمع الأعمدة المطلوبة فقط
النتيجة المتوقعة:
- تم استخدام scan_parquet للتحميل الكسول
- تم تحديد الأعمدة المطلوبة مبكرًا
- تم الجمع مع تحسين دفع المسند
التدقيق الأمني
آمنThis skill contains ONLY markdown documentation files with Python code examples. All 690 static findings are FALSE POSITIVES. The analyzer misidentified markdown code blocks, Python syntax, and Polars library methods as security threats. No executable code, shell commands, credential access, or network operations exist.
عوامل الخطر
⚙️ الأوامر الخارجية (647)
🔑 متغيرات البيئة (9)
⚡ يحتوي على سكربتات (1)
🌐 الوصول إلى الشبكة (3)
درجة الجودة
ماذا يمكنك بناءه
بناء خطوط أنابيب ETL
أنشئ خطوط أنابيب بيانات فعالة مع التقييم الكسول لتحسين الذاكرة والتنفيذ المتوازي.
تحويل وتجميع البيانات
قم بتصفية وتجميع وتجميع مجموعات البيانات الكبيرة باستخدام صيغة التعبيرات ودوال النافذة.
استبدال pandas ببديل أسرع
انقل كود pandas الموجود إلى Polars لتحسينات ملحوظة في الأداء على مجموعات البيانات المتوسطة.
جرّب هذه الموجهات
حمّل ملف CSV باستخدام Polars واعرض الصفوف الأولى وأنواع الأعمدة والإحصائيات الأساسية.
صفّر الصفوف التي ي فيها عمود شرطًا معينًا وحدد أعمدة معينة باستخدام تعبيرات Polars.
جمّع البيانات حسب عمود واحد أو أكثر واحسب التجميعات مثل المتوسط والمجموع والعد.
حوّل عملية DataFrame هذه لاستخدام التقييم الكسول واشرح فوائد الأداء.
أفضل الممارسات
- استخدم scan_csv أو scan_parquet مع التقييم الكسول لمجموعات البيانات الكبيرة لتمكين تحسين الاستعلام
- صفّر واختر الأعمدة مبكرًا في خط أناببك لتقليل استخدام الذاكرة وتحسين الأداء
- فضّل تعبيرات Polars الأصلية على دوال بايثون لتمكين التنفيذ المتوازي
تجنب
- تجنب استخدام read_csv على الملفات الكبيرة عندما يكون التقييم الكسول كافيًا
- لا تضع دوال بايثون داخل المسارات الساخنة عندما تستطيع تعبيرات Polars إنجاز نفس المهمة
- تجنب تحميل مجموعات البيانات بأكملها في الذاكرة عندما يعمل collect(streaming=True) للتدفق
الأسئلة المتكررة
كيف يختلف Polars عن pandas؟
متى يجب استخدام التقييم الكسول؟
ما أحجام البيانات التي تعمل بشكل أفضل مع Polars؟
هل يمكنني الترقية من pandas بسهولة؟
هل تدعم Polars التخزين السحابي؟
ما صيغ الملفات التي تدعمها Polars؟
تفاصيل المطور
بنية الملفات