المهارات exploratory-data-analysis
📊

exploratory-data-analysis

آمن 📁 الوصول إلى نظام الملفات

تحليل ملفات البيانات العلمية تلقائيًا

متاح أيضًا من: davila7

تأتي ملفات البيانات العلمية بمئات التنسيقات. يكتشف هذا المهارة نوع الملف تلقائيًا، ويستخرج البيانات الوصفية، ويقيّم جودة البيانات، ويولّد تقارير شاملة بتنسيق markdown مع توصيات تحليل خاصة بالتنسيق.

يدعم: Claude Codex Code(CC)
🥈 80 فضي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "exploratory-data-analysis". Analyze data/sample.fastq

النتيجة المتوقعة:

  • File: sample.fastq (24.5 MB)
  • Format: FASTQ (sequence data with quality scores)
  • Sampled 10,000 reads: Mean length 150bp, Mean quality: 35.2
  • GC Content: 52.3%
  • Quality Assessment: High-quality data, suitable for downstream analysis
  • Recommendations: Proceed with alignment; no trimming required

استخدام "exploratory-data-analysis". Explore experiment_results.csv

النتيجة المتوقعة:

  • File: experiment_results.csv (1.2 MB)
  • Format: CSV (tabular data)
  • Dimensions: 5,000 rows x 12 columns
  • Missing Values: 2.3% in column 'temperature'
  • Statistics: Mean=45.2, Std=12.8, Range=[-5.2, 98.4]
  • Recommendations: Impute missing values; check for outliers in temperature column

التدقيق الأمني

آمن
v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

10
الملفات التي تم فحصها
8,669
الأسطر التي تم تحليلها
1
النتائج
4
إجمالي عمليات التدقيق

عوامل الخطر

📁 الوصول إلى نظام الملفات (1)
تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

82
الهندسة المعمارية
100
قابلية الصيانة
85
المحتوى
21
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

استكشاف بيانات التسلسل الجينومي

تحليل ملفات FASTQ وBAM وVCF لفهم جودة التسلسل ومعدلات التخطيط وتوزيع المتغيرات.

فحص ملفات البنية الجزيئية

تحليل ملفات PDB وSDF وCIF لتقييم البنى الجزيئية والإحداثيات الذرية ومعلومات الروابط.

فحص البيانات الوصفية لصور الميكروسكوب

استخراج الأبعاد والقنوات والطوابع الزمنية والمعايرة المكانية من ملفات TIFF وND2 وCZI للتصوير.

جرّب هذه الموجهات

التحليل الأساسي
Analyze this scientific data file at path: <filepath>
مع التقرير
Generate a comprehensive EDA report for this file and save it to <filepath>
التركيز على الجودة
Perform a data quality assessment on this file and identify any issues or anomalies.
ملفات متعددة
Analyze these multiple related files and create a summary comparison report.

أفضل الممارسات

  • وفر المسار الكامل للملف عند طلب تحليل للكشف الدقيق
  • حدد اسم ملف الإخراج لإنشاء تقرير markdown دائم
  • تحقق من مكتبات Python المطلوبة للتنسيقات المتخصصة قبل التحليل

تجنب

  • لا تطلب من المهارة تعديل ملفات البيانات المصدر أو الكتابة إليها
  • لا تتوقع من المهارة إجراء نمذجة إحصائية متقدمة
  • لا تفترض أن المهارة يمكنها تفسير المعنى البيولوجي من التسلسلات

الأسئلة المتكررة

ما هي التنسيقات المدعومة؟
أكثر من 200 تنسيق بما في ذلك FASTQ وBAM وVCF وPDB وCIF وTIFF وND2 وCSV وHDF5 والعديد غيرها.
هل يُعدّل هذا ملفات البيانات الخاصة بي؟
لا، المهارة تقرأ الملفات فقط وتولّد تقارير markdown جديدة دون تغيير البيانات الأصلية.
ماذا يتضمن التقرير المُولّد؟
البيانات الوصفية للملف وتفاصيل التنسيق والملخصات الإحصائية ومقاييس الجودة وتوصيات التحليل اللاحق.
هل يمكن تحليل الملفات الكبيرة؟
نعم، لكن الملفات الكبيرة جدًا قد يتم أخذ عينات منها لأسباب الأداء. يُلاحظ التقرير عند استخدام أخذ العينات.
ما هي مكتبات Python المطلوبة؟
المكتبات الأساسية: pandas، numpy. الخاصة بالتنسيق: Biopython للتسلسلات، h5py لـ HDF5، Pillow للصور.
هل يمكن تحليل ملفات متعددة معًا؟
يُحلّل كل ملف بشكل منفصل. يمكنك طلب مقارنات عبر الملفات ذات الصلة في نفس طلب التحليل.