🧬

pysam

آمن ⚙️ الأوامر الخارجية📁 الوصول إلى نظام الملفات

العمل مع ملفات التسلسل الجينومي

متاح أيضًا من: davila7

معالجة وتحليل بيانات تسلسل DNA باستخدام أدوات لقراءة ملفات BAM وVCF وFASTQ. استخراج المناطق الجينومية وحساب إحصائيات التغطية ودمج أنواع ملفات متعددة لتحليل شامل للطفرات.

يدعم: Claude Codex Code(CC)
📊 71 كافٍ
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "pysam". افتح ملف BAM واعرض إحصائيات التغطية للكروموسوم 1

النتيجة المتوقعة:

  • إحصائيات الكروموسوم 1:
  • إجمالي القراءات: 1,245,678
  • القراءات المرسومة: 1,198,432 (96.2%)
  • متوسط التغطية: 32.4x
  • المناطق تحت تغطية 10x: 5,234 موقع

استخدام "pysam". تصفية الطفرات حسب الجودة والعمق

النتيجة المتوقعة:

  • تمت تصفية 12,456 طفرة إلى 3,892 طفرة عالية الجودة
  • المرشحات المطبقة: QUAL > 30, DP > 10, MQ > 40
  • الكتابات المكتوبة إلى filtered.vcf

استخدام "pysam". استخراج التسلسلات حول مواقع الطفرات

النتيجة المتوقعة:

  • تم استخراج تسلسلات 100bp لـ 847 طفرة
  • التسلسلات المكتوبة إلى variant_contexts.fasta
  • المنطقة المجاورة: +/- 50bp من كل موقع طفرة

التدقيق الأمني

آمن
v4 • 1/17/2026

All 447 static findings are FALSE POSITIVES caused by bioinformatics terminology being misinterpreted as security-relevant patterns. The scanner flags 'SAM' as Windows Security Account Manager when it means Sequence Alignment/Map format, and samtools/bcftools as network scanning tools when they are legitimate bioinformatics command-line utilities. The skill contains only documentation and code examples for legitimate genomic data processing. No actual malicious code, command injection, credential access, or network exfiltration patterns exist.

7
الملفات التي تم فحصها
2,265
الأسطر التي تم تحليلها
2
النتائج
4
إجمالي عمليات التدقيق

عوامل الخطر

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

45
الهندسة المعمارية
90
قابلية الصيانة
85
المحتوى
29
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

سير عمل تحليل الطفرات

استخراج وتصفية الطفرات الجينية من ملفات VCF والتعليق عليها بتغطية القراءة من ملفات BAM

تحليل التغطية

حساب التغطية لكل قاعدة، وتحديد المناطق ذات التغطية المنخفضة، وتوليد مسارات التغطية للتصور

خط أنابيب مراقبة الجودة

التحقق من صحة بيانات التسلسل، والتحقق من اتساق المرجع، وتصفية القراءات حسب عتبات الجودة

جرّب هذه الموجهات

قراءة بيانات المحاذاة
استخدم pysam لفتح example.bam وطباعة جميع القراءات المتداخلة مع مواقع chr1 1000-2000
معالجة الطفرات
افتح variants.vcf واطبع جميع الطفرات على chr2 مع درجة جودة أعلى من 30
حساب التغطية
احسب التغطية لكل قاعدة لمواقع الكروموسوم 1 من 100000 إلى 200000 باستخدام تحليل التراكم
استخراج التسلسلات
افتح reference.fasta واستخرج تسلسل الجين ABC على chr5 من الموقع 10000 إلى 11000

أفضل الممارسات

  • استخدم دائمًا ملفات BAM المفهرسة لعمليات الوصول العشوائي لتحسين الأداء
  • تذكر أن pysam يستخدم إحداثيات قائمة على 0 بينما تستخدم ملفات VCF إحداثيات قائمة على 1
  • استخدم pileup() لتحليل التغطية العمودي بدلاً من استدعاءات fetch() المتكررة

تجنب

  • تحميل ملفات BAM بأكملها في الذاكرة بدلاً من استخدام المعالجة القائمة على المكررات
  • تجاهل اختلافات نظام الإحداثيات بين pysam وتنسيقات ملفات VCF
  • معالجة الملفات الكبيرة دون إنشاء ملفات الفهرس للوصول العشوائي

الأسئلة المتكررة

ما الفرق بين ملفات SAM وBAM؟
SAM هو تنسيق نصي قابل للقراءة البشرية لبيانات المحاذاة. BAM هو الإصدار الثنائي المضغوط الذي يتيح الوصول العشوائي الفعال وأحجام ملفات أصغر.
هل أحتاج إلى تثبيت samtools بشكل منفصل؟
لا، يتضمن pysam روابط لأوامر samtools وbcftools. مكتبة htslib الأساسية مضمنة مع pysam.
كيف أقوم بإنشاء فهرس لملف BAM الخاص بي؟
استخدم pysam.index('your_file.bam') لإنشاء ملف الفهرس .bai. هذا يتيح استعلامات سريعة قائمة على المناطق.
هل يمكن لـ pysam تصفية القراءات حسب جودة الخرائط؟
نعم، استخدم معلمة الجودة في fetch() أو قم بتصفية القراءات يدويًا باستخدام سمة mapping_quality لكائنات AlignedSegment.
ما نظام الإحداثيات الذي يستخدمه pysam؟
يستخدم pysam إحداثيات قائمة على 0، نصف مفتوحة للوصول البرمجي. ومع ذلك، تستخدم سلاسل المناطق في fetch() إحداثيات قائمة على 1 لمطابقة اتفاقية samtools.
كيف أستخرج الطفرات المتداخلة مع جين محدد؟
استخدم pysam.TabixFile لفتح ملف BED مع إحداثيات الجينات، ثم استخدم vcf.fetch() مع تلك الإحداثيات للحصول على الطفرات المتداخلة.

تفاصيل المطور

المؤلف

K-Dense-AI

الترخيص

MIT license

مرجع

main