clickhouse-io
إتقان تحليلات ClickHouse وتحسين الاستعلامات
ابنِ أنظمة تحليلية عالية الأداء باستخدام قاعدة بيانات ClickHouse العمودية. تعلّم أنماطًا مثبتة لتحسين الاستعلامات، والعرض المادي، وخطوط أنابيب البيانات في الوقت الفعلي.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "clickhouse-io". أنشئ جدولاً لتحليلات السوق مع date وmarket_id وvolume وtrades
Résultat attendu:
ينشئ جدول MergeTree مع تقسيم شهري، وترتيب مناسب حسب date وmarket_id، وأنواع بيانات مناسبة (Date، String، UInt64، UInt32) للضغط الأمثل وأداء الاستعلام.
Utilisation de "clickhouse-io". تحسين استعلام يُصفّي حسب volume ثم date على جدول كبير
Résultat attendu:
يعيد ترتيب WHERE clause لتصفية الأعمدة المفهرسة أولاً (date، market_id)، ويقترح استخدام quantile() لحسابات النسب المئوية، ويوصي بإضافة توقعات مناسبة لأنماط التصفية الشائعة.
Utilisation de "clickhouse-io". إعداد تجميع في الوقت الفعلي للمقاييس الساعية
Résultat attendu:
ينشئ جدول AggregatingMergeTree مستهدف بأعمدة AggregateFunction، ويعرّف عرضًا ماديًا بدوال sumState/countState/uniqState، ويوفر نمط الاستعلام باستخدام sumMerge/countMerge/uniqMerge.
Audit de sécurité
SûrThis skill contains documentation and code examples for ClickHouse database usage. Static analyzer flagged 86 patterns that are all false positives: backticks in markdown denote SQL code blocks (not shell execution), environment variable references are configuration examples, and system table queries are legitimate ClickHouse monitoring features. No executable code or security risks present.
Score de qualité
Ce que vous pouvez construire
مهندس بيانات يبني منصة تحليلات
تصميم مخططات جداول قابلة للتوسع وتنفيذ خطوط أنابيب دمج بيانات فعالة لتتبع الأحداث عالي الحجم وتحليلات المستخدمين.
مطور Backend يحسّن الاستعلامات
تعلّم أنماط استعلامات ClickHouse المحددة لتقليل زمن الوصول على مجموعات البيانات الكبيرة وتنفيذ استراتيجيات فهرسة مناسبة.
محلل ينشئ لوحات معلومات في الوقت الفعلي
استخدم العرض المادي وأنماط التجميع المسبق لتشغيل استعلامات لوحة المعلومات دون ثانية على مليارات الصفوف.
Essayez ces prompts
أنشئ مخطط جدول ClickHouse لتخزين أحداث نشاط المستخدم مع أعمدة لـ user_id وevent_type وtimestamp وproperties. استخدم المحرك المناسب لإزالة التكرار والتقسيم حسب الشهر.
راجع استعلام ClickHouse هذا الذي يعمل ببطء على 100M+ صف. اقترح تحسينات لـ WHERE clause والفهارس ودوال التجميع: [ألصق الاستعلام]
أنشئ عرضًا ماديًا يجمع مسبقًا المستخدمين النشطين يوميًا وإجمالي الأحداث في الساعة من جدول الأحداث. ضمّن مخطط الجدول المستهدف وتعريف MV.
صمّم خط أنابيب ETL لمزامنة البيانات من PostgreSQL إلى ClickHouse كل ساعة. ضمّن الاستخراج، ومنطق التحويل، وأنماط الإدراج الدفعي مع معالجة الأخطاء.
Bonnes pratiques
- قسّم الجداول حسب الوقت (شهر أو يوم) ولكن تجنّب التقسيمات المفرطة التي تؤثر على الأداء
- رتّب المفاتيح الأساسية حسب الأعمدة الأكثر تصفيةً مع الأعلى_cardinality أولاً
- استخدم إدراجات دفعية بدلاً من إدراج الصفوف الفردية لدمج البيانات بكفاءة
- استفد من العرض المادي للمقاييس المجمعة مسبقًا لتحقيق زمن وصول للاستعلام دون ثانية
Éviter
- استخدام SELECT * بدلاً من تحديد الأعمدة المطلوبة - يزيد من استخدام I/O والذاكرة
- تنفيذ إدراجات صغيرة متكررة بدلاً من التجميع - يتسبب في إنشاء أجزاء مفرطة
- الاعتماد على معدّل FINAL في الاستعلامات - يفرض دمج بيانات مكلف عند وقت الاستعلام
- إنشاء عدد كبير جدًا من JOINs في الاستعلامات التحليلية - قم بإزالة تطبيع البيانات لأداء أفضل