Compétences clickhouse-io
📦

clickhouse-io

Sûr

Meistern Sie ClickHouse-Analytics und Abfrageoptimierung

Erstellen Sie leistungsstarke Analysesysteme mit der spaltenorientierten Datenbank ClickHouse. Lernen Sie bewährte Muster für Abfrageoptimierung, materialisierte Sichten und Echtzeit-Datenpipelines.

Prend en charge: Claude Codex Code(CC)
🥉 74 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "clickhouse-io". Erstellen Sie eine Tabelle für Markt-Analytics mit date, market_id, volume und trades

Résultat attendu:

Erstellt eine MergeTree-Tabelle mit monatlicher Partitionierung, geeigneter Sortierung nach date und market_id sowie geeigneten Datentypen (Date, String, UInt64, UInt32) für optimale Komprimierung und Abfrageleistung.

Utilisation de "clickhouse-io". Optimieren Sie eine Abfrage, die nach volume dann date auf einer großen Tabelle filtert

Résultat attendu:

Sortiert die WHERE-Klausel um, um zuerst nach indizierten Spalten zu filtern (date, market_id), schlägt die Verwendung von quantile() für Perzentilberechnungen vor und empfiehlt das Hinzufügen geeigneter Projektionen für häufige Filtermuster.

Utilisation de "clickhouse-io". Richten Sie Echtzeit-Aggregation für stündliche Metriken ein

Résultat attendu:

Erstellt eine AggregatingMergeTree-Zieltabelle mit AggregateFunction-Spalten, definiert eine materialisierte Sicht mit sumState/countState/uniqState-Funktionen und stellt das Abfragemuster mit sumMerge/countMerge/uniqMerge bereit.

Audit de sécurité

Sûr
v1 • 2/25/2026

This skill contains documentation and code examples for ClickHouse database usage. Static analyzer flagged 86 patterns that are all false positives: backticks in markdown denote SQL code blocks (not shell execution), environment variable references are configuration examples, and system table queries are legitimate ClickHouse monitoring features. No executable code or security risks present.

1
Fichiers analysés
431
Lignes analysées
0
résultats
1
Total des audits
Aucun problème de sécurité trouvé
Audité par: claude

Score de qualité

38
Architecture
90
Maintenabilité
87
Contenu
50
Communauté
100
Sécurité
100
Conformité aux spécifications

Ce que vous pouvez construire

Data Engineer, der eine Analytics-Plattform erstellt

Entwerfen Sie skalierbare Tabellenschemas und implementieren Sie effiziente Datenaufnahmepipelines für hochvolumiges Event-Tracking und User-Analytics.

Backend-Entwickler, der Abfragen optimiert

Lernen Sie ClickHouse-spezifische Abfragemuster, um die Latenz bei großen Datensätzen zu reduzieren und geeignete Indizierungsstrategien zu implementieren.

Analyst, der Echtzeit-Dashboards erstellt

Verwenden Sie materialisierte Sichten und Voraggregationsmuster, um Abfragen für Dashboards mit unter einer Sekunde Laufzeit auf Milliarden von Zeilen zu unterstützen.

Essayez ces prompts

Grundlegendes Tabellendesign
Erstellen Sie ein ClickHouse-Tabellenschema zum Speichern von Benutzeraktivitätsereignissen mit Spalten für user_id, event_type, timestamp und properties. Verwenden Sie die geeignete Engine für Deduplizierung und partitionieren Sie nach Monat.
Abfrageoptimierung
Überprüfen Sie diese ClickHouse-Abfrage, die auf 100 Mio+ Zeilen langsam läuft. Schlagen Sie Optimierungen für die WHERE-Klausel, Indizes und Aggregationsfunktionen vor: [Abfrage einfügen]
Einrichtung materialisierter Sichten
Erstellen Sie eine materialisierte Sicht, die täglich aktive Benutzer und Gesamtereignisse pro Stunde aus einer Ereignistabelle voraggregiert. Fügen Sie das Zieltabellenschema und die MV-Definition ein.
ETL-Pipeline-Design
Entwerfen Sie eine ETL-Pipeline, um Daten stündlich von PostgreSQL nach ClickHouse zu synchronisieren. Fügen Sie Extraktions-, Transformationslogik und Batch-Einfügemuster mit Fehlerbehandlung ein.

Bonnes pratiques

  • Partitionieren Sie Tabellen nach Zeit (Monat oder Tag), vermeiden Sie jedoch übermäßige Partitionen, die die Leistung beeinträchtigen
  • Sortieren Sie Primärschlüssel nach am häufigsten gefilterten Spalten mit der höchsten Kardinalität zuerst
  • Verwenden Sie Batch-Einfügungen anstelle von einzelnen Zeileneinfügungen für effiziente Datenaufnahme
  • Nutzen Sie materialisierte Sichten für voraggregierte Metriken, um Abfragelatenzen unter einer Sekunde zu erreichen

Éviter

  • Verwendung von SELECT * anstatt der Angabe erforderlicher Spalten - erhöht E/A- und Speicherverbrauch
  • Durchführung kleiner, häufiger Einfügungen anstatt Batch-Verarbeitung - verursacht übermäßige Part-Erstellung
  • Verlassen sich auf den FINAL-Modifikator in Abfragen - erzwingt teures Zusammenführen von Daten zur Abfragezeit
  • Erstellung zu vieler JOINs in analytischen Abfragen - denormalisieren Sie Daten für bessere Leistung

Foire aux questions

Wofür eignet sich ClickHouse am besten?
ClickHouse zeichnet sich bei OLAP-Workloads (Online Analytical Processing) mit großen Datensätzen aus, die schnelle Aggregationen und Zeitreihenanalysen erfordern. Es ist nicht für transaktionale Workloads (OLTP) mit häufigen Aktualisierungen konzipiert.
Wie erreicht ClickHouse eine schnelle Abfrageleistung?
ClickHouse verwendet spaltenorientierte Speicherung für effiziente Komprimierung, vektorisierte Abfrageausführung, parallele Verarbeitung über CPU-Kerne und spezielle Indexstrukturen wie Sparse-Primärschlüssel und Data-Skipping-Indizes.
Was ist der Unterschied zwischen MergeTree und ReplacingMergeTree?
MergeTree ist die Allzweck-Engine für die meisten Anwendungsfälle. ReplacingMergeTree dedupliziert zusätzlich Zeilen mit demselben Primärschlüssel während Zusammenführungen, nützlich bei der Aufnahme von Daten aus mehreren Quellen, die Duplikate erzeugen können.
Wie oft sollte ich Daten in ClickHouse einfügen?
Batch-Einfügungen werden dringend empfohlen. Fügen Sie tausende Zeilen auf einmal statt einzelner Zeilen ein. Streben Sie mindestens 1000 Zeilen pro Einfügung oder Batch-Verarbeitung nach Zeitintervallen (z. B. alle paar Sekunden) an für optimale Leistung.
Was sind materialisierte Sichten und wann sollte ich sie verwenden?
Materialisierte Sichten voraggregieren automatisch Daten beim Einfügen. Verwenden Sie sie für Echtzeit-Dashboards, häufig aufgerufene Aggregationen oder wenn die Abfragelatenz bei großen Datensätzen unter einer Sekunde liegen muss.
Wie überwache ich die ClickHouse-Abfrageleistung?
Fragen Sie die Tabelle system.query_log ab, um langsame Abfragen zu analysieren, überprüfen Sie system.parts für Tabellenstatistiken und Merge-Aktivitäten und überwachen Sie system.metrics für Echtzeit-Leistungsindikatoren.

Détails du développeur

Structure de fichiers

📄 SKILL.md