Skillstore Skillstore
المهاراتالإصداراتالمستنداتإرسال
المهارات المؤلفون flashinfer-ai
flashinfer-ai

flashinfer-ai

نشط
3
المهارات
2
الفئات
ClaudeCodexCode(CC)

المهارات المنشورة 3

🔧

debug-cuda-crash

CUDA-Abstürze in FlashInfer debuggen

آمن 70

CUDA-Abstürze hinterlassen oft keine Debugging-Informationen. Dieses Tutorial zeigt Ihnen, wie Sie die API-Protokollierung von FlashInfer verwenden, um Tensor-Metadaten vor Abstürzen zu erfassen. Lernen Sie, Formfehler, dtype-Fehler und numerische Probleme schnell zu identifizieren.

Claude Codex Code(CC)
تثبيت
📊

benchmark-kernel

GPU-Kerne mit CUPTI-Timing benchmarken

آمن 68

Genaue GPU-Kernel-Benchmarking ist aufgrund des Messaufwands eine Herausforderung. Diese Anleitung bietet Schritt-für-Schritt-Anleitungen zur Verwendung von CUPTI-Hardware-Profiling für präzise Kernel-Ausführungszeiten. Vergleichen Sie verschiedene Backends wie FlashAttention und cuDNN, um die schnellste Implementierung für Ihre Workload zu finden.

Claude Codex Code(CC)
تثبيت
⚡

add-cuda-kernel

CUDA-Kernels zu FlashInfer hinzufügen

آمن 68

FlashInfer benötigt neue GPU-Kernels, aber der Prozess ist unklar. Dieses Tutorial bietet Schritt-für-Schritt-Anleitungen zum Hinzufügen von elementweisen CUDA-Operationen, einschließlich Kernel-Definition, TVM-FFI-Bindings, Python-APIs, Testen und Benchmarking.

Claude Codex Code(CC)
تثبيت
Skillstore Skillstore
التوثيق GitHub حول

© 2025 Skillstore