技能 langfuse

📦

langfuse

Name: langfuse
Author: sickn33

安全 🌐 網路存取🔑 環境變數

為您的 AI 應用程式新增 LLM 可觀測性和追蹤功能

使用全面的追蹤和評估來除錯和監控您的 LLM 應用程式。Langfuse 提供開源可觀測性，追踪您的 AI 工作流程中的成本、延遲和品質。

支援: Claude Codex Code(CC)

🥉 72 青銅

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「langfuse」。使用者請求協助使用 Langfuse 追蹤 OpenAI 聊天應用程式

預期結果:

顯示 Langfuse 用戶端設定的初始化程式碼，包含 API 金鑰和主機設定
建立包含 user_id、session_id 和 metadata 欄位的追蹤
Generation 記錄，捕捉輸入訊息、模型參數和 token 使用量
根據使用者回饋或自動化標準對追蹤進行評分的範例

正在使用「langfuse」。使用者需要為其 RAG 流程整合 LangChain 回呼功能

預期結果:

使用 public key、secret key 和選用.session 追蹤的 CallbackHandler 設定
顯示如何將处理程式傳遞給 chain.invoke() 呼叫的設定
設定全域回呼处理程式以進行自動追蹤的範例
顯示 retriever 和 LLM 呼叫嵌套跨度的範例追蹤輸出

安全審計

安全

v1 • 2/25/2026

All 17 static analysis findings are false positives. The skill is documentation for Langfuse, an open-source LLM observability platform. External command detections are Python code examples, not shell execution. Network URLs are legitimate API endpoints. API key references are placeholder examples in documentation.

已掃描檔案

243

分析行數

發現項

審計總數

風險因素

🌐 網路存取 (2)

SKILL.md:48 SKILL.md:158

🔑 環境變數 (2)

SKILL.md:47 SKILL.md:157

審計者: claude

品質評分

架構

100

可維護性

內容

社群

100

安全

100

規範符合性

你能建構什麼

生產環境 LLM 應用程式監控

透過完整的追蹤可見性來追蹤和除錯即時 AI 應用程式。監控使用者會話中的 token 成本、回應延遲和錯誤率。

提示開發和測試

對提示進行版本控制、比較迭代間的輸出，並執行 A/B 測試。使用資料集在部署前系統化評估提示變更。

AI 成本和效能優化

分析 token 使用模式、識別昂貴的操作，並優化模型選擇。設定成本異常和效能下降的警報。

試試這些提示

基礎追蹤設定

Help me set up Langfuse tracing for my OpenAI application. I need to track chat completions with user IDs and session IDs. Show me the Python code to initialize Langfuse and wrap my existing OpenAI calls.

LangChain 整合

I have a LangChain application with custom chains and agents. Guide me through adding Langfuse callback handlers to trace all chain executions, including nested calls and tool usage.

提示版本控制和比較

I want to manage multiple versions of my system prompts in Langfuse and compare their performance. Show me how to create prompts in Langfuse, retrieve them in code, and analyze which versions perform better.

自訂評估流程

Help me build an evaluation pipeline that scores my LLM outputs based on relevance and accuracy. I need to create test datasets, define scoring criteria, and run batch evaluations to compare model versions.

最佳實務

在無伺服器環境中務必呼叫 langfuse.flush() 以確保追蹤在函式結束前送出
在所有追蹤中包含 user_id 和 session_id 以啟用使用者層級的除錯和會話分析
使用有意義的追蹤和跨度名稱，反映業務邏輯而非通用函式名稱

避免

在無伺服器函式中未刷新追蹤，導致執行結束時資料遺失
追蹤每個操作而未過濾，造成噪音和效能開銷
缺少使用者和會話識別碼，限制了除錯特定使用者體驗的能力

常見問題

Langfuse 可以免費使用嗎？

Langfuse 提供開發和小規模使用的免費方案。自託管完全免費且開源。雲端託管針對更高流量和額外功能提供付費方案。

Langfuse 是否支援 OpenAI 以外的模型？

是的。Langfuse 支援 OpenAI、Anthropic Claude、LlamaIndex、LangChain 和自訂整合。您可以使用手動追蹤 API 和自己的 instrument 來追蹤任何 LLM。

如何處理追蹤中的敏感資料？

使用 metadata 遮蔽功能在傳送至 Langfuse 前遮罩敏感欄位。您也可以自託管 Langfuse 將所有追蹤資料保留在您的基礎設施內。

我可以將 Langfuse 與串流回應一起使用嗎？

是的。Langfuse 自動處理支援整合的串流。對於手動追蹤，在串流完成後記錄完整回應，或對長時間執行的串流使用增量更新。

如何比較不同提供者之間的模型效能？

使用 Langfuse 資料集對不同模型執行相同的測試案例。使用模型名稱標記追蹤，並使用儀表板並排比較延遲、成本和品質評分。

追蹤期間如果 Langfuse 無法使用會發生什麼事？

Langfuse SDK 非同步批次處理追蹤並在失敗時重試。即使 Langfuse 暫時無法連線，您的應用程式仍能正常運作。追蹤會被佇列並在連線恢復時傳送。

開發者詳情

作者

sickn33

授權

MIT

儲存庫

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/langfuse

引用

main

檔案結構

📄 SKILL.md