Question 1

RAG とファインチューニングの違いは何ですか？

Accepted Answer

RAG はクエリ時に Relevant なドキュメントを取得してコンテキストとして提供するため、再学習なしで最新情報にアクセスできます。ファインチューニングはトレーニングデータでモデル重みを調整するもので、スタイルや形式の学習には適していますが、トレーニング後に新しい知識を追加することはできません。

Question 2

異なるエージェントアーキテクチャをどのように選択すればよいですか？

Accepted Answer

ツールを使用したインタラクティブなマルチステップ推論には ReAct を使用。構造化された API 統合には関数呼び出しを使用。事前計画を必要とする複雑なタスクには Plan-and-Execute を使用。異なるサブタスクに専門知識が必要な場合はマルチエージェントシステムを使用。

Question 3

本番環境にはどのベクトルデータベースを使用すべきですか？

Accepted Answer

高スケールのマネージドサービスには Pinecone を使用。GraphQL 対応のセルフホストには Weaviate を使用。既存の PostgreSQL 環境には pgvector を使用。プロトタイピングには簡易さのために ChromaDB を使用。

Question 4

LLM API コストを削減するにはどうすればよいですか？

Accepted Answer

類似クエリに対するセマンティックキャッシュを実装、単純なタスクには小型モデルを使用、プロンプト長を最適化、適切な temperature を設定（キャッシュ可能なレスポンスには 0）、プライマリモデルがレート制限された場合はフォールバックモデルを使用。

Question 5

LLM アプリケーションでどの指標を追跡すべきですか？

Accepted Answer

パフォーマンス指標（レイテンシ、1 秒あたりのトークン数）、品質指標（ユーザー満足度、タスク完了率）、コスト指標（1 リクエストあたりのコスト、キャッシュヒット率）、信頼性指標（エラー率、タイムアウト率）を追跡。

Question 6

RAG システムでのハルシネーションをどのように処理すればよいですか？

Accepted Answer

コンテキストが不十分な場合は「わかりません」と答えるようモデルに指示、評価でグラウンデッドネススコアリングを使用、検索品質チェックを実装、主張のソースを引用する検証ステップの追加を検討。

llm-app-patterns

测试它

安全审计

质量评分

你能构建什么

RAG ナレッジベース

エージェントタスク自動化

LLM 本番監視

试试这些提示

最佳实践

避免

常见问题

开发者详情