المهارات podcast-generation
📦

podcast-generation

مخاطر منخفضة

إنشاء صوت بودكاست بالذكاء الاصطناعي من النص

تتيح هذه المهارة للمطورين إنشاء سرد صوتي بأسلوب البودكاست باستخدام نموذج GPT Realtime Mini من Azure OpenAI. تتعامل مع اتصالات WebSocket وبث الصوت وتحويل التنسيق لإنتاج صوت طبيعي المظهر.

يدعم: Claude Codex Code(CC)
⚠️ 66 ضعيف
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "podcast-generation". إنشاء مقدمة بودكاست لبرنامج أخبار تقنية

النتيجة المتوقعة:

ملف صوت WAV مشفر بـ Base64 جاهز للتشغيل في المتصفح، مع نص مكتوب يوضح نص السرد المُنشأ

استخدام "podcast-generation". تحويل هذه المقالة حول تطورات الذكاء الاصطناعي إلى صوت

النتيجة المتوقعة:

مقاطع صوتية مُبسّطة عبر WebSocket، مجمعة في ملف WAV كامل مع نص مكتوب متزامن

التدقيق الأمني

مخاطر منخفضة
v1 • 2/24/2026

Static analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.

1
الملفات التي تم فحصها
127
الأسطر التي تم تحليلها
5
النتائج
1
إجمالي عمليات التدقيق
مشكلات متوسطة المخاطر (4)
Environment Variable Access for API Authentication
Skill accesses AZURE_OPENAI_AUDIO_API_KEY from environment. This is legitimate behavior for Azure OpenAI integration - API keys are required for authentication. No user input is concatenated with these values.
Network Access to Azure OpenAI Endpoint
Skill connects to Azure OpenAI WebSocket endpoint for realtime audio generation. This is expected behavior for a TTS service.
Base64 Encoding for Audio Data
Skill uses base64 encoding/decoding for audio PCM chunks. This is standard practice for transferring binary audio data over text-based protocols.
Code Fences Detected as Shell Commands
Static analyzer misidentified markdown backtick code fences as Ruby/shell backtick execution. The backticks are markdown delimiters for code blocks, not actual shell commands.
مشكلات منخفضة المخاطر (1)
Misidentified Weak Cryptographic Algorithm
Static analyzer incorrectly flagged YAML frontmatter and plain text references as weak cryptographic algorithms. No cryptographic code exists in this skill.
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
85
المحتوى
31
المجتمع
68
الأمان
100
الامتثال للمواصفات

ماذا يمكنك بناءه

مدونة صوتية لمنشئ المحتوى

تحويل منشورات المدونات أو المقالات إلى صوت بأسلوب البودكاست لإمكانية الوصول والانتشار أوسع.

سرد صوتي للتعلم الإلكتروني

إنشاء سرد صوتي منطوق للمحتوى التعليمي والدورات التدريبية عبر الإنترنت.

أداة صوتية لإمكانية الوصول

تحويل محتوى واجهة المستخدم النصي إلى كلام للتوافق مع قارئات الشاشة.

جرّب هذه الموجهات

تحويل النص إلى كلام أساسي
حوّل هذا النص إلى صوت بأسلوب البودكاست باستخدام واجهة Azure OpenAI Realtime API: {text_input}
اختيار صوت مخصص
أنشئ سردًا صوتيًا باستخدام الصوت {voice_name} لهذا المحتوى: {text_content}
صوت مع نص مكتوب
أنشئ صوت بودكاست ونصًا مكتوبًا لـ: {article_content}. وشمل مخرجات الصوت والنص المكتوب.
معالجة دفعة من المحتوى
معالجة عدة مقاطع نصية إلى ملفات صوتية. المقطع 1: {text1}، المقطع 2: {text2}، المقطع 3: {text3}. أنشئ ملفًا صوتيًا منفصلاً لكل منها.

أفضل الممارسات

  • قم بتكوين متغيرات بيئة Azure قبل استخدام المهارة للمصادقة
  • استخدم اختيار الصوت المناسب بناءً على نوع المحتوى (onyx للرسمي، fable للتعبيري
  • تعامل مع أخطاء اتصال WebSocket بشكل سلس مع منطق إعادة المحاولة

تجنب

  • لا تُعرّض مفاتيح API في الكود من جانب العميل - احتفظ بها من جانب الخادم فقط
  • تجنب إرسال معلومات حساسة أو شخصية في إدخالات النص بدون تشفير
  • لا تفترض أن حصة API لا نهائية - نفّذ تحديد المعدل والتخزين المؤقت

الأسئلة المتكررة

ما هي خدمات Azure التي تتطلبها هذه المهارة؟
تتطلب هذه المهارة Azure OpenAI مع نشر GPT Realtime Mini وبيانات اعتماد API صالحة.
هل يمكنني استخدام هذه المهارة دون اتصال؟
لا، تتطلب هذه المهارة اتصال إنترنت نشط للتواصل مع خدمات Azure OpenAI.
ما هو تنسيق الصوت الذي تخرجه المهارة؟
تخرج المهارة صوتًا بتنسيق WAV (24kHz، 16 بت، أحادي القناة) مشفرًا بـ Base64 لسهولة النقل.
كم عدد الأصوات المتاحة؟
ستة أصوات مدعومة: alloy وecho وfable وonyx وnova وshimmer.
هل هذه المهارة مناسبة للاستخدام في الإنتاج؟
نعم، مع معالجة الأخطاء المناسبة وإدارة مفاتيح API، يمكن استخدام هذا في تطبيقات الإنتاج.
هل تخزن هذه المهارة أي بيانات صوتية؟
لا، تعالج المهارة الصوت في الذاكرة وتُعيده إلى المتصل دون تخزين دائم.

تفاصيل المطور

المؤلف

sickn33

الترخيص

MIT

مرجع

main

بنية الملفات

📄 SKILL.md