📦

podcast-generation

Name: podcast-generation
Author: sickn33

مخاطر منخفضة

إنشاء صوت بودكاست بالذكاء الاصطناعي من النص

تتيح هذه المهارة للمطورين إنشاء سرد صوتي بأسلوب البودكاست باستخدام نموذج GPT Realtime Mini من Azure OpenAI. تتعامل مع اتصالات WebSocket وبث الصوت وتحويل التنسيق لإنتاج صوت طبيعي المظهر.

يدعم: Claude Codex Code(CC)

⚠️ 66 ضعيف

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "podcast-generation". إنشاء مقدمة بودكاست لبرنامج أخبار تقنية

النتيجة المتوقعة:

ملف صوت WAV مشفر بـ Base64 جاهز للتشغيل في المتصفح، مع نص مكتوب يوضح نص السرد المُنشأ

استخدام "podcast-generation". تحويل هذه المقالة حول تطورات الذكاء الاصطناعي إلى صوت

النتيجة المتوقعة:

مقاطع صوتية مُبسّطة عبر WebSocket، مجمعة في ملف WAV كامل مع نص مكتوب متزامن

التدقيق الأمني

مخاطر منخفضة

v1 • 2/24/2026

Static analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.

الملفات التي تم فحصها

127

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

مشكلات متوسطة المخاطر (4)

SKILL.md:23

Environment Variable Access for API Authentication

Skill accesses AZURE_OPENAI_AUDIO_API_KEY from environment. This is legitimate behavior for Azure OpenAI integration - API keys are required for authentication. No user input is concatenated with these values.

SKILL.md:24

Network Access to Azure OpenAI Endpoint

Skill connects to Azure OpenAI WebSocket endpoint for realtime audio generation. This is expected behavior for a TTS service.

SKILL.md:68 SKILL.md:84

Base64 Encoding for Audio Data

Skill uses base64 encoding/decoding for audio PCM chunks. This is standard practice for transferring binary audio data over text-based protocols.

SKILL.md:22-111

Code Fences Detected as Shell Commands

Static analyzer misidentified markdown backtick code fences as Ruby/shell backtick execution. The backticks are markdown delimiters for code blocks, not actual shell commands.

مشكلات منخفضة المخاطر (1)

SKILL.md:3 SKILL.md:121 SKILL.md:126

Misidentified Weak Cryptographic Algorithm

Static analyzer incorrectly flagged YAML frontmatter and plain text references as weak cryptographic algorithms. No cryptographic code exists in this skill.

تم تدقيقه بواسطة: claude

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

الأمان

100

الامتثال للمواصفات

ماذا يمكنك بناءه

مدونة صوتية لمنشئ المحتوى

تحويل منشورات المدونات أو المقالات إلى صوت بأسلوب البودكاست لإمكانية الوصول والانتشار أوسع.

سرد صوتي للتعلم الإلكتروني

إنشاء سرد صوتي منطوق للمحتوى التعليمي والدورات التدريبية عبر الإنترنت.

أداة صوتية لإمكانية الوصول

تحويل محتوى واجهة المستخدم النصي إلى كلام للتوافق مع قارئات الشاشة.

جرّب هذه الموجهات

تحويل النص إلى كلام أساسي

حوّل هذا النص إلى صوت بأسلوب البودكاست باستخدام واجهة Azure OpenAI Realtime API: {text_input}

اختيار صوت مخصص

أنشئ سردًا صوتيًا باستخدام الصوت {voice_name} لهذا المحتوى: {text_content}

صوت مع نص مكتوب

أنشئ صوت بودكاست ونصًا مكتوبًا لـ: {article_content}. وشمل مخرجات الصوت والنص المكتوب.

معالجة دفعة من المحتوى

معالجة عدة مقاطع نصية إلى ملفات صوتية. المقطع 1: {text1}، المقطع 2: {text2}، المقطع 3: {text3}. أنشئ ملفًا صوتيًا منفصلاً لكل منها.

أفضل الممارسات

قم بتكوين متغيرات بيئة Azure قبل استخدام المهارة للمصادقة
استخدم اختيار الصوت المناسب بناءً على نوع المحتوى (onyx للرسمي، fable للتعبيري
)،
تعامل مع أخطاء اتصال WebSocket بشكل سلس مع منطق إعادة المحاولة

تجنب

لا تُعرّض مفاتيح API في الكود من جانب العميل - احتفظ بها من جانب الخادم فقط
تجنب إرسال معلومات حساسة أو شخصية في إدخالات النص بدون تشفير
لا تفترض أن حصة API لا نهائية - نفّذ تحديد المعدل والتخزين المؤقت

الأسئلة المتكررة

ما هي خدمات Azure التي تتطلبها هذه المهارة؟

تتطلب هذه المهارة Azure OpenAI مع نشر GPT Realtime Mini وبيانات اعتماد API صالحة.

هل يمكنني استخدام هذه المهارة دون اتصال؟

لا، تتطلب هذه المهارة اتصال إنترنت نشط للتواصل مع خدمات Azure OpenAI.

ما هو تنسيق الصوت الذي تخرجه المهارة؟

تخرج المهارة صوتًا بتنسيق WAV (24kHz، 16 بت، أحادي القناة) مشفرًا بـ Base64 لسهولة النقل.

كم عدد الأصوات المتاحة؟

ستة أصوات مدعومة: alloy وecho وfable وonyx وnova وshimmer.

هل هذه المهارة مناسبة للاستخدام في الإنتاج؟

نعم، مع معالجة الأخطاء المناسبة وإدارة مفاتيح API، يمكن استخدام هذا في تطبيقات الإنتاج.

هل تخزن هذه المهارة أي بيانات صوتية؟

لا، تعالج المهارة الصوت في الذاكرة وتُعيده إلى المتصل دون تخزين دائم.

تفاصيل المطور

المؤلف

sickn33

الترخيص

MIT

المستودع

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/podcast-generation

مرجع

main

بنية الملفات

📄 SKILL.md