📊

hypogenic

Name: hypogenic
Author: K-Dense-AI

مخاطر منخفضة 🌐 الوصول إلى الشبكة⚙️ الأوامر الخارجية

توليد فرضيات علمية من البيانات

متاح أيضًا من: davila7

توليد الفرضيات يدويًا يستغرق وقتًا طويلًا ومعرض للتحيزات المعرفية. يقوم Hypogenic بأتمتة توليد الفرضيات واختبارها باستخدام LLMs، مما يمكّن الباحثين من استكشاف الأنماط في مجموعات البيانات الجدولية بشكل منهجي ودمج النتائج التجريبية مع رؤى الأدبيات.

يدعم: Claude Codex Code(CC)

⚠️ 68 ضعيف

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "hypogenic". مجموعة فرعية صغيرة من البيانات الجدولية مع سمات نصية وتسميات تُظهر أنماطًا في سلوك العملاء

النتيجة المتوقعة:

1. Hypothesis: Samples with feature_X above threshold tend to have label_A due to underlying causal mechanism.
2. Hypothesis: The interaction between feature_Y and feature_Z creates a stronger effect than either alone.
3. Hypothesis: Label_B is associated with specific linguistic patterns in feature_W.

استخدام "hypogenic". نتائج تحقق تُظهر أي الفرضيات ضعيفة الأداء على مجموعات فرعية معينة من البيانات

النتيجة المتوقعة:

Refined Hypothesis 1: When feature_X > threshold AND feature_Y is low, label_A is more likely (updated from original to account for interaction effect).
Refined Hypothesis 3: The linguistic pattern in feature_W is more predictive when combined with metadata about source type.

التدقيق الأمني

مخاطر منخفضة

v6 • 1/21/2026

This scientific hypothesis generation skill was scanned with 126 potential issues detected. After evaluation, all findings are false positives: environment variable references for API keys follow security best practices; hardcoded URLs are legitimate documentation links; shell command examples are user setup instructions; no actual cryptographic code or command-and-control patterns exist. The skill makes normal LLM API calls for hypothesis generation, which is expected functionality.

الملفات التي تم فحصها

2,075

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

عوامل الخطر

🌐 الوصول إلى الشبكة (4)

SKILL.md:24 SKILL.md:544 SKILL.md:564 SKILL.md:603-604

⚙️ الأوامر الخارجية (3)

SKILL.md:19-31 SKILL.md:123-125 SKILL.md:233-235

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

الأمان

الامتثال للمواصفات

ماذا يمكنك بناءه

استكشاف فرضيات البحث الأكاديمي

توليد واختبار فرضيات متعددة حول الأنماط في البيانات الرصدية، مثل اكتشاف الخداع في النص أو تحديد مؤشرات الصحة النفسية من منشورات وسائل التواصل الاجتماعي.

اكتشاف أنماط خاصة بالمجال

استكشاف العلاقات التجريبية في مجموعات البيانات الجدولية لتطبيقات مثل تحليل المحتوى، النمذجة التنبؤية، أو أبحاث التصنيف.

توليد فرضيات مؤسّسة على الأدبيات

دمج الأوراق البحثية الموجودة مع البيانات التجريبية لتوليد فرضيات مؤسّسة نظريًا توسّع أو تتحقق من النظريات العلمية.

جرّب هذه الموجهات

توليد فرضيات أولية من البيانات

Analyze the following data samples and identify patterns in the features and labels. Generate {num_hypotheses} specific, testable hypotheses that could explain these patterns. Each hypothesis should be concrete and falsifiable.

تنقيح الفرضيات الموجودة

Review the following hypotheses and the validation results. Identify which hypotheses are underperforming and generate improved versions that better explain the challenging examples. Focus on specificity and testability.

دمج رؤى الأدبيات مع البيانات

Based on the following research paper insights: {paper_insights}, and the observed data patterns: {data_observations}, generate hypotheses that combine theoretical foundations with empirical findings.

التحقق من ملاءمة الفرضية

Given the hypothesis: {hypothesis}, and the data sample: {data_sample}, evaluate whether this hypothesis is relevant and testable for this dataset. Provide specific reasoning.

أفضل الممارسات

ابدأ بمجموعة بيانات نظيفة بصيغة HuggingFace مع ميزات نصية وتسميات مُسمّاة بشكل صحيح
استخدم ما لا يقل عن 10-20 فرضية لاستكشاف شامل لحيّز الأنماط
حسّن الفرضيات بشكل تكراري بناءً على أداء التحقق بدلًا من توليدها كلها دفعة واحدة
ادمج رؤى الأدبيات مع الفرضيات المدفوعة بالبيانات لأطر نظرية أكثر رسوخًا

تجنب

استخدام مجموعات بيانات لا تتطابق مع صيغة HuggingFace المطلوبة مع تسمية مفاتيح صحيحة
توليد عدد قليل جدًا من الفرضيات وفقدان علاقات أنماط مهمة
تخطي عملية التنقيح التكرارية وقبول الفرضيات الأولية
التشغيل دون تهيئة API مناسبة أو إعداد التخزين المؤقت لإدارة التكاليف

الأسئلة المتكررة

ما الصيغة التي يجب أن تكون بها مجموعتي البيانية؟

يجب أن تتبع مجموعات البيانات صيغة HuggingFace مع ملفات مُسمّاة <TASK>_train.json و<TASK>_val.json و<TASK>_test.json. يجب أن يحتوي كل ملف على text_features_1 حتى text_features_n (قوائم من السلاسل النصية) وlabel (قائمة من السلاسل النصية).

ما مزوّدو LLM المدعومون؟

يدعم Hypogenic نماذج OpenAI GPT ونماذج Anthropic Claude وLLMs محلية عبر واجهات برمجة تطبيقات متوافقة. اضبط المزوّد المفضل لديك في ملف config.yaml.

ما الفرق بين طرق HypoGeniC وHypoRefine وUnion؟

يقوم HypoGeniC بتوليد الفرضيات من البيانات فقط. يجمع HypoRefine رؤى الأدبيات مع الأنماط التجريبية. تجمع طرق Union فرضيات الأدبيات فقط مع مخرجات الإطار لتغطية شاملة.

كم عدد الفرضيات التي يجب أن أُنشئها؟

عادةً ما يُنشئ الإطار 10-20+ فرضية. مزيد من الفرضيات يستكشف مساحة أنماط أكبر لكنه يزيد تكاليف API. ابدأ بـ 20 واضبط بناءً على نتائج التحقق.

هل أحتاج Redis للتخزين المؤقت؟

Redis اختياري لكنه مُوصى به لتقليل تكاليف API أثناء التجارب التكرارية. يقوم بتخزين ردود LLM مؤقتًا لتجنب الاستدعاءات المتكررة لنفس المطالبات.

ما متطلبات الحوسبة؟

يتطلب الاستخدام الأساسي موارد قليلة مع Python وpip فقط. لمعالجة الأدبيات مع تحليل ملفات PDF، ستحتاج إلى تشغيل GROBID كخدمة. لاستخدام LLM محلية، يُنصح بموارد GPU.

تفاصيل المطور

المؤلف

K-Dense-AI

الترخيص

MIT license

المستودع

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/hypogenic

مرجع

main

بنية الملفات

📁 references/

📄 config_template.yaml

📄 SKILL.md