☁️

modal

Безопасно ⚙️ Внешние команды🌐 Доступ к сети📁 Доступ к файловой системе🔑 Переменные окружения

Запуск кода Python в облаке

Также доступно от: davila7

Modal — это бессерверная платформа для запуска кода Python в облаке. Она предоставляет мгновенный доступ к GPU, автоматическое масштабирование и оплату по факту использования. Развертывайте ML‑модели, выполняйте пакетные задания и обслуживайте API без управления инфраструктурой.

Поддерживает: Claude Codex Code(CC)
📊 71 Адекватно
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «modal». Deploy a Python function that summarizes text using a HuggingFace model on GPU

Ожидаемый результат:

  • ✓ Created Modal app with L40S GPU access
  • ✓ Built container image with transformers and torch
  • ✓ Deployed web endpoint for text summarization
  • ✓ Endpoint available at https://your-app.modal.run

Использование «modal». Run a batch job to process 1000 images in parallel

Ожидаемый результат:

  • ✓ Created worker function with 4 CPU cores and 8GB memory
  • ✓ Configured parallel processing across 50 containers
  • ✓ Processed 1000 images in ~8 minutes
  • ✓ Results saved to Modal Volume at /data/output/

Использование «modal». Schedule daily model retraining at midnight

Ожидаемый результат:

  • ✓ Created scheduled function with cron expression '0 0 * * *'
  • ✓ Configured GPU (A100) for training computations
  • ✓ Set up secret management for API credentials
  • ✓ Training logs available in Modal dashboard

Аудит безопасности

Безопасно
v4 • 1/17/2026

This is a documentation-only skill for Modal, a legitimate serverless cloud computing platform. All 572 static findings are FALSE POSITIVES. The scanner misinterprets Markdown documentation code examples as executable code. Patterns flagged include CLI commands in documentation (modal run, modal deploy), environment variable documentation, and legitimate Modal API patterns. No malicious code, credential exfiltration, or actual security vulnerabilities exist. This skill contains only documentation files teaching users how to properly use the Modal platform.

14
Просканировано файлов
6,111
Проанализировано строк
4
находки
4
Всего аудитов

Оценка качества

45
Архитектура
100
Сопровождаемость
87
Контент
21
Сообщество
100
Безопасность
91
Соответствие спецификации

Что вы можете построить

Развертывание ML‑моделей для инференса

Развертывайте обученные модели (LLM, классификаторы изображений) в продакшене с ускорением на GPU и авто‑масштабированием под переменный трафик.

Запуск пакетных заданий

Обрабатывайте большие наборы данных параллельно в нескольких контейнерах. Обрабатывайте тысячи файлов или строк данных одновременно.

Выполнение GPU‑задач

Запускайте вычислительно интенсивные исследовательские задачи на H100 или A100 GPU. Планируйте задания обучения и длительные вычисления.

Попробуйте эти промпты

Базовое развертывание на GPU
Create a Modal app that runs a Python function on an L40S GPU. The function should load a HuggingFace model and return predictions. Use an appropriate container image with torch and transformers installed.
Пакетная обработка
Set up a Modal function that processes CSV files in parallel. The function should read files from an S3 bucket, apply transformations, and save results. Use CPU parallelism with multiple cores.
Задания по расписанию
Create a Modal scheduled function that runs daily at 2 AM. The function should refresh cached data from an API and update model weights stored in a Modal Volume.
Веб‑API
Build a Modal web endpoint that accepts POST requests with input data. The endpoint should run inference using a deployed model and return predictions. Include proper error handling and authentication.

Лучшие практики

  • Закрепляйте версии всех пакетов Python в определениях образов, чтобы обеспечить воспроизводимые сборки и развертывания
  • Используйте отдельные Modal Secrets для разных окружений (dev, staging, production), чтобы предотвратить утечки учетных данных
  • Настраивайте соответствующий min_containers, чтобы уменьшить задержку холодного старта для чувствительных к задержке эндпоинтов

Избегать

  • Хардкод ключей API или учетных данных прямо в коде функции вместо использования Modal Secrets
  • Импорт тяжелых зависимостей на уровне модуля вместо внутри тела функции, что замедляет запуск контейнера
  • Использование последовательных циклов для пакетной обработки вместо .map() для параллельного выполнения по контейнерам

Часто задаваемые вопросы

Сколько стоит Modal?
Modal использует оплату по факту использования. Вы платите только за использованное вычислительное время. Новые пользователи получают $30/месяц в виде бесплатных кредитов. Экземпляры GPU и более крупные контейнеры стоят дороже.
Какие типы GPU доступны?
Modal предоставляет GPU T4, L4, A10, A100, A100-80GB, L40S, H100, H200 и B200. Разные модели предлагают различные компромиссы цена‑производительность для инференса и обучения.
Как пройти аутентификацию в Modal?
Run 'modal token new' to open a browser login. This stores credentials in ~/.modal.toml. Alternatively, set MODAL_TOKEN_ID and MODAL_TOKEN_SECRET environment variables.
Можно ли запускать длительные задания?
Да, но тайм‑аут по умолчанию — 5 минут. Увеличьте его параметром timeout до 24 часов. Для более длительных заданий рассмотрите разбиение работы на части или использование заданий по расписанию.
Как работает автоскейлинг?
Modal автоматически масштабирует контейнеры от нуля до max_containers на основе входящих запросов. Установите min_containers, чтобы держать контейнеры прогретыми для низкой задержки эндпоинтов. Используйте buffer_containers для обработки всплесков.
Какие версии Python поддерживаются?
Modal поддерживает Python 3.8–3.12. Укажите python_version в определении образа. Для лучшей производительности при ML‑нагрузках рекомендуется Python 3.11 или 3.12.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

Apache-2.0 license

Ссылка

main

Структура файлов