scikit-learn
Безопасно 76Примените scikit-learn для ML-моделей
от davila7
Быстро стройте модели машинного обучения с руководством по scikit-learn. Включает классификацию, регрессию, кластеризацию, предобработку, конвейеры и оценку моделей с готовыми к использованию примерами.
scanpy
Безопасно 80Анализ данных одноядерной РНК-секвенирования с помощью scanpy
от davila7
Анализ одноядерной РНК-секвенирования требует сложных рабочих процессов для контроля качества, кластеризации и визуализации. Этот навык предоставляет полные рабочие процессы scanpy, включая генерацию UMAP, кластеризацию Leiden, идентификацию маркерных генов и аннотацию типов клеток.
pymc-bayesian-modeling
Безопасно 79Создание байесовских моделей с PyMC
от davila7
Этот навык предоставляет инструменты для байесовского статистического моделирования с использованием PyMC. Он позволяет создавать иерархические модели, запускать MCMC-семплирование с NUTS, выполнять вариационный вывод и сравнивать модели с метриками LOO/WAIC для принципиальной оценки неопределенности.
polars
Безопасно 70Освойте Polars для высокопроизводительного анализа данных
от davila7
Рабочие процессы Pandas медленные и требовательны к памяти при работе с большими наборами данных. Этот навык предоставляет экспертные рекомендации по Polars — сверхбыстрой библиотеке DataFrame, построенной на Apache Arrow, которая обеспечивает улучшение производительности в 10-100 раз благодаря ленивым вычислениям, параллельной обработке и интуитивному API выражений.
plotly
Безопасно 70Создавайте интерактивные визуализации данных с Plotly
от davila7
Создание диаграмм и визуализаций занимает много времени. Plotly предоставляет библиотеку Python с 40+ типами диаграмм, включая точечные диаграммы, тепловые карты, 3D-графики и географические карты. Создавайте интерактивные визуализации публикационного качества и экспортируйте в HTML или статические изображения.
pdf-processing-pro
Низкий риск 73Извлечение и обработка PDF-документов
от davila7
Обработка PDF-документов вручную занимает слишком много времени. Этот набор инструментов предоставляет готовые к использованию скрипты для извлечения текста, работы с формами, извлечения таблиц и выполнения OCR на сканированных документах с поддержкой пакетной обработки.
pdf-processing
Безопасно 69Извлечение и обработка PDF-документов
от davila7
PDF-документы содержат ценные данные, но их сложно обрабатывать программно. Этот навык предоставляет шаблоны кода для извлечения текста, таблиц и данных форм из PDF с использованием Python-библиотек, таких как pdfplumber и pypdf.
matplotlib
Низкий риск 74Создание научных графиков и диаграмм
от davila7
Создание визуализаций публикационного качества на Python требует понимания API matplotlib, параметров стилизации и лучших практик. Этот навык предоставляет шаблоны, примеры кода и руководство по устранению неполадок для создания профессиональных графиков, диаграмм и 3D-визуализаций для исследований и анализа данных.
matchms
Безопасно 70Анализ данных масс-спектрометрии
от davila7
Масс-спектрометрия генерирует сложные спектральные данные, требующие специализированной обработки. Matchms предоставляет полный инструментарий Python для загрузки, фильтрации, сравнения и идентификации соединений из спектральных данных с использованием установленных метрик подобия.
get-available-resources
Безопасно 71Определение системных ресурсов для научных вычислений
от davila7
Задачи научных вычислений требуют соответствующих аппаратных ресурсов для эффективной работы. Этот навык автоматически определяет ядра процессора, доступность GPU, память и дисковое пространство для рекомендации оптимальных вычислительных стратегий и выбора библиотек.
geopandas
Безопасно 71Работа с геопространственными векторными данными для пространственного анализа
от davila7
Анализ географических данных требует специализированных инструментов для работы с векторными геометриями, системами координат и пространственными отношениями. GeoPandas расширяет pandas, обеспечивая пространственные операции с геометрическими типами для эффективной обработки геопространственных данных.
fda-database
Низкий риск 73Запрос к базам данных FDA для получения регуляторных данных
от davila7
Доступ к комплексным регуляторным данным FDA, включая лекарства, медицинские изделия, отзывы продуктов питания и информацию о веществах. Поиск нежелательных явлений, маркировки, одобрений и отзывов с использованием официального API openFDA.
exploratory-data-analysis
Безопасно 82Анализ научных файлов данных
от davila7
Ученым необходимо понимать структуру и качество разнообразных научных файлов данных перед анализом. Этот навык автоматически определяет типы файлов, извлекает метаданные, выполняет статистический анализ и создает комплексные отчеты в формате markdown для более чем 200 научных форматов.
excel-analysis
Безопасно 70Анализ Excel-таблиц с помощью Pandas
от davila7
Ручной анализ Excel занимает часы повторяющейся работы. Этот навык предоставляет готовые к использованию шаблоны pandas для чтения, анализа и визуализации табличных данных за считанные секунды.
dnanexus-integration
Безопасно 70Создание и развертывание геномных пайплайнов на DNAnexus
от davila7
Управление геномными данными и создание аналитических пайплайнов на DNAnexus требует изучения сложных API и паттернов. Этот навык предоставляет полное руководство по разработке приложений, управлению данными и выполнению рабочих процессов на облачной платформе DNAnexus.
diffdock
Безопасно 81Предсказание связывания лигандов с белками с помощью ИИ
от davila7
Предсказывайте 3D позы связывания между белками и низкомолекулярными лигандами с использованием передовых диффузионных моделей. Генерируйте предсказания с оценками достоверности для разработки лекарств на основе структуры и кампаний виртуального скрининга.
deeptools
Безопасно 78Анализ NGS данных с помощью deepTools
от davila7
Обработка данных секвенирования нового поколения для экспериментов ChIP-seq, RNA-seq и ATAC-seq. Конвертация BAM файлов в нормализованные треки покрытия и создание визуализаций публикационного качества, включая тепловые карты, графики корреляции и профильные графики.
datamol
Безопасно 70Анализ молекул и вычисление свойств лекарств с помощью Python
от davila7
Работа с молекулярными данными в Python требует сложного кода RDKit. Datamol предоставляет простые функции для парсинга SMILES, вычисления свойств и анализа соединений.
datacommons-client
Безопасно 71Запрос публичной статистики из Data Commons
от davila7
Доступ к демографическим, экономическим данным и данным о здравоохранении из множества глобальных источников требует навигации по сложным API. Этот навык предоставляет полное руководство по использованию Python-клиента Data Commons для запроса статистики населения, уровня безработицы, показателей ВВП и других публичных наборов данных через единый граф знаний.
dask
Безопасно 70Масштабирование pandas и NumPy за пределы памяти с помощью Dask
от davila7
Обработка больших наборов данных, превышающих доступную оперативную память, приводит к ошибкам памяти и низкой производительности. Dask предоставляет абстракции параллельных вычислений, которые масштабируют операции pandas и NumPy для обработки данных терабайтного масштаба на ноутбуках или кластерах.