scikit-learn
안전 76Appliquer scikit-learn pour les modèles ML
작성자 davila7
Construisez rapidement des modèles d'apprentissage automatique avec l'aide de scikit-learn. Couvre la classification, la régression, le clustering, le prétraitement, les pipelines et l'évaluation de modèles avec des exemples prêts à l'emploi.
scanpy
안전 80Analyser les données de RNA-seq sur cellule unique avec scanpy
작성자 davila7
L'analyse de RNA-seq sur cellule unique nécessite des flux de travail complexes pour le contrôle qualité, le regroupement et la visualisation. Cette compétence fournit des flux de travail scanpy complets incluant la génération UMAP, le clustering Leiden, l'identification de gènes marqueurs et l'annotation des types cellulaires.
pymc-bayesian-modeling
안전 79Construire des modèles bayésiens avec PyMC
작성자 davila7
Cette compétence fournit des outils pour la modélisation statistique bayésienne avec PyMC. Elle permet de construire des modèles hiérarchiques, d'exécuter l'échantillonnage MCMC avec NUTS, de réaliser l'inférence variationnelle et de comparer des modèles avec les métriques LOO/WAIC pour une quantification rigoureuse de l'incertitude.
polars
안전 70Maîtriser Polars pour l'analyse de données haute performance
작성자 davila7
Les workflows Pandas sont lents et gourmands en mémoire sur les grands jeux de données. Cette compétence fournit des conseils experts sur Polars, une bibliothèque DataFrame ultra-rapide construite sur Apache Arrow qui offre des améliorations de performance de 10 à 100x grâce à l'évaluation paresseuse, au traitement parallèle et à une API d'expression intuitive.
plotly
안전 70Créer des visualisations de données interactives avec Plotly
작성자 davila7
Créer des graphiques et des visualisations prend du temps. Plotly fournit une bibliothèque Python avec plus de 40 types de graphiques incluant des nuages de points, des cartes thermiques, des graphiques 3D et des cartes géographiques. Générez des visualisations interactives de qualité publication et exportez-les en HTML ou en images statiques.
pdf-processing-pro
낮은 위험 73Extraire et traiter des documents PDF
작성자 davila7
Le traitement manuel des documents PDF prend trop de temps. Cette boîte à outils fournit des scripts prêts pour la production pour extraire du texte, gérer des formulaires, extraire des tableaux et effectuer de l'OCR sur des documents numérisés avec support du traitement par lots.
pdf-processing
안전 69Extraire et traiter des documents PDF
작성자 davila7
Les documents PDF contiennent des données précieuses mais sont difficiles à traiter par programmation. Cette compétence fournit des modèles de code pour extraire du texte, des tableaux et des données de formulaires à partir de PDF en utilisant des bibliothèques Python comme pdfplumber et pypdf.
matplotlib
낮은 위험 74Créer des graphiques et des tracés scientifiques
작성자 davila7
La création de visualisations de qualité publication en Python nécessite la compréhension de l'API matplotlib, des options de style et des bonnes pratiques. Cette compétence fournit des modèles, des exemples de code et des conseils de dépannage pour générer des tracés professionnels, des graphiques et des visualisations 3D pour la recherche et l'analyse de données.
matchms
안전 70Analyser les données de spectrométrie de masse
작성자 davila7
La spectrométrie de masse génère des données spectrales complexes nécessitant un traitement spécialisé. Matchms fournit une boîte à outils Python complète pour le chargement, le filtrage, la comparaison et l'identification de composés à partir de données spectrales avec des métriques de similarité établies.
get-available-resources
안전 71Détecter les ressources système pour le calcul scientifique
작성자 davila7
Les tâches de calcul scientifique nécessitent des ressources matérielles appropriées pour fonctionner efficacement. Cette compétence détecte automatiquement les cœurs CPU, la disponibilité GPU, la mémoire et l'espace disque pour recommander des stratégies de calcul optimales et des choix de bibliothèques.
geopandas
안전 71Traiter des données vectorielles géospatiales pour l'analyse spatiale
작성자 davila7
L'analyse de données géographiques nécessite des outils spécialisés pour gérer les géométries vectorielles, les systèmes de coordonnées et les relations spatiales. GeoPandas étend pandas pour permettre des opérations spatiales sur des types géométriques et une manipulation efficace des données géospatiales.
fda-database
낮은 위험 73Interroger les bases de données de la FDA pour des données réglementaires
작성자 davila7
Accédez à des données réglementaires complètes de la FDA, incluant les médicaments, dispositifs médicaux, rappels alimentaires et informations sur les substances. Recherchez les événements indésirables, l'étiquetage, les approbations et les rappels en utilisant l'API officielle openFDA.
exploratory-data-analysis
안전 82Analyser les fichiers de données scientifiques
작성자 davila7
Les scientifiques ont besoin de comprendre la structure et la qualité de divers fichiers de données scientifiques avant l'analyse. Cette compétence détecte automatiquement les types de fichiers, extrait les métadonnées, effectue une analyse statistique et génère des rapports markdown complets pour plus de 200 formats scientifiques.
excel-analysis
안전 70Analyser des fichiers Excel avec Pandas
작성자 davila7
L'analyse manuelle d'Excel prend des heures de travail répétitif. Cette compétence fournit des modèles pandas prêts à l'emploi pour lire, analyser et visualiser des données de feuilles de calcul en quelques secondes.
dnanexus-integration
안전 70Créer et déployer des pipelines génomiques DNAnexus
작성자 davila7
La gestion des données génomiques et la création de pipelines d'analyse sur DNAnexus nécessitent l'apprentissage d'APIs et de modèles complexes. Cette compétence fournit des conseils complets pour le développement d'applications, la gestion des données et l'exécution de workflows sur la plateforme cloud DNAnexus.
diffdock
안전 81Prédire les poses de liaison protéine-ligand avec l'IA
작성자 davila7
Prédisez les poses de liaison 3D entre les protéines et les petites molécules ligands en utilisant des modèles de diffusion de pointe. Générez des prédictions avec scores de confiance pour la découverte de médicaments basée sur la structure et les campagnes de criblage virtuel.
deeptools
안전 78Analyser des données NGS avec deepTools
작성자 davila7
Traiter les données de séquençage de nouvelle génération pour les expériences ChIP-seq, RNA-seq et ATAC-seq. Convertir les fichiers BAM en pistes de couverture normalisées et générer des visualisations de qualité publication incluant des cartes thermiques, des graphiques de corrélation et des profils.
datamol
안전 70Analyser des molécules et calculer des propriétés de médicaments avec Python
작성자 davila7
Travailler avec des données moléculaires en Python nécessite du code RDKit complexe. Datamol fournit des fonctions simples pour l'analyse SMILES, le calcul de propriétés et l'analyse de composés.
datacommons-client
안전 71Interroger les statistiques publiques de Data Commons
작성자 davila7
L'accès aux données démographiques, économiques et de santé à partir de plusieurs sources mondiales nécessite de naviguer à travers des API complexes. Cette compétence fournit des instructions complètes pour utiliser le client Python Data Commons afin d'interroger les statistiques de population, les taux de chômage, les chiffres du PIB et d'autres ensembles de données publiques via un graphe de connaissances unifié.
dask
안전 70Faire évoluer pandas et NumPy au-delà de la mémoire avec Dask
작성자 davila7
Le traitement de grands ensembles de données qui dépassent la RAM disponible provoque des erreurs de mémoire et des performances lentes. Dask fournit des abstractions de calcul parallèle qui permettent aux opérations pandas et NumPy de gérer des données à l'échelle du téraoctet sur des ordinateurs portables ou des clusters.