Lire la description officielle

Compétences

Utilisez Python pour extraire les jeux de données et prévoir les modèles.

Norme de production

Construire des modèles statistiques - régression et classification - qui génèrent des informations utilisables à partir de données brutes.

La grande image

Maîtrisez les bases de l'apprentissage automatique et exploitez la puissance des données pour prévoir les prochaines étapes.

Rencontrez votre équipe de support

Notre excellence éducative est un effort communautaire. Lorsque vous apprenez à l'AG, vous pouvez toujours compter sur une équipe interne d'experts pour vous guider et vous soutenir, quand vous en avez besoin.

Instructeurs

Apprenez les cadres, les outils, le vocabulaire et les meilleures pratiques de niveau professionnel d'un enseignant dont le travail quotidien consiste à les utiliser de manière experte.

Assistants d'enseignement

Prendre de nouveaux matériaux n'est pas toujours facile. Grâce aux heures de bureau et à d'autres canaux, nos assistants à l'enseignement sont là pour vous fournir des réponses, des conseils, et plus encore.

Producteurs de cours

Nos anciens aiment leurs producteurs de cours, qui les ont motivés tout au long du cours. Vous pouvez contacter le votre pour obtenir de l'aide à tout moment.

Voyez ce que vous apprendrez

Unité 1: Conception de la recherche et analyse des données exploratoires

  • Qu'est-ce que Data Science
    • Décrire le programme de cours et établir l'environnement de la classe
    • Répondez aux questions: "Qu'est-ce que la science des données? Quels rôles existent dans la science des données?"
    • Définir le flux de travail, les outils et les approches utilisés par les scientifiques pour analyser les données
  • Conception de recherche et Pandas
  • Définir un problème et identifier les ensembles de données appropriés à l'aide du flux de travail Data Science
  • Procédure pas à pas dans le workflow de la science des données à l'aide d'une étude de cas dans la bibliothèque Pandas
  • Importer, formater et nettoyer des données à l'aide de la bibliothèque Pandas
  • Statistiques fondamentales I
  • Utilisez les librairies NumPy et Pandas pour analyser les ensembles de données en utilisant les statistiques récapitulatives de base: moyenne, médiane, mode, max, min, quartile, inter-quartile, intervalle, variance, écart-type et corrélation
  • Créez une visualisation de données - diagrammes de dispersion, matrice de dispersion, graphique linéaire, transferts de boîtes et histogrammes - pour discerner les caractéristiques et les tendances d'un ensemble de données
  • Identifier une distribution normale dans un ensemble de données à l'aide de statistiques récapitulatives et de visualisation
  • Statistiques fondamentales II
  • Expliquer la différence entre la causalité et la corrélation
  • Tester une hypothèse dans une étude de cas
  • Validez vos résultats en utilisant l'analyse statistique (p-values, intervalles de confiance)
  • Choix de l'instructeur
  • Concentrez-vous sur un sujet choisi par l'instructeur / classe afin de fournir un aperçu plus approfondi de l'analyse exploratoire des données

Unité 2: Fondements de la modélisation des données

  • Introduction à la régression
    • Définir la modélisation des données et la régression linéaire
    • Différencier les variables catégorielles et continues
    • Construire un modèle de régression linéaire en utilisant un ensemble de données qui répond à l'hypothèse de linéarité en utilisant la bibliothèque scikit-learn
  • Évaluation de l'ajustement du modèle
  • Définir les paramètres de régularisation, de biais et d'erreurs;
  • Évaluer l'ajustement du modèle en utilisant les fonctions de perte, y compris l'erreur absolue moyenne, l'erreur quadratique moyenne, l'erreur quadratique moyenne
  • Sélectionnez des méthodes de régression basées sur l'ajustement et la complexité
  • Introduction à la classification
  • Définir un modèle de classification
  • Construire un voisinage K-plus proche en utilisant la bibliothèque scikit-learn
  • Évaluer et ajuster le modèle en utilisant des mesures telles que la précision de classification / erreur
  • Introduction à la régression logistique
  • Construire un modèle de classification de régression logistique à l'aide de la bibliothèque scikit learn
  • Décrire la fonction sigmoïde, les cotes et les rapports de cotes et comment ils se rapportent à la régression logistique
  • Évaluer un modèle en utilisant des mesures telles que la précision de classification / erreur, la matrice de confusion, les courbes ROC / AOC et les fonctions de perte
  • Communiquer les résultats de la régression logistique
  • Expliquer le compromis entre la précision et le rappel d'un modèle et articuler le coût des faux positifs par rapport aux faux négatifs.
  • Identifier les éléments d'un rapport concis et convaincant et comment ils se rapportent à des publics / parties prenantes spécifiques
  • Décrire la différence entre la visualisation pour les présentations et l'analyse des données exploratoires
  • Session de classe flexible
  • Concentrez-vous sur un sujet sélectionné par l'instructeur / la classe afin de fournir un aperçu plus approfondi de la modélisation des données

Unité 3: La science des données dans le monde réel

  • Arbres de décision et forêt aléatoire
    • Décrire la différence entre les arbres de classification et de régression et comment interpréter ces modèles
    • Expliquer et communiquer les compromis entre les arbres de décision et les modèles de régression
    • Créez des arbres de décision et des forêts aléatoires à l'aide de la bibliothèque scikit-learn
  • Traitement du langage naturel
  • Démontrer comment marquer le texte en langage naturel en utilisant NLTK
  • Catégoriser et étiqueter les données de texte non structurées
  • Expliquer comment créer un modèle de classification de texte à l'aide de NLTK
  • Réduction de la dimensionnalité
  • Expliquer comment effectuer une réduction dimensionnelle à l'aide de modèles de sujet
  • Démontrer comment affiner les données à l'aide de l'allocation de Dirichlet latente (LDA)
  • Extraire des informations d'un exemple de jeu de données de texte
  • Travailler avec des données de séries temporelles
  • Expliquer pourquoi les données de séries temporelles diffèrent des autres données et comment en tenir compte
  • Créer des moyens de roulement et des données de séries chronologiques à l'aide de la bibliothèque Pandas
  • Effectuer une autocorrélation sur les données de séries chronologiques
  • Création de modèles avec des données de séries chronologiques
  • Décomposer les données de séries chronologiques en composantes de tendance et résiduelles
  • Validez et validez les données de différents ensembles de données
  • Utilisez le modèle ARIMA pour prévoir et détecter les tendances dans les données de séries chronologiques
  • La valeur des bases de données
  • Décrire les cas d'utilisation pour différents types de bases de données
  • Expliquer les différences entre les bases de données relationnelles et les bases de données documentaires
  • Écrire des requêtes de sélection simples pour extraire des données d'une base de données et les utiliser dans Pandas
  • Aller de l'avant avec votre carrière de Data Science
  • Préciser les modèles communs utilisés dans différentes industries
  • Identifier les cas d'utilisation pour les modèles communs
  • Discuter des prochaines étapes et des ressources supplémentaires pour l'apprentissage de la science des données
  • Session de classe flexible
  • Focus sur un sujet sélectionné par l'instructeur / classe afin de fournir un aperçu plus approfondi de la science des données dans le monde réel
  • Présentations finales
  • Présenter la présentation finale aux pairs, aux instructeurs et aux invités qui identifieront les points forts et les points à améliorer.

Options de financement

Besoin d'aide pour le paiement? Nos options de financement vous permettent de vous concentrer sur vos objectifs plutôt que sur les obstacles qui vous empêchent de les atteindre.

WeLend

Demander un prêt sans intérêt jusqu'à 18 mois, ou un prêt à taux fixe jusqu'à 48 mois.⁵ Être un citoyen de Hong Kong ou un résident permanent.
Les options de financement diffèrent dans chaque marché et ne sont disponibles que pour les étudiants acceptés dans nos programmes.
Contactez un agent des admissions local pour plus d'informations.

Programme enseigné dans l'établissement suivant :
Anglais

Voir 12 autres cours de General Assembly »

Ce cours est Campus based
Date de début
Mars 2019
Avril 2019
Duration
10 semaines
Temps partiel
Prix
3,950 USD
Deadline
Par lieux
Par date
Date de début
Janvier 2020
Date de fin
Date limite d'inscription
Date de début
Janvier 2020
Date de fin
Date limite d'inscription
Date de début
Janvier 2020
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Mars 2019
Date de fin
Date limite d'inscription
Date de début
Avril 2019
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Février 2020
Date de fin
Date limite d'inscription
Date de début
Septembre 2019
Date de fin
Date limite d'inscription
Date de début
Août 2019
Date de fin
Date limite d'inscription
Date de début
Août 2019
Date de fin
Date limite d'inscription

Mars 2019

Location
Date limite d'inscription
Date de fin

Avril 2019

Location
Date limite d'inscription
Date de fin

Août 2019

Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin

Septembre 2019

Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin

Janvier 2020

Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin
Location
Date limite d'inscription
Date de fin

Février 2020

Location
Date limite d'inscription
Date de fin