Ce projet été baser sur un jeu de données dans le domaine cinématique et plus précisément l’étude des nombres des vues d’une bande d’annonce d’un film.
On a pu appliquer et étudier la régression linéaire multiple à notre table de données, on a aussi étudier les différentes critères et les différentes tests qui définissent et évaluent la qualité du modèle prédit. On a appliqué ensuite les différentes méthodes de la classification : CAH et la méthode des k-means, à travers ces deux méthodes on pu classifier nos variables en des groupes selon des critères bien précis soit le calcul es distances ou le critère de ressemblance .
Dans la partie de l’analyse factorielle, on a appliqué la méthode ACP, à travers cette méthode, on a pu étudier le comportement des variables et des individus de notre table de donnée. Ensuite, on a calculé les différentes indices qui permet d’avoir une vision globale sur la corrélation entre les variables, en se basant sur les valeurs propres on a pu déterminer la dimension des sous espaces ainsi que les variables et les individus les plus contributives dans chaque sous espace. On a aussi apliqué la méthode ACM. Tout d’abord, on a classifié nos variables en des modalités pour pouvoir l’appliquer à un tableau qualitative . Après, on a passé à l’étude des modalités et leurs caractéristiques en construisant le tableau disjonctif, et en calculant les valeurs propres et d’autres valeurs descriptifs appliqué aux modalités.