Modèle linéaire multiple
En continuant avec l`exemple «Healthy Breakfast», supposons que nous choisissiez d`ajouter la variable «Fiber» à notre modèle. Les résultats de MINITAB sont les suivants: la régression linéaire multiple (MLR) est une technique statistique qui utilise plusieurs variables explicatives pour prédire le résultat d`une variable de réponse. Le but de la régression linéaire multiple (MLR) est de modéliser la relation entre les variables explicatives et de réponse. En réalité, il y a plusieurs facteurs qui prédisent le résultat d`un événement. Le mouvement des prix d`Exxon Mobil, par exemple, dépend plus que simplement de la performance du marché global. D`autres prédicteurs tels que le prix du pétrole, les taux d`intérêt, et le mouvement des prix des futures pétrolières peuvent affecter le prix de XOM et les cours boursiers d`autres compagnies pétrolières. Pour comprendre une relation dans laquelle plus de deux variables sont présentes, une régression linéaire multiple est utilisée. Considérez un analyste qui souhaite établir une relation linéaire entre le changement quotidien dans les cours boursiers d`une société et d`autres variables explicatives telles que le changement quotidien dans le volume des transactions et le changement quotidien des rendements du marché. S`il exécute une régression avec la variation quotidienne des cours boursiers de la société en tant que variable dépendante et le changement quotidien du volume de trading en tant que variable indépendante, il s`agirait d`un exemple de régression linéaire simple avec une variable explicative.
Tout d`abord, comme il est évident dans le nom de régression linéaire multiple, on suppose que la relation entre les variables est linéaire. Dans la pratique, cette hypothèse ne peut pratiquement jamais être confirmée; Heureusement, les procédures de régression multiple ne sont pas grandement affectées par des écarts mineurs par rapport à cette hypothèse. Cependant, en règle générale, il est prudent de toujours regarder le nuage de dispersion bivariée des variables d`intérêt. Si la courbure dans les relations est évidente, vous pouvez envisager de transformer les variables ou d`autoriser explicitement les composants non linéaires. La régression linéaire joue un rôle important dans le domaine de l`intelligence artificielle, comme l`apprentissage automatique. L`algorithme de régression linéaire est l`un des algorithmes de machine-learning supervisés fondamentaux en raison de sa simplicité relative et des propriétés bien connues. Le cas le plus simple d`une variable de prédicteur scalaire unique x et une variable de réponse scalaire unique y est connue sous le nom de régression linéaire simple. L`extension de variables prédictitrices à valeurs multiples et/ou vectorielles (signalées par un X majuscule) est connue sous le nom de régression linéaire multiple, également appelée régression linéaire multivariable.
Presque tous les modèles de régression du monde réel impliquent plusieurs prédicteurs, et les descriptions de base de la régression linéaire sont souvent exprimées en termes de modèle de régression multiple. Notez, cependant, que dans ces cas, la variable de réponse y est toujours un scalaire. Un autre terme, régression linéaire multivariée, désigne les cas où y est un vecteur, c`est-à-dire la même régression linéaire générale. Dans les statistiques, la régression linéaire est une approche linéaire pour modéliser la relation entre une réponse scalaire (ou variable dépendante) et une ou plusieurs variables explicatives (ou variables indépendantes). Le cas d`une variable explicative est appelé régression linéaire simple. Pour plus d`une variable explicative, le processus est appelé régression linéaire multiple. [1] ce terme est distinct de la régression linéaire multivariée, où plusieurs variables dépendantes corrélées sont prédites, plutôt qu`une variable scalaire unique. [2] dans un modèle de régression multiple, nous pouvons souhaiter savoir si une variable x particulière contribue utilement au modèle.