000639: Impossible d’estimer le modèle en raison de la multicolinéarité (redondance de données).

Description

Le modèle de régression ne peut pas se résoudre (la matrice du modèle ne peut pas être inversée) en présence de multicolinéarité. La multicolinéarité survient lorsqu’au moins deux variables sont redondantes (autrement dit, elles racontent la même histoire ou quasiment la même histoire). Un modèle efficace aura des variables explicatives que chacun obtient à une facette différente de la variable dépendante que vous essayez de prévoir/comprendre.

Solution

  1. Supprimez tout champ redondant depuis l’ensemble des variables explicatives.
  2. Identifiez et supprimez toute variable explicative qui a la même valeur pour toutes les entités (par exemple, un champ contenant que des zéros).
  3. Créez une matrice de nuage de points pour vos variables explicatives et évaluez s’il s’agit de corrélations quasi parfaites. Si c’est le cas, pensez à déposer une des variables correspondantes depuis votre modèle.