Pour la modélisation des séries temporelles multivariées, les modèles VARMA (Vector AutoRegressive Moving-Average) occupent une place centrale. Ils sont généralement utilisés avec des hypothèses fortes sur le bruit qui en limitent la généralité. Dans ce travail, nous nous intéressons à l'analyse statistique de modèles vectoriels ARMA (VARMA) pour des processus qui peuvent avoir des dynamiques non linéaires très générales. Nous appelons VARMA forts les modèles standard dans lesquels le terme d'erreur est supposé être une suite iid, et nous parlons de modèles VARMA faibles quand les hypothèses sur le bruit sont moins restrictives. Dans un premier temps, nous étudions les propriétés asymptotiques du quasi-maximum de vraisemblance (QMLE) des paramètres d'un modèle VARMA sans faire l'hypothèse d'indépendance sur le bruit, contrairement à ce qui est fait habituellement pour l'inférence de ces modèles. Relâcher cette hypothèse permet aux modèles VARMA faibles de couvrir une large classe de processus non linéaires. Nous faisons des hypothèses d'ergodicité et de mélange afin d'établir la convergence forte et la normalité asymptotique de l'estimateur du QMLE. Ensuite, nous accordons une attention particulière à l'estimation de la matrice de variance asymptotique qui a la forme "sandwich" Omega:= J^{-1}IJ^{-1}, et qui peut être très différente de la variance asymptotique standard dont la forme est Omega:= 2J^{-1}. Nous établissons la convergence d'un estimateur de Omega. Enfin, des versions modifiées des tests de Wald, du multiplicateur de Lagrange et du rapport de vraisemblance sont proposées pour tester des restrictions linéaires sur les paramètres libres du modèle.