Processus de Markov à temps continu

En théorie des probabilités, un processus de Markov à temps continu, ou chaîne de Markov à temps continu est une variante à temps continu du processus de Markov. Plus précisément, c'est un modèle mathématique à valeur dans un ensemble dénombrable, les états, dans lequel le temps passé dans chacun des états est une variable aléatoire réelle positive, suivant une loi exponentielle.

Cet objet est utilisé pour modéliser l'évolution de certains systèmes, comme les files d'attente.

Idée générale modifier

 
Fonctions de densité de lois exponentielles de paramètre λ.

Une chaîne de Markov à temps continu (Xt)t≥0 est un processus stochastique. Chaque Xt est une variable aléatoire qui indique dans quel état le système se trouve à l'instant t. Par exemple, il peut faire beau ou alors pleuvoir. Supposons qu'il fasse beau au début, autrement X0 = beau. Le processus reste pendant un moment dans l'état beau. Par exemple X0 = ... = X0.001... = X0.401... = X0.499... = beau. Puis par exemple, le processus change d'état au temps 0.5, et va dans l'état pluie. Le temps d'attente dans l'état beau suit une loi exponentielle (voir fonctions de densité dans la figure de droite) d'un certain paramètre. Là dans l'exemple, le temps d'attente était de 0.5. Puis le processus reste un moment dans l'état pluie X0.5 = ... = X0.656... = pluie.

Définitions formelles modifier

Dans cette section, nous donnons d'abord les éléments qui permettent de caractériser une chaîne de Markov à temps continu. Puis nous donnerons plusieurs définitions équivalentes alternatives qui utilisent ces éléments pour définir le processus (Xt)t≥0.

Caractérisation modifier

Une chaîne de Markov est caractérisée par :

  • un ensemble S fini ou dénombrable d'états ;
  • une distribution initiale sur l'ensemble des états ;
  • une matrice Q de taux de transition, aussi appelée générateur infinitésimal.

La matrice Q est de dimension |S|². Étant donnés deux états différents i ≠ j, les éléments qij de la matrice Q sont des réels positifs qui quantifient la vitesse de transition de l'état i vers l'état j. Les éléments qii sont choisis pour que les colonnes de chaque ligne somment à zéro, i.e.

 .

Définitions équivalentes modifier

Il existe plusieurs façons équivalentes de définir le processus (Xt)t≥0[1].

Définition infinitésimale modifier

Soit Xt la variable aléatoire décrivant l'état du processus au temps t. Pour tous t et h positifs, conditionnellement à {Xt = i}, Xt + h est indépendant de (Xs : s≤ t) et, pour h tendant vers 0, on a pour tout états i et j,

 

δij vaut 1 si i=j et 0 sinon (il s'agit d'un delta de Kronecker), qij est l'élément à la ligne i et à la colonne j dans la matrice Q, et   désigne une fonction négligeable devant   (voir notation de Landau).

Définition par les sauts modifier

Le processus peut rester dans un état un certain temps puis changer d'état : on parle de saut. Soit Yn l'état du processus après son n-ième saut et Sn le temps passé dans l'état Yn. Alors (Yn)n≥0 est une chaîne de Markov à temps discret et, conditionnellement à (Y0, ..., Yn), les temps d'attente (S0, ..., Sn) sont des variables exponentielles indépendantes de paramètres respectifs  .

Définition par les probabilités de transitions modifier

Pour tous les instant t0, t1, ... et pour tous les états i0, i1, ... correspondants, on a

 

pij est la fonction solution de l'équation de Kolmogorov (en) :

 

avec pour condition initiale P(0) = I, la matrice identité. La résolution de cette équation conduit alors à

 

Propriétés modifier

Irréductibilité modifier

Un état j est dit accessible à partir d'un autre état i (écrit i → j) s'il est possible d'obtenir j à partir de i. C'est-à-dire, si :

 

On dit d'un état i qu'il communique avec un état j (écrit i ↔ j) si i → j et j → i. Un ensemble d'états C est une classe communicante si chaque paire d'états dans C communiquent entre eux, et si aucun état dans C ne communique avec un état non-présent dans C. Puisque la communication est une relation d'équivalence, l'espace d'états S peut être partitionné en un ensemble de classes communicantes. Un processus de Markov à temps continu est irréductible si l'espace S entier est une classe communicante unique.

Pour tout   et   dans une même classe communicante C, on peut montrer (en utilisant des propriétés de sous-additivité) que la limite

 

existe et ne dépend ni de   ni de   ; on la note  .

Par exemple, dans une chaîne où l'état 0 est absorbant, où les états {1,2,...} forment une classe communicante et où le système est absorbé par l'état 0 presque sûrement, la limite donne le taux d'absorption de la chaîne, parfois appelé paramètre de Kingman.

Autre exemple. Considérons la marche aléatoire sur l'ensemble des entiers relatifs   dont le générateur est donné par  ,    ,   et   pour les autres indices. La matrice   est une matrice de Toeplitz tridiagonale. Alors

 

On remarque que la limite est strictement négative si   et nulle si  .

Applications modifier

Théorie des files d'attente modifier

 
Une file M/M/1

Un domaine d'application des processus de Markov à temps continu est la théorie des files d'attente. Par exemple une file M/M/1 (selon la notation de Kendall) est un modèle où un processeur doit traiter des requêtes, qui s'accumulent (dans l'ordre) dans une file d'attente. Les requêtes arrivent suivant une loi exponentielle de taux   et le processeur les traite avec une loi exponentielle de taux  . La chaîne sous-jacente est la suivante :  

Et la matrice (générateur infinitésimal) de taux est :

 

Notes et références modifier

  1. (Norris 1997, Théorème 2.8.2)

Bibliographie modifier

Lien externe modifier

Chapitre « Processus de Poisson » du cours de maîtrise « Modèles stochastiques » (2002) de Dominique Bakry sur le sujet, plus orienté vers la théorie de la mesure.