Introduction à la VoIP

Présentation

La voix sur IP est un sujet vaste et très riche. Pour commencer il convient de définir les concepts cachés derrière le terme générique « VoIP », ensuite je vous proposerai un historique de cette technologie en plein essor pour pouvoir la situer parmi d’autres technologies.

Une fois que nous saurons exactement de quoi nous parlons et d’où cela vient il sera temps de commencer à définir le fonctionnement, les protocoles et le matériel permettant d’exploiter cette technologie. Pour finir, un aperçu des possibilités offertes sera exposé.


// notes internes
Démonstration d’utilisation d’un client VPN +H.323 et d’un client SIP.
Softphone (H323 over VPN)
3stars.net (SIP over IP)
3stars (via SIP via H323 via VPN)
Bibliographie
// fin des notes internes

1. Introduction aux concepts de VoIP

La " VoIP " ou littéralement " voix sur IP " en Français désigne l’ensemble des technologies permettant de communiquer (au moins) oralement via un réseau utilisant le protocole IP. Le terme "VoIP" est en général utilisé pour décrire des communications "Point à Point". Pour la diffusion de son sur IP en multipoints, on parlera plutôt de streaming (comme les radios sur Internet, par exemple).1
Mais pourquoi en parle-t-on autant ?
La raison principale est assez évidente : le plus connu de ces fameux réseaux IP se trouve être Internet, imaginez alors les possibilités en terme d’accessibilité et les bouleversements potentiellement accessibles au niveau des frais de communication. Derrière cette révolution en marche se cachent, comme souvent, des motivations financières… mais pas seulement. La raison qui fait qu'on en parle de plus en plus est l'arrivée de technologies d'accès qui, comme l'ADSL par exemple, offrent des débits plus que suffisants pour communiquer par Internet. Doucement les terminaux sans fil entrent dans la danse.

Le but de cet article n’est clairement pas d’offrir une vision précise de toutes les possibilités et technologies existantes à l’heure actuelle mais plutôt de situer les acteurs, protocoles, technologies et usages principaux du marché dans un contexte. Avant cela il convient de définir quelques termes souvent employés pour décrire ces différents éléments.

1.a Petit lexique

IP
Internet Protocol, généralement abrégé IP, est un protocole de communication de réseau informatique. IP est le protocole d'Internet. IP correspond à un protocole de niveau 3 dans le modèle OSI et du modèle TCP/IP permettant un service d'adressage unique pour l'ensemble des terminaux connectés.2

ToIP
La voix sur IP (VoIP) regroupe l'ensemble des techniques permettant de faire transiter de la voix sur un réseau informatique. La voix sur IP comprend ainsi les communications de PC à PC. Pour ce type de communication, chaque utilisateur doit disposer d'un logiciel approprié. Si la connexion passe par le réseau Internet, on parle alors de ToIP, la téléphonie par Internet.
Deuxième catégorie de voix sur IP, les communications de PC à téléphone (PC to Phone). Dans les deux cas, le PC communicant est appelé Softphone, terme qui insiste sur l'émulation du PC en téléphone grâce à un logiciel.3

La ToIP s'inscrit dans la troisième catégorie de communications en voix sur IP, les échanges de téléphone à téléphone. Les postes sont alors baptisés IP-Phone pour les distinguer de leurs homologues standards. Un téléphone IP doit en effet être alimenté par courant au contraire des téléphones classiques. Il est capable de numériser la voix pour la transmettre sur des réseaux IP et peut, à l'inverse, rassembler les paquets entrants pour interpréter la voix reçue. La téléphonie sur IP circule sur des réseaux privés - LAN ou VPN - ou publics.

Dans la littérature il arrive souvent de tomber sur le terme « ToIP » qui désigne les mêmes technologies que la VoIP, ToIP signifie « Telephony Over IP » ou, plus prosaïquement les techniques employées pour faire circuler la voix sur un réseau informatique dont la couche transport est prise en charge par le protocole IP.

Système temps réel
Les systèmes informatiques temps réel se différencient des autres systèmes informatiques par la prise en compte de contraintes temporelles dont le respect est aussi important que l'exactitude du résultat, autrement dit le système ne doit pas simplement délivrer des résultats exacts, il doit les délivrer dans des délais imposés.4

PABX
PABX signifie "Private Automatic Branch eXchange"
Un PABX sert principalement à relier les postes téléphoniques d'un établissement (lignes internes) avec le réseau téléphonique public (lignes externes). Il permet en plus la mise en œuvre d'un certain nombre de fonctions, notamment :

  1. Relier plus de lignes internes qu'il n'y a de lignes externes.
  2. Permettre des appels entre postes internes sans passer par le réseau public.
  3. Programmer des droits d'accès au réseau public pour chaque poste interne.
  4. Proposer un ensemble de services téléphoniques (conférences, transferts d'appel, renvois, messagerie, appel par nom…).
  5. Gérer les Direct Inward Dialing (DDI)
  6. Gérer la ventilation par service de la facture téléphonique globale (taxation).
  7. Apporter des services de couplage téléphonie-informatique (CTI).
  8. Gérer les appels d'urgence dans les structures d'accueil hospitalières, maisons de retraite, etc.
  9. Gérer un portier interphone d'immeuble et commander une gâche électrique

Il s'agit en quelque sorte d'un switch doté de fonctionnalités particulières et peut être considéré comme étant le coeur d'un réseau privé de téléphonie.
Le terme "IP-PABX" (ou "IPBX") désigne un PABX (ou PBX) utilisant la technologie IP pour accéder à son réseau.

Fournisseurs d'accès
ITSP, VSP ou VoIPP: Un "Internet Telephony Service Provider", "Voice Service Provider" ou "VoIP Provider" offre un service de données par Internet pour faire des appels téléphoniques en utilisant une o plusieurs technologies VoIP.

2. Le marché

A ce stade ci de la présentation, il convient de remarquer que le marché est assez diversifié et il existe des différences notables : entre les offres professionnelles et celles adressées au grand public mais aussi entre les opérateurs historiques et les nouveaux acteurs technologiques..

Pour avoir une bonne idée de l'état du marché de la téléphonie professionnelle il existe un outil appelé "Quadrant Gartner"5 (ou "Magic Quadrant") fourni par la société Gartner6 permettant de juger de l'innovation et du succès qu'apportent les acteurs majeurs du secteur.

01569356.png

Quadrant Gartner pour la téléphonie professionnelle en aout 2008.7

Pour illustrer les différences prenons deux produits de l'industrie de la voix sur IP.

Premièrement, l'offre B-Centrex de B3G8. On parle bien de VoIP puisque cette offre est présentée comme ceci : "C’est une solution de dématérialisation : l’entreprise n’a plus besoin d’un boîtier PABX dans ses locaux. Les postes téléphoniques sont connectés au réseau informatique de l’entreprise, lui-même relié, via un accès haut débit sécurisé à la plate-forme téléphonique B3G. Cette dernière gère toutes les fonctionnalités de téléphonie d’entreprise en standard". Désormais la société n'a plus qu'à se doter de téléphones IP compatibles, tout le reste passe par une ligne haut-débit. Si on compare avec le monde de l'informatique plus classique, ça serait un peu comme louer un serveur applicatif à distance et des postes clients très peu véloces qui s'y connecteraient et appliqueraient les traitements sur le serveur distant (en session Terminal Server par exemple).
Cette solution permet de s'affranchir des frais d'investissement et de maintenance mais demande probablement un coût mensuel plus élevé pour avoir droit à une telle tranquillité.

Ensuite comparons-là à l'exemple de Skype : offre VoIP très connu du grand public. Son architecture est basée sur un protocole propriétaire (ce qui explique en partie sa perte de popularité ces derniers mois, nous y reviendrons) et permet à tout utilisateur d'appeler gratuitement un autre abonné. En ce point il ne s'agit "que" de l'évolution des Messageries Instantanées (IM) telles qu'MSN ou ICQ qui proposaient déjà ce genre de service. Là où Skype a innové c'est en se positionnant comme Fournisseur d'Accès Virtuel offrant ainsi une passerelle vers le monde de la téléphonie classique à ses abonnés.

Ces deux offres sont totalement différentes, de par les technologies utilisées ou par les clients ciblés et illustrent bien la diversité du monde VoIP.

3. Convergence

De façon générale, les technologies tendent à se mélanger (pensez à Skype qui se positionne comme "passerelle" entre le monde de la téléphonie classique et virtuelle), à s'imbriquer pour proposer toujours plus de services, ce phénomène est appelé "convergence des données".

La convergence des données est ce phénomène inter-technologique qui tend à rassembler au sein d'une technologie globale les fonctionnalités fournies par plusieurs auparavant. Du côté hardware, cela est parfaitement illustré avec les "smartphones" (ou "superphones") permettant de téléphoner via le réseau GSM, envoyer du contenu multimédia via le réseau mobile (UMTS, EDGE, MMS..) ou via IP (WiFi, 3G, http, ftp..). Ainsi, les technologies se retrouvent embarquées et mélangées sur certain terminaux tel que l'iPhone pour ne citer que le plus populaire.

La tendance est clairement à la convergence. Mais quels sont les différents courants de cette convergence?
Il y'a d'un côté les acteurs de l'informatique tels que Google, Microsoft ou Betamax.
De l'autre côté se trouvent les opérateurs "traditionnels" tels que AT&T, Free ou Belgacom par exemple.
Il s'agit de trouver un équilibre entre les possibilités offertes par les uns et les autres, il s'agit aussi d'une guerre économique car là où Google Voice propose de passer par IP pour communiquer, même sur votre portable, il y'a un manque à gagner pour l'opérateur qui héberge la communication sans pouvoir la facturer à son tarif habituel. C'est exactement là que la VoIP prend tout son intérêt et à la fois c'est exactement là que "ça coince". C'est d'ailleurs pour cette raison, qu'actuellement de telles technologies sont massivement bridées sur les réseaux sans-fils. A leur décharge, les opérateurs craignent à juste titre une saturation de leurs lignes: les capacités disponibles étant irrémédiablement rattrapées par les utilisations nouvelles et gourmandes en bande passante proposées chaque jour.
Cependant, si les acteurs du marché informatique tendent à se rapprocher de la téléphonie les opérateurs dit classiques ont aussi emboité le pas.
En France, les offres double ou triple channel sont devenues la norme, faisant passer la voix sur une connexion ADSL fournie par un même opérateur offrant ainsi data & voix dans une même offre.
Il s'agit d'une petite révolution qui s'est mise en place depuis une décénie, non sans heurts9.
La Belgique n'est pas en reste avec les offres de VOO10, Scarlet11 ou récemment Billi12par exemple mais souffre du monopole de Belgacom.

Ainsi, on le voit, que ça soit du côté des particuliers ou des entreprises, la convergence est le mot d'ordre.

4.Les architectures et protocoles13,14

La convergence visée passera donc par une entente entre les acteurs historiques du réseau (téléphonie classique et gsm) et les nouveaux prétendants souvent plus portés sur le logiciel (Google, Microsoft, Skype..) tant au niveau commercial qu'au niveau des technologies utilisées.

4.1 Instituts de normalisation

Dans le cycle d'évolution des technologies VoIP, le rôle des instituts de normalisation est capital car il permet de standardiser certaines technologies afin de permettre leur diffusion à large échelle.
En effet, imaginez qu'il existe autant de protocoles que d'offres : comment choisir? comment appeler un tiers qui a souscrit à une autre offre que la votre?
Les organismes de normalisation tendent à apporter une uniformisation des moyens logiciels et matériels de communiquer15. Voici une liste succincte de ces organismes :

4.1.a International Telecommunication Union (ITU)

L’Union internationale des télécommunications (UIT, ou en anglais International Telecommunication Union ou ITU) est la plus ancienne organisation internationale technique de coordination, puisqu'elle a été créée sous le nom d’Union internationale du télégraphe en 1865. Le développement du téléphone aidant, elle adopte son nom actuel en 1932 et se voit rattachée directement aux Nations unies en 1947. L'UIT, au sein de laquelle les États et le secteur privé se coordonnent, est chargée de la réglementation et de la planification des télécommunications dans le monde, elle établit les normes de ce secteur et diffuse toutes les informations techniques nécessaires pour permettre l'exploitation des services mondiaux de télécommunications. Dans ce cadre, elle gère aussi l'attribution des bandes de fréquences radioélectriques pour la communication hertzienne16.
On lui doit notamment :
G.729 : Codec audio à 8Kbps. Utilisé pour le codage de la partie audio d'une visioconférence, rencontré aussi pour transporter de la voix sur IP sur les WAN et utilisé préférenciellement par les fournisseurs téléphoniques.
H.323 : Systèmes de communication multimédia en mode paquet17
T.38 : Procédures de communication de télécopie du Groupe 3 en temps réel sur les réseaux à protocole Internet

Tous ces protocoles sont massivement utilisés depuis plusieurs années.

4.1.b The Internet Engineering Task Force (IETF)

L'IETF est un groupe informel, sans statut, sans membre, sans adhésion. Le travail technique est accompli dans une centaine de groupes de travail. En fait, un groupe est généralement constitué d'une liste de courrier électronique. L'IETF tient trois réunions par année.Les groupes de travail sont répartis dans une dizaine de domaines d'intérêt, chaque domaine ayant un ou deux directeurs.
L'IETF est responsable de la plupart des protocoles Internet dans les couches 3 à 4 (TCP/IP). Également active dans la couche 7.
Fait amusant : L'IETF n'existe pas, aucune personne morale ne porte ce nom. L'IETF est une étiquette, posée sur une activité de l'ISOC.. L'IETF travaille par RTC ("Request For Comments"). Distribués librement et redistribuables, ils sont un des principaux facteurs du succès de TCP/IP. Les RFC ont un statut, "chemin des normes" mais aussi "pour information", "expérimental", etc.
Sur le chemin des normes, il y a trois étapes : proposition, projet et norme. L'avancement n'est pas automatique et dépend du travail de volontaires intéressés. Les RFC sont écrits (pour la plupart) par l'IETF mais publiés par le RFC editor.18
En ce qui nous concerne, c'est le travail autour du protocole SIP qui nous intéresse.

4.1.c European Telecommunications Standards Institute (ETSI)

L’European Telecommunications Standards Institute (ETSI), c'est-à-dire l'Institut européen des normes de télécommunication, est l'organisme de normalisation européen du domaine des télécommunications. L'ETSI est une organisation à but non lucratif dont le rôle est de produire des normes de télécommunications pour le présent et le futur.
On lui doit notamment la norme DECT (le téléphone sans fil numérique), le GSM (le célèbre système de téléphonie cellulaire) out la norme UMTS (la téléphonie cellulaire haut-débit).

4.1.d Plus indirectement l'Institute of Electrical and Electronics Engineers (IEEE)

L’Institute of Electrical and Electronics Engineers ou IEEE (que l’on peut prononcer « i trois e ») est une organisation à but non lucratif. L’IEEE compte plus de 325 000 membres, et possède différentes branches dans plusieurs parties du monde. L’IEEE est constituée d’ingénieurs électriciens, d’informaticiens, de professionnels du domaine des télécommunications, etc. L’organisation a pour but de promouvoir la connaissance dans le domaine de l’ingénierie électrique. Les normes sans-fil 802.xx sont le fruit du travail de l'IEEE.

4.2 Protocoles

4.2.0 Petite introduction

A chaque besoin son protocole, c'est en général la règle qui s'applique à tous les protocoles
Les fournisseurs ADSL français utilisent en règle générale le protocole MGCP qui est un protocole asymétrique (le serveur contrôle le téléphone de l'abonné), alors que les logiciels de Voix sur IP utilisent en général SIP qui est un protocole symétrique. Historiquement le protocole H.323 ayant été développé et adopté massivement en premier lieu, il reste très présent mais sur le déclin.
Ainsi on peut grossièrement identifier certains acteurs historiques se lançant dans l'aventure VoIP au moyen de protocoles plus anciens (H323) et les nouveaux arrivés utilisant les derniers protocoles (SIP par exemple).

4.2.a Protocole de signalisation

Le concept de protocole de signalisation va être utilisé dans les chapitres suivants, voici donc une petite explication préliminaire :
La signalisation désigne la transmission d'un ensemble de signaux et d'informations de contrôle échangés entre les intervenants d'une communication. Ces intervenants peuvent être des entités en bout de liaison (terminaux) ou des entités intermédiaire de contrôle et de gestion de communications. Leurs échanges permettent l'initiation, la négociation, l'établissement, le maintien et la fermeture de la connexion.
Il convient de distinguer deux types de transferts pour comprendre à quoi correspond la signalisation :
- Le transfert de données brutes.
- Le transfert d'informations de contrôle.

Le transfert de données brutes concerne les échanges de données binaires d'un poste vers un autre. L'objectif de ce transfert est de reproduire à l'identique des données en les faisant transiter par un réseau. Par exemple, deux correspondants peuvent s'échanger un fichier audio MP3 ou des images jpeg. De la même façon, si on considère une conversation téléphonique en cours, les intervenants produisent des sons qui doivent être recomposés et diffusés chez leurs correspondants.
Dans tous les cas, seul l'envoi des données à de l'importance, ce qui relève d'un transport d'informations.
Le transfert d'informations de contrôle concerne les échanges de type protocolaires exécutant une action prédéfinie, et donc nécessairement limitée en possibilités. L'objectif de ce transfert est d'assurer la maitrise et la gestion du flux.
Dans le cas typique d'une application de téléphonie, lorsqu'une personne en appelle une autre, elle n'a initialement pas de "données" à lui transmettre, mais veut simplement être mise en relation avec son correspondant. Cette mise en relation nécessite d'abord de localiser l'appelé, puis de faire sonner son poste afin de lui signaler l'appel. Pour la localisation comme pour l'avertissement d'appel, on parle de signalisation.

13184885.jpg

De la même manière, lorsque la sonnerie d'appel retentit dans le terminal appelé, l'appelant en est immédiatement informé par une tonalité particulière sur son terminal téléphonique. Il s'agit là aussi d'une information de signalisation.
Si un correspondant ne répond pas à un appel, il est probable que sa messagerie téléphonique va s'enclencher. Cette redirection d'appel du poste appelé vers sa messagerie est également une information de signalisation. Elle ne transporte aucune information de données brute, mais vise à signaliser à l'appelant que l'appelé n'est pas disponible et que sa messagerie est opérationnelle.

Ces deux catégories de transfert sont liées : ce n'est que lorsque l'appelé a répondu à l'appel que commence le transfert d'information brutes, c'est-à-dire le transport de la voix, qui doit être fidèlement retransmise d'un correspondant à l'autre. La signalisation n'est que l'étape préalable qui a mis en place la connexion entre les différents utilisateurs pour permettre la communication.

Dans le modèle OSI, la signalisation téléphonique correspond à une fonctionnalité de niveau 7 (applicatif). Elle n'est donc jamais assurée par des entités réseau de routage pur, comme les routeurs ou switchs, qui fonctionnent à des couches inférieures. Des entités dédiées sont exploitées à ces fins : il s'agit de serveurs au niveau du cœur du réseau et des terminaux (téléphone, ordinateur ou PDA par exemple) en bordure de réseau, au niveau de l'utilisateur.

Pour être comprise et correctement interprétée de l'ensemble des entités participant aux mécanismes de signalisation, celle-ci doit respecter une syntaxe particulière. C'est tout l'objet de la spécification d'un protocole de signalisation.

4.2.b H323

Le protocole H.323 figure parmi les plus réputés des protocoles de signalisation pour la téléphonie sur IP. H.323 n'est en réalité que la référence du protocole. Son nom complet est Packet-based Multimedia Communications Systems. Comme son nom l'indique, il peut être utilisé pour tous les réseaux à commutation de paquets, en particulier IP.
Ce protocole est spécifié pour le traitement de la signalisation des données multimédia avec de fortes contraintes temporelles, comme la voix ou la vidéo, mais aussi la réalité virtuelle ou les jeux en réseau.

Avec H.323, l'UIT a spécifié un environnement complet de protocoles de communication multimédias pour les réseaux IP. L'interfonctionnement avec les autres réseaux est garanti car des standards apparentés ont été conçus: H.320 pour le RNIS et H.324 pour le réseau téléphonique analogique. H.323 est supporté par la quasi-totalité des constructeurs. Il a, pour cette raison, été très largement utilisé comme protocole d'interfonctionnement.

62687549.jpg

schéma simple

h323.jpg

schéma temporel d'un appel H.32319

4.2.c SIP (Session Initiation Protocol)

SIP est un protocole normalisé et standardisé par l'IETF (décrit par le RFC 3261 qui rend obsolète le RFC 2543, et est complété par le RFC 3265) qui a été conçu pour établir, modifier et terminer des sessions multimédia. L'échange des messages de signalisation et de contrôle du protocole SIP est effectué sous la forme de transactions. Il est apparenté au protocole HTTP. Une transaction est composée d'une requête et d'une réponse. Les requêtes sont toujours émises par un client et les réponses par un serveur. Cette même structure client-serveur va se retrouver dans les terminaux, le serveur d'enregistrement, le proxy et le serveur de re-direction.
SIP se charge de l'authentification et de la localisation des multiples participants. SIP ne transporte pas les données échangées durant la session comme la voix ou la vidéo. SIP étant indépendant de la transmission des données, tout type de données et de protocoles peut être utilisé pour cet échange. Cependant le protocole RTP (Real-time Transport Protocol) assure le plus souvent les sessions audio et vidéo.

La demande d'établissement contient les adresses de destination et de source en format SIP, de même que les paramètres c et m.
Le paramètre c définit les coordonnées pour le flux audio qui sera émis vers l'usager Frey. Ce flux sera transmis au moyen du protocole IP version x, vers l'adresse IP xxx.xxx.xxx.xxx.
Le paramètre m indique qu'il s'agit d'un flux audio qui utilisera le port UDP xxxxx et le protocole RTP. Il requiert l'algorithme de codage audio G.72x.x.

testzj.jpg20

4.2.d IAX

4.2.e STUN, MGCP21

4.2.f T.38

t38foip.jpg

T38 est un protocole qui décrit comment envoyer un fax à partir d’un réseau de données informatiques. T38 est indispensable car les données de fax ne peuvent pas être envoyées un réseau de données informatiques de la même façon que la communication vocale. Voir Fonctionnement d’un fax dans un environnement VoIP pour en savoir plus à ce sujet.

T38 est décrit dans le RFC 3362, et défini la façon dont un appareil doit communiquer les données de fax. Dans l’image ci-dessus, la passerelle et la télécopieuse derrière la passerelle doivent être compatibles avec T38. En ce qui concerne le fax sur une ligne analogue, ce procédé sera transparent. La télécopieuse analogue n’a pas besoin de connaître le T38.

4.2.g MGCP

Enfin, MGCP (Media Gateway Control Protocol) couvre les couches 3 et 4 du modèle OSI. Il utilise les protocoles UDP, IPSec et IP. SIP et MGCP, plus récents, commencent à gagner des parts de marché face à H.323 en raison de leur simplicité.

Bibliography
1. "Téléphonie sur IP" par L. Ouakil & G. Pujolle, Editions EYROLLES.
Ajouter un nouveau commentaire
ou S'identifier comme utilisateur Wikidot
(ne sera pas publiée)
- +
Sauf mention contraire, le contenu de cette page est protégé par la licence Creative Commons Attribution-ShareAlike 3.0 License