Dedicatoria
A DIOS TODOPODEROSO: Por ser mi creador, el motor de mi vida, por no haber dejado que me rinda en ningún momento e iluminarme para salir adelante, porque todo lo que tengo, lo que puedo y lo que recibo es regalo que él me ha dado.
A MI MAMA: Por su apoyo todos estos años, por su infinito amor y comprensión y por ayudarme a que este momento llegara.
A ROY: Gracias por enseñarme a creer en mí y motivarme a hacer las cosas de la mejor manera.
Agradecimientos
AL CONSEJO NACIONAL DE CIENCIA Y TECNOLOGÍA (CONICIT): Por su apoyo en estos años, para lograr finalizar la meta propuesta.
AL ING. JULIO STRADI GRANADOS M.Sc.: Por tenerlo como Tutor y por su interés en la consecución de esta tesis.
AL ING. RANDALL ARCE ARAYA Mg: Por su apoyo y confianza en mi trabajo y su capacidad para guiar mis ideas, han sido un aporte invaluable en el desarrollo de esta tesis.
AL ING. GUILLERMO RIVERO GONZÁLEZM.Sc.: Por su interés en la consecución de esta tesis.
“Este trabajo final de investigación aplicada fue aceptado por la Comisión del Programa de Estudios de Posgrado en Ingeniería Eléctrica de la Universidad de Costa Rica, como requisito parcial para optar al grado y título de Maestría Profesional en Ingeniería Eléctrica con Énfasis en
Comunicaciones Digitales”
__________________________ Magister Gabriel Víquez Jiménez
Representante de la Decana Sistema de Estudios de Posgrado
__________________________ M.Sc. Julio Stradi Granados
Profesor Guía
__________________________ Magister Randall Arce Araya
Lector
__________________________ M.Sc. Guillermo Rivero González
Lector
_________________________ Dr. Geovanni Martínez Castillo
Director del Programa de Posgrado en Ingeniería Eléctrica
________________________ Blanca Isabel Castro Blanco
Índice General
Dedicatoria...ii
Agradecimientos...ii
Índice General...iv
Resumen...vii
Índice de tablas...viii
Índice de ilustraciones y figuras...ix
Lista de abreviaturas...xi
CAPITULO 1. Introducción...1
1.1 Objetivos...4
1.1.1 Objetivo general...4
1.1.2 Objetivos específicos...4
1.2 Metodología...4
CAPITULO 2. MARCO TEÓRICO...6
2.1 La estructura de la Red de conmutación de circuitos...6
2.2 La estructura de la Red de conmutación de paquetes...9
2.3 ¿Por qué se hace necesario una migración hacia el protocolo IP?...11
2.4 Estructura de la Red de Nueva Generación...14
2.4.1 ¿Cómo se integra una estructura NGN en un ambiente telefónico clásico?...15
CAPITULO 3. Fundamentos de VoIP...17
3.1 Introducción a VoIP...17
3.2 Introducción a los protocolos de VoIP...18
3.2.1 H.323...21
3.2.2 SIP...24
3.2.2.1 Protocolos asociados a SIP...27
3.2.2.1.1 RTP Comprimido...28
3.2.2.1.2 RTCP...28
3.2.2.1.3 SDP...29
3.2.2.2 Direccionamiento en SIP...30
3.3.1 Muestreo y Cuantización...32
3.3.2 Codificación...34
3.3.3 Compresión...35
3.3.4 Códec...37
3.4 Elementos de VoIP...39
3.4.1 Elementos de una red SIP...39
3.4.1.1 Agente de usuario...39
3.4.1.2 Servidores SIP...39
3.4.2 Elementos de una red H.323...41
3.4.2.1 Terminales...41
3.4.2.2 Gatekeeper...42
3.4.2.3 Gateway...42
3.5 Calidad de Servicio...42
3.5.2 Jitter...44
3.5.3 Latencia...45
3.5.4 Pérdida de Paquetes...45
3.5.5 Eco...46
CAPITULO 4. Estrategia De Migración...48
4.1 Impacto Tecnológico de la Migración...48
4.1.1 Impacto en la Regulación...49
4.1.2 Cambios competitivos...49
4.1.3 Propuesta de Regulación para los servicios de VoIP en Costa Rica...50
4.2 Propuesta de Estrategia de Migración...53
4.2.1 Principales indicadores a tener en cuenta en el diseño de una red VoIP...53
4.2.1.1 Indicadores Cualitativos...53
4.2.1.2 Indicadores Cuantitativos...53
4.2.2 Escenarios más favorables para realizar esta migración...54
4.2.2.1 Caso 1: Proveedores de Servicios...54
4.2.2.1.1 Uso de Softswitch...54
4.2.2.1.2 Uso de MPLS...57
4.2.2.2 Caso 2: Empresa...58
4.2.3 Escenario recomendado...59
4.2.3.1 Caso 1: Proveedor de Servicios. Uso de Softswitch...59
4.2.3.2 Caso 2: Empresa. Uso de Asterisk...60
4.2.3.2.1 Arquitectura de Asterisk...61
4.2.3.2.2 Concepto de Canales en Asterisk...62
4.2.3.2.3 Escenarios de uso de Asterisk...63
4.2.4 Ejemplo de desarrollo de implementación de voz sobre IP para una empresa...63
4.2.4.1 Instalación de Asterisk...64
4.2.4.2 Instalación de X-Lite...71
4.3 Evaluación de Desempeño y Mejoras...77
CAPITULO 5. Conclusiones...80
Bibliografía...83
Apéndice o anexos...85
Anexo # 1...85
Resumen
Uno de los principales medios de comunicación electrónicos con que contamos en la actualidad
es sin duda la telefonía. Desde finales de los años de 1800, cuando se inventó el teléfono, hasta
la actualidad, se han venido desarrollando mejoras en la tecnología y en la reglamentación de los
servicios de telefonía.
Así también, con la expansión de internet en casi la mayor parte del mundo, los usuarios finales
exigen cada vez soluciones más integradas de comunicación, tanto de voz, vídeo y datos.
La tecnología basada en voz sobre IP ha venido desarrollándose desde mediados de los años 90’s
con la finalidad de reducir los altos costos que implica la comunicación sobre todo de larga
distancia. En la actualidad, crece con fuerza la telefonía IP en países como España y Estados
Unidos, y se espera que en un futuro cercano se pueda difundir por el resto del mundo.
Lo que se busca en la presente investigación es mostrar las tecnologías existentes en la
implementación de redes de voz sobre IP, para así poder realizar una elección adecuada de
equipos y protocolos de comunicación de acuerdo a la necesidad que se tiene en este caso, que es
la implementación del servicio de voz sobre IP por los operadores de las redes de
Índice de tablas
Tabla 1. Relación Costo-Beneficio VoIP vr. Telefonía Tradicional...14
Tabla 2. Clasificación de Protocolos de VoIP...21
Tabla 3. Consumo de ancho de banda de los Códecs más usados...38
Índice de ilustraciones y figuras
Ilustración 1. Voz sobre IP...2
Ilustración 2. Estimación del número de abonados VoIP en todo el mundo. 2005 - 2011...3
Ilustración 3. Distribución de abonados VoIP en todo el mundo a Marzo 2009...3
Ilustración 4. Red de conmutación de circuitos...7
Ilustración 5. Red de conmutación de paquetes...10
Ilustración 6. Arquitectura NGN Tradicional...16
Ilustración 7. Algunos de los protocolos de VoIP más importantes...18
Ilustración 8. Protocolos de VoIP...19
Ilustración 9. Pila de Protocolos asociados a H.323...22
Ilustración 10. Ejemplo del flujo de llamadas para H.323...23
Ilustración 11. Ejemplo de mensajes H.245...24
Ilustración 12. Pila de Protocolos SIP...25
Ilustración 13. Ejemplo del flujo de llamadas para SIP...26
Ilustración 14. Pila de protocolos RTP...27
Ilustración 15. Comparativa RTP/cRTP...29
Ilustración 16. Modulación en amplitud del pulso...33
Ilustración 17. Reconstrucción de una señal continúa desde su señal discreta...34
Ilustración 18. Ejemplo de Codificación...35
Ilustración 19. Componentes de H.323...41
Ilustración 20. Problemas de la Calidad de Servicio...43
Ilustración 21. Jitter...44
Ilustración 22. Situación Reglamentaria del VoIP en América Latina y el Caribe...51
Ilustración 23. Arquitectura de la NGN...56
Ilustración 24. Arquitectura abierta para VoIP...58
Ilustración 25. Subsistemas de Asterisk...61
Ilustración 26. Pantalla de instalación para AsteriskNOW...64
Ilustración 27. Contraseña de Administrador...65
Ilustración 28. Final de instalación de AsteriskNOW....65
Ilustración 29. Login...66
Ilustración 31. Parámetros de configuración de Red...67
Ilustración 32. Configuración de parámetros de red...67
Ilustración 33. Dirección de Red...68
Ilustración 34. Pantalla de Bienvenida AsteriskNOW...69
Ilustración 35. Pantalla para ingreso de extensiones...70
Ilustración 36. Ventana principal de X-Lite...71
Ilustración 37. Cuentas SIP instaladas...72
Ilustración 38. Configurando X-Lite...72
Ilustración 39. X-Lite ya autenticado en la red...73
Ilustración 40. Comando de inicio para documentar la llamada...73
Ilustración 41. Administración de usuarios...74
Lista de abreviaturas
ACK: Acuse de Recibo
ADPCM: Adaptive Differential Pulse Code Modulation ADSL: Asymmetric Digital Subscriber Line
API: Interfaz de programación de aplicaciones
ARQ: Admission Request
ATM: Modo de transferencia asíncrona
A/D: Analógico/Digital
cRTP: Real-time Transport Protocol comprimido
CoS: Calidad de Servicio
FDM: Acceso Múltiple por División de Frecuencia
GUI: Graphical User Interface
HTTP: Protocolo de Transferencia de Hipertexto IETF: Internet Engineering Task Force
ITU: International Telecommunication Union
ITU-T: International Telecommunication Union – Telecommunication Standardization Sector.
IP: Protocolo de Internet
LAN: Red de área local
LDP: Label Distribution Protocol LSR: Label Switching Routers
MAC: Control de Acceso de Medios
MCU: Unidad de Control Multipunto
MG: Media Gateway
MGC: Media Gateway Controller
MGCP: Media Gateway Control Protocol.
MIME: Extensiones Multipropósito de Correo de Internet MPLS: Multiprotocol Label Switching
NGN: Red de Nueva Generación
PAM: Modulación por Amplitud de Pulsos
PBX: Private Branch Exchange
PC: Personal Computer
POTS: Plain Old Telephone System
PSTN: Red Telefónica Básica ó Red Telefónica Conmutada
QoS: Calidad de Servicio
RAS: Registration, Admission, Status
RDSI: Red Digital de Servicios Integrados (en inglés ISDN)
RFC: Request For Comments
RRQ: Registration Request
RTCP: Real-time Transport Control Protocol RTP: Real-time Transport Protocol
RTSP: Real-time Streaming Protocol SAP: Service Advertisement Protocol SDP: Session Description Protocol
SG: Signaling Gateway
SIPS: Session Initiation Protocol Secure TCP: Protocolo de Control de Transmisión TDM: Multiplexación por División de Tiempo
TIC: Tecnologías de la Información y la Comunicación
TLS: Transport Layer Security
UA: User Agent
UAC: User Agent Client
UAS: User Agent Server
UDP: User Datagram Protocol
URI: Uniform Resource Identifier
URL: Uniform Resource Locator
UUIE: User to User Information Element VLAN: Red de Área Local Virtual
VoIP: Voz sobre IP (del inglés Voice over IP)
CAPITULO 1. Introducción
Voz Sobre IP relaciona la transmisión de voz y la de datos. Se trata de transportar la voz,
previamente convertida a datos, entre dos puntos distantes. Esto posibilita utilizar las redes de
datos para efectuar las llamadas telefónicas, y desarrollar una única red que se encargue de
cursar todo tipo de comunicación, ya sea vocal o de datos. Es evidente que el hecho de tener una
red en vez de dos, es beneficioso para cualquier proveedor de servicios de telecomunicaciones
que ofrezca ambos servicios.
El crecimiento y fuerte implantación de las redes IP, el desarrollo de técnicas avanzadas de
digitalización de voz, mecanismos de control y priorización de tráfico, protocolos de transmisión
en tiempo real, así como el estudio de nuevos estándares que permitan la calidad de servicio en
redes IP, han creado un medio donde es posible transmitir telefonía sobre IP lo que no
significará en modo alguno la no habilitación de las redes telefónicas modo circuito, sino que
habrá, al menos temporalmente, una fase de coexistencia entre ambas.
Como tecnología, la Voz sobre IP lleva varios años de presencia en el mercado. Sin embargo, no
ha sido hasta el surgimiento de nuevos e innovadores servicios basados en esta tecnología que la
integración de datos y voz se ha hecho realidad, lo que, para las empresas, ha significado un
Ilustración 1. Voz sobre IP
Estimar el número total de abonados a VoIP es difícil por varios motivos1. Las diversas
definiciones utilizadas hacen que los países comuniquen diferentes cifras y, además, es difícil
estimar el número de usuarios de computadora a computadora, o puro VoIP, incluidos los que
emplean servicios tales como Skype, o que utiliza el VoIP incorporado en juegos en línea.
Así pues, las estimaciones del número total de abonados a VoIP en Estados Unidos para el año
2010, se calcula entre 12 y 44 millones de usuarios VoIP residenciales.
En lo que respecta al número total de abonados VoIP en todo el mundo, Infonetics Research
(EE.UU.) estima que a finales de 2008 había unos 80 millones. Point Topic, (Reino Unido)
calcula que había 92,2 millones en el primer trimestre de 2009, mientras que IDATE (Francia)
proyectaba 175 millones de usuarios VoIP en 2009, lo que equivale a 10 % del número total de
abonados a líneas fijas, y más de 200 millones en 2012.
1Revista Actualidades de la UIT. Artículo: “El protocolo de transmisión de voz por Internet (VoIP) llega a
Ilustración 2. Estimación del número de abonados VoIP en todo el mundo. 2005 - 2011.
Fuente: Unión Internacional de Telecomunicaciones
Según Point Topic, Europa occidental representaba la mayoría (38 %) de todos los abonados a
VoIP en marzo de 2009. Norteamérica y la Región Asía-Pacífico son los siguientes mercados
más grandes. El sureste Asiático, Latinoamérica y Europa oriental representan una parte
relativamente pequeña del mercado, pero están creciendo muy rápidamente. TeleGeography
Research (Estados Unidos) proyectó que el tráfico VoIP internacional alcanzaría 94 800
millones de minutos en 2008 y representaría aproximadamente la cuarta parte del tráfico
internacional mundial en ese año.
Ilustración 3. Distribución de abonados VoIP en todo el mundo a Marzo 2009.
Entre tanto, la popularidad de VoIP como negocio sigue aumentando. AMI Research (Estados
Unidos), proyecta que los ingresos globales generados por las centralitas privadas IP (IP PBX),
las pasarelas VoIP, los conmutadores informáticos, los servicios de aplicación VoIP y los
teléfonos y adaptadores IP alcanzan los US$ 9 700 millones en 2010.
1.1 Objetivos
1.1.1 Objetivo general
Determinación del proceso de migración de las redes de conmutación de circuitos al protocolo
IP en Costa Rica.
1.1.2 Objetivos específicos
Determinar el impacto tecnológico de esta migración.
Plantear al menos dos de los escenarios favorables para realizar esta migración.
Establecer un escenario recomendado.
1.2 Metodología
Para desarrollar el proyecto se estudiará la tecnología de Voz sobre IP, definiendo sus
principales bases teóricas y técnicas, además de sus características de operación.
En la realización de este proyecto se utilizará material bibliográfico de Internet, entrevistas a
expertos en el tema, además de consultas en libros sobre dicha problemática.
En lo que respecta a la información de la web, esta será obtenida de diferentes portales,
A modo de ejemplo, se puede citar al portal www.enter.es y el www.idate.org, en el cual existe
una gran variedad de documentación dedicada al análisis de las empresas de telecomunicaciones.
Se visitaran también foros y blogs como: http://convergence.blogs.ie.edu/, en los cuales se
CAPITULO 2. MARCO TEÓRICO
Tradicionalmente se han venido utilizando dos tipos distintos de redes para ofrecer servicios de
voz o de datos:
1. Por un lado, se han empleado redes basadas en tecnología de conmutación de circuitos,
especialmente diseñadas para dar soporte a los servicios de tiempo real, como la telefonía
tradicional, puesto que era la única capaz de satisfacer los estrictos requisitos impuestos por
este tipo de servicios, sobre todo en lo que a retardos se refiere.
2. Por otro, las aplicaciones de datos se adaptan mucho mejor a las características de las redes
de conmutación de paquetes, que además garantizan la utilización de los recursos de manera
más eficiente.
2.1 La estructura de la Red de conmutación de circuitos2
La conmutación de circuitos se utiliza en redes de telefonía pública. La técnica de conmutación
se desarrolló para tráfico de voz aunque también puede gestionar tráfico de datos de forma no
muy eficiente. En la conmutación de circuitos se establece un canal de comunicaciones dedicado
entre dos estaciones, en donde, se reservan recursos de transmisión y de conmutación de la red
para su uso exclusivo en el circuito durante la conexión. La transmisión es transparente, ya que,
una vez establecida la conexión parece como si los dispositivos estuvieran directamente
conectados.
Las comunicaciones mediante conmutación de circuitos implican la existencia de un canal de
comunicación dedicado entre dos estaciones, que es una secuencia de enlaces conectados entre
nodos de la red. En cada uno de los enlaces físicos se dedica un canal lógico para cada conexión
establecida.
Hay dos tipos básicos de redes de conmutación de circuitos: analógicas y digitales. Las
analógicas fueron diseñadas para la transmisión de voz. Durante muchos años, la PSTN era solo
analógica, pero hoy en día, las redes basadas en circuitos, como la PSTN, han pasado de ser
analógicas a digitales. Para que la señal analógica de transmisión de voz sea compatible con una
red digital, se debe codificar la señal de transmisión analógica o convertirla a formato digital
antes de entrar en una WAN de telefonía. En el extremo de recepción de la conexión, la señal
digital se debe descodificar o volver a convertir en formato de señal analógica.
Ilustración 4. Red de conmutación de circuitos
La conmutación de circuitos implica tres fases:
1. Establecimiento del circuito: el emisor solicita a un cierto nodo el establecimiento de
conexión hacia una estación receptora. Este nodo es el encargado de dedicar uno de sus
canales lógicos a la estación emisora (suele existir de antemano). Este nodo es el
encargado de encontrar los nodos intermedios para llegar a la estación receptora, y para
2. Transferencia de datos: una vez establecido el circuito exclusivo para esta transmisión
(cada nodo reserva un canal para esta transmisión), la estación transmite desde el emisor
hasta el receptor conmutando sin demoras de nodo en nodo (ya que estos nodos tienen
reservado un canal lógico para ella).
3. Desconexión del circuito: una vez terminada la transferencia, el emisor o el receptor
indican a su nodo más inmediato que ha finalizado la conexión, y este nodo informa al
siguiente de este hecho y luego libera el canal dedicado. así de nodo en nodo hasta que
todos han liberado este canal dedicado.
Una red pública de telecomunicaciones se puede describir a través de los cuatro componentes
que forman su arquitectura:
1. Abonados: son las estaciones de la red.
2. Bucle local: es la conexión del abonado a la red. Esta conexión, como es de corta
distancia, se suele hacer con un par de hilos de cobre trenzado.
3. Centrales: son aquellos nodos a los que se conectan los abonados (centrales finales) o
nodos intermedios entre nodo y nodo (centrales intermedias).
4. Líneas principales: son las líneas que conectan nodo a nodo. Se suele usar
multiplexación por división en frecuencias o por división en el tiempo.
2.2 La estructura de la Red de conmutación de paquetes3
La conmutación de paquetes es una técnica que divide un mensaje de datos en unidades más
pequeñas llamadas paquetes. Éstos se envían a su destino siguiendo la mejor ruta disponible, y
se reensamblan en el extremo de recepción.
En las redes de conmutación de paquetes, como es Internet, los paquetes se enrutan a su destino
por el trayecto más adecuado, pero no todos los paquetes que viajan entre dos “host” siguen la
misma ruta, ni siquiera los que pertenecen a un mismo mensaje. Esto prácticamente garantiza
que los paquetes llegarán en diferentes momentos y desordenados.
En una red de conmutación de paquetes, los paquetes (mensajes o fragmentos de mensajes) se
enrutan individualmente entre los nodos en vínculos de datos que pueden estar compartidos por
otros nodos. En la conmutación de paquetes, a diferencia de la conmutación de circuitos, las
diferentes conexiones con nodos de la red comparten el ancho de banda disponible.
Las redes de conmutación de paquetes tienen su razón de ser en permitir la comunicación de
datos mediante Internet en todo el mundo. Una red de datos pública o una red de conmutación de
paquetes es el equivalente de datos de la PSTN.
También se pueden encontrar redes de conmutación de paquetes en entornos de redes LAN o
WAN.
Ilustración 5. Red de conmutación de paquetes
Un entorno WAN de conmutación de paquetes depende de circuitos telefónicos, pero éstos están
entorno LAN de conmutación de paquetes, como una red Ethernet, la transmisión de los
paquetes de datos depende de la conmutación de los paquetes, los enrutadores y los cables de la
LAN. En una LAN, la conmutación establece una conexión entre dos segmentos sólo durante el
tiempo suficiente para enviar el paquete. Los paquetes entrantes se guardan en un área de
memoria temporal o un búfer de la memoria. En una LAN basada en Ethernet, un marco de
Ethernet contiene la carga o la porción de datos del paquete y un encabezado especial que
incluye la información de dirección de control de acceso de medios del origen y el destino del
paquete. Cuando los paquetes llegan a su destino, un ensamblador de paquetes los vuelve a
ordenar. El ensamblador de paquetes es necesario por las diferentes rutas que pueden seguir los
paquetes.
Las redes de conmutación de paquetes han hecho posible que exista Internet y, al mismo tiempo,
ha hecho que las redes de datos, especialmente las redes IP basadas en LAN, estén más
disponibles de forma más generalizada.
2.3 ¿Por qué se hace necesario una migración hacia el protocolo IP?
La red telefónica funciona con base en la conmutación de circuitos. Esto quiere decir que cuando
dos usuarios de la red hablan por teléfono, la red reserva un circuito por donde pasa el flujo de
datos intercambiado por estos usuarios.
Las ventajas de este sistema son varias;
1. El ancho de banda se reserva al establecerse la llamada, y no se comparte con ninguna
otra aplicación,
2. Los datos intercambiados recorren siempre la misma ruta para llegar a destino. Esto
asegura que los datos llegan siempre en el mismo orden en que fueron enviados, y que el
Las desventajas de la conmutación de circuitos son justamente consecuencia de las ventajas:
1. La red asigna un ancho de banda fijo para toda la duración de la llamada,
independientemente del uso que se le esté dando,
2. Al utilizar rutas estáticas el funcionamiento de la red no se adapta a cambios como
sobrecargas en algunas rutas o nodos, o fallas en algún componente de la red.
Las redes de datos IP, por otra parte, y en particular Internet, funcionan con base en la
conmutación de paquetes. Es decir que para realizar el intercambio de información entre dos o
más nodos, los datos se dividen en paquetes, y cada uno de estos se envía por separado a la red.
No se realiza ninguna conexión entre los nodos, no se reservan recursos ni se eligen rutas por
anticipado. En una misma transmisión de datos entre dos usuarios, cada paquete puede tomar
una ruta distinta para llegar al destino.
Las ventajas de este esquema, para una red que intercambia datos, son:
1. Se optimiza el aprovechamiento de los recursos, al utilizarse solamente cuando son
necesarios,
2. La red se adapta rápidamente a los cambios, eligiendo para cada paquete la mejor ruta en
ese momento,
3. La arquitectura IP emplea redes de servidores y enrutadores que son rápidamente
escalables en potencia y las frecuentes innovaciones en software ofrecen nuevas
El elevado costo de la sustitución del bucle de abonado provoca que gran parte del tráfico de
datos pase a través de la red de circuitos tradicional (conmutada). Todavía, en Costa Rica hay
muchos clientes, que acceden a la Internet por medio de módems conectados a la línea
telefónica. Es decir, que no solo existen dos redes distintas, una para el tráfico de voz y otra para
el tráfico de datos, sino que además, parte de los datos se transportan por la red de voz. Esto
genera una serie de ineficiencias debido a que la red de circuitos conmutados no está diseñada
para cursar tráfico de datos, lo cual adquiere mayor relevancia en un escenario en que el tráfico
de datos solo tiende a crecer.
Aunque las redes de conmutación de paquetes ya son capaces de soportar algunos servicios en
tiempo real, todavía muestran algunas deficiencias que les impide ofrecer servicios de manera
eficiente y fiable. Sin embargo, se está invirtiendo en mejorar la calidad de servicios, de manera
que se alcancen los estándares necesarios para que estas redes soporten todo tipo de servicios.
Hoy en día, en el ámbito de los servicios de telecomunicaciones, el uso de la telefonía IP cobra
más sentido, ya que en estos entornos es posible conseguir servicios telefónicos de mayor
calidad. En ellos es posible, con los mecanismos disponibles en los equipos actuales,
proporcionar la calidad suficiente, por lo que se utiliza para llamadas internas que son manejadas
en su totalidad por equipos propios. Cuando es necesario conectarse al exterior, la calidad
disminuye y en muchos casos es insuficiente todavía como para reemplazar la telefonía
conmutada tradicional, sin embargo, como la voz sobre IP requiere entre de 30 % a un 50% del
ancho de banda de una llamada conmutada tradicional, es posible conseguir grandes ahorros para
el operador del servicio.
Parámetro VoIP Telefonía Tradicional
Ancho de banda Comparte el circuito y el ancho de banda con los
datos. Las técnicas de compresión permiten utilizar entre un 30 % a un 50% del ancho de banda que se requiere para la telefonía fija.
se establezca una llamada.
Mantenimiento, la gestión y la administración.
En este tipo de sistemas el 80 % de los problemas se pueden solucionar de forma remota, ya que se pueden centralizar en una sola sede.
En este tipo de sistemas el 45 % de los problemas se consigue solucionar de forma remota.
Esto representa disminución de costos de Operación y Mantenimiento, que en los sistemas de telecomunicaciones es un rublo elevado.
Costos de llamadas Ej. Llamada desde Costa Rica a Estados Unidos.
US$ 0,024 por minuto US$ 0,81 primer minuto + US$ 0,23 minuto adicional.
Esto representa para las empresas un ahorro en la facturación al exterior o entre sucursales de un 50 % a un 70 % respecto al uso de la telefonía tradicional.
Costo del equipo
IP-PBX ~ US$ 500
Cantidad de usuarios
Se pueden atender aproximadamente (1 a 400) usuarios, con 75 llamadas simultaneas. Dependiendo del ancho de banda del enlace IP.
Se pueden atender 18 extensiones (usuarios)
Esto representa un aumento de hasta el 95% en la capacidad de atención de usuarios.
Facilidades
Con el mismo equipo se aumenta la cantidad de facilidades disponibles.
Facilidades reducidas, dependiendo del tipo de equipo.
Esto representa mejoras en la comunicación, ya que con video conferencias se reducen costos de movilización a reuniones u otros eventos.
Se puede coordinar de mejor manera la asistencia remota y la localización de los colaboradores, por medio de sistemas de presencia.
Todo esto enfocado en terminales tipo softphone. Tabla 1. Relación Costo-Beneficio VoIP vr. Telefonía Tradicional
2.4 Estructura de la Red de Nueva Generación4
La tecnología evoluciona hacia redes basadas en paquetes y los proveedores de servicios de
telecomunicaciones necesitan la habilidad para interconectar sus clientes sin perder la confianza,
conveniencia y funcionalidad de las redes públicas de centrales telefónicas. Las Redes de Nueva
Generación, está enfocada a resolver estas necesidades.
Según ITU-T la Red de Nueva Generación es una red basada en conmutación de paquetes capaz
de proporcionar servicios incluyendo los de telecomunicación e idónea para hacer uso de la
tecnología de banda ancha, con Calidad de Servicio incorporada en la capa de transporte y una
relación servicio/función independiente de la tecnología utilizada. Ofreciendo de esta forma el
acceso sin restricción de los usuarios a diversos operadores de servicio, apoyando la movilidad
generalizada que permitirá la disposición constante y generalizada de servicios a los usuarios.
La NGN, incluye voz, datos, videos y es implementada utilizando tecnología IP basada en
conmutación de paquetes. Dentro de esta tecnología destaca el componente denominado
Softswitch, como elemento centralizado, inteligente y depositario de las lógicas de servicio y
datos de clientes. Esta plataforma ofrece lo mejor de las redes telefónicas tradicionales
combinada con la versatilidad de Internet, creando de esta manera un alto porcentaje de
confiabilidad, combinado con rápidas reducciones en los costos e innovadores servicios.
Se pueden obtener servicios y calidad similares, pero a menor precio, y se beneficiarán un
porcentaje más alto de la población por las continuas mejoras de rendimiento y costos que
ofrece la tecnología basada en trasporte por paquetes.
2.4.1 ¿Cómo se integra una estructura NGN en un ambiente telefónico clásico?
La forma más sencilla de insertar una red de telefonía sobre paquetes dentro de una red clásica
de conmutación de circuitos es comenzando por el tránsito (Trunking), dejando las centrales
locales TDM intactas.
La central local se conecta por un lado al llamado Media Gateway a través de tramas E1 (2
Mb/s) a través de las cuales entrega la voz viva. El MG se encarga de traducir las llamadas TDM
a paquetes según el protocolo RTP que viajan por una red IP.
Por otro lado, se envía (a través de canales de 64 kb/s) la señalización N°7 asociada a estas
tramas vocales a un equipo conocido como Signaling Gateway, este equipo envía la señalización
N°7 al Media Gateway Controller a través de una conexión IP. En resumen, el SG traduce de
modo circuito a modo paquetes.
Tanto el MG como el SG son, por así decirlo, traductores. La inteligencia en esta estructura está
Esta separación de funciones es la clave de las redes NGN: En el MG se resuelve el plano de
conectividad de la red; es decir, el transporte y en el MGC-SG se encuentra el plano de control;
es decir, la inteligencia.
El MGC suele recibir también las denominaciones Call Agent (agente de llamadas) y SoftSwitch.
Ilustración 6. Arquitectura NGN Tradicional.
CAPITULO 3. Fundamentos de VoIP
3.1 Introducción a VoIP
El concepto original es relativamente simple: se trata de transformar la voz en "paquetes de
información" manejables por una red IP. Gracias a otros protocolos de comunicación, es posible
reservar cierto ancho de banda dentro de la red que garantice la calidad de la comunicación.
La voz puede ser obtenida desde un teléfono común: existen gateways (dispositivos de
interconexión) que permiten intercomunicar las redes de telefonía tradicional con las redes de
datos. De hecho, el sistema telefónico podría desviar sus llamadas a Internet para que, una vez
alcanzado el servidor más próximo al destino, esa llamada vuelva a ser traducida como
información analógica y sea transmitida hacia un teléfono común por la red telefónica
tradicional. Cabe recordar que, se pueden mantener conversaciones teléfono a teléfono.
Podemos encontrar tres tipos de redes IP:
1. Internet. El estado actual de la red de telecomunicaciones no permite un uso profesional
para el tráfico de voz.
2. Red IP pública. Los operadores de telecomunicaciones ofrecen a las empresas la
conectividad necesaria para interconectar sus redes de área local en lo que al tráfico IP
se refiere. Se puede considerar como algo similar a Internet, pero con una mayor calidad
de servicio y con importantes mejoras en seguridad. Hay operadores que incluso ofrecen
garantías de bajo retardo y/o ancho de banda, lo que las hace muy interesante para el
3. Intranet. La red IP implementada por la propia empresa. Suele constar de varias redes
LAN (Ethernet conmutada, ATM, entre otros.) que se interconectan mediante redes
WAN tipo Frame-Relay/ATM, líneas punto a punto, RDSI para el acceso remoto, entre
otros. En este caso la empresa tiene bajo su control prácticamente todos los parámetros
de la red, por lo que resulta ideal para su uso en el transporte de la voz.
3.2 Introducción a los protocolos de VoIP
El conjunto de protocolos de Voz sobre IP se descompone en dos categorías, los protocolos del
plano de control y los protocolos del plano de datos.
La parte del plano de control de VoIP es el tráfico necesario para conectar y mantener el tráfico
actual de usuario. Es también responsable de mantener toda la operación de toda la red
(comunicaciones router-router).
El plano de datos (Voz) es el protocolo necesario para llevar el tráfico de un usuario a otro.
Ilustración 7. Algunos de los protocolos de VoIP más importantes.
Fuente: Wikipedia
El VoIP tiene como principal objetivo asegurar la interoperabilidad entre equipos de diferentes
fabricantes, fijando aspectos tales como la supresión de silencios, codificación de la voz y
direccionamiento, y estableciendo nuevos elementos para permitir la conectividad con la
VoIP puede utilizar tanto UDP5 como TCP6 sobre IP. En la figura siguiente se muestra la pila de
protocolos de VoIP. Es importante destacar que VoIP trabaja sobre cualquier pila de protocolos
IP. Los usuarios de VoIP pueden añadir esta tecnología de forma fácil y rápida a la red ya
existente de datos.
Ilustración 8. Protocolos de VoIP
Fuente: RFC
VoIP comprende muchos estándares y protocolos. La terminología básica debe ser entendida
para comprender las aplicaciones y usos de VoIP. Las siguientes definiciones de protocolos
sirven como un punto de partida:
5 UDP:User Datagram Protocol (UDP) es un protocolo del nivel de transporte basado en el intercambio de datagramas. Permite el envío de datagramas a través de la red sin que se haya establecido previamente una conexión, ya que el propio datagrama incorpora suficiente información de direccionamiento en su cabecera. Tampoco tiene confirmación ni control de flujo, por lo que los paquetes pueden adelantarse unos a otros; y tampoco se sabe si ha llegado correctamente, ya que no hay confirmación de entrega o recepción.
1. H.323: es una recomendación ITU que define los Sistemas de Comunicaciones
Multimedia basados en paquetes. En otras palabras, H.323 define una arquitectura
distribuida para crear aplicaciones multimedia, incluyendo VoIP.
2. H.248: es una recomendación ITU que define el protocolo de Control Gateway. H.248
es el resultado de una colaboración conjunta entre la ITU y la IETF. Es también referido
como IETF RFC 2885 (MEGACO), el cual define una arquitectura centralizada para
crear aplicaciones multimedia, incluyendo VoIP.
3. MEGACO, también conocido como la IETF RFC 2885 y recomendación ITU H.248,
define una arquitectura centralizada para crear aplicaciones multimedia, incluyendo
VoIP.
4. MGCP, también conocido como la IETF 2705, define una arquitectura centralizada para
crear aplicaciones multimedia, incluyendo VoIP.
5. El Protocolo de Transporte en Tiempo Real (RTP), también conocido como la IETF
RFC 1889, define un protocolo de transporte para aplicaciones en tiempo real.
Específicamente, RTP provee el transporte para llevar la porción audio/media de la
comunicación VoIP. RTP es usado por todos los protocolos de señalización VoIP.
6. SIP: también conocido como la IETF RFC 2543, define una arquitectura distribuida
para crear aplicaciones multimedia, incluyendo VoIP.
Voz sobre IP define los sistemas de enrutamiento y los protocolos necesarios para la transmisión
de conversaciones de voz a través de Internet, la cual es una red de conmutación de paquetes
basado en el protocolo TCP/IP para el envío de información.
Actualmente existen, principalmente, dos arquitecturas de VoIP para la transmisión de voz por
Tabla 2. Clasificación de Protocolos de VoIP
Fuente: Unión Internacional de Telecomunicaciones
3.2.1 H.3237
H.323 es una recomendación del ITU-T, que define los protocolos para proveer sesiones de
comunicación audiovisual sobre paquetes de red donde no se garantiza la calidad de servicio.
Éste se creó basándose en estándares existentes como H.320, RTP y Q.931, para proveer de un
mecanismo para el transporte de aplicaciones multimedia en LANs pero ha evolucionado
rápidamente para dirigir las crecientes necesidades de las redes de VoIP.
La pila de protocolos H.323 se muestra en la figura siguiente, cada uno de estos componentes
está encargado de diferentes tareas como la configuración o el registro de la llamada.
H.245. Establece un canal lógico para cada llamada (extremo a extremo). Durante la
negociación, los dos extremos se intercambian las preferencias, como por ejemplo, la elección
del CODEC.
H.225. Constituye los mensajes básicos de la señalización que también se utilizan para
interconectar con RDSI. Están basados en el protocolo Q.931 y permiten establecer y terminar
las llamadas entre los teléfonos y todos los gestores del medio.
Ilustración 9. Pila de Protocolos asociados a H.323
Fuente: Unión Internacional de Telecomunicaciones
Aparte del modelo básico de llamada, el protocolo define servicios suplementarios, necesarios
para dirigir las expectativas de comunicaciones comerciales. Los diseñadores de H.323 lo
definieron de tal manera que las empresas pueden agregar sus propias especificaciones al
protocolo que permiten a los dispositivos adquirir nuevas características o capacidades. Éste fue
el primer estándar de VoIP en adoptar el estándar RTP para transportar audio y vídeo sobre redes
En el caso de H.323, se utilizan los mensajes que ya habían sido definidos en la norma Q.931
para RDSI. Como estos mensajes no fueron originalmente definidos para VoIP, carecen de
parámetros relacionados con el “mundo” IP. Por ello, se definen en el protocolo H.225 los
parámetros IP y son transportados sobre el protocolo Q.931 en el campo UUIE.
H.225/Q.931 corre sobre TCP, por lo que requiere un establecimiento de conexión inicial. En
este tipo de llamadas, el llamante trabaja como cliente, y el llamado como servidor en el puerto
TCP 1720.
Ilustración 10. Ejemplo del flujo de llamadas para H.323
Para H.323 se negociaban los CODECs y las direcciones de transporte (IP: Puerto UDP) una vez
establecida la llamada. Esto generaba un retardo en el inicio del envío del audio, así que se
definió lo que se conoce como FAST START o FAST CONNECT que trabaja de forma similar
a SIP transportando el H.245 sobre los mensajes H.225.
Como se ve en la figura siguiente, el H.245 posee tres mensajes principales:
1. TCS (Terminal Capability Set): Negociación de tablas de CODECs principalmente.
2. MSD (Master/Slave Determination)
3. OLC (Open Logical Channels): La principal función es la de establecer los canales
lógicos. Esto es, negociar al igual que el SDP, los puertos de UDP por donde se recibirá
Ilustración 11. Ejemplo de mensajes H.245
3.2.2 SIP8
Session Initiation Protocol es un protocolo de control a nivel de aplicación desarrollado por el
IETF con la intención de ser el estándar para la inicialización, modificación y finalización de
sesiones interactivas de usuario en las que intervienen elementos multimedia como el vídeo, voz,
mensajería instantánea, juegos online y realidad virtual. Éste fue aceptado como protocolo de
señalización en noviembre de 2000, y viene definido en el RFC 3261, desplazando así el
estándar H.323 descrito anteriormente.
Ilustración 12. Pila de Protocolos SIP
Fuente: RFC 3261
SIP está diseñado para gestionar y establecer llamadas multimedia, como videoconferencia,
llamadas de voz o sesiones para compartir datos. Es el estándar que muchos fabricantes están
utilizando actualmente para desarrollar sus elementos de red. Fue diseñado para que fuera fácil
de implementar y optimizara el ancho de banda utilizado para la señalización. Las claves más
importantes de este protocolo son:
1. Esquema de direcciones URL: permite la “portabilidad” del número independientemente
de la localización física del usuario. Las direcciones pueden ser un número de teléfono,
una dirección IP o una dirección de correo electrónico. Estos mensajes son muy
2. Multimedia: SIP puede establecer múltiples sesiones durante una sola llamada. Esto
significa que los usuarios pueden compartir un juego, mensajería instantánea y hablar al
mismo tiempo.
3. Es un protocolo "ligero" y fácilmente escalable.
En el caso de SIP, utiliza sus propios mensajes que fueron definidos desde el inicio en un
entorno IP. Es importante notar que SIP suele correr sobre UDP por ello aparece el mensaje de
ACK confirmando el mensaje de 200OK. Al igual que en H.323, trabaja con un modelo cliente
servidor donde el llamante es el cliente y el llamado un servidor en el puerto 5060 de UDP.
Ilustración 13. Ejemplo del flujo de llamadas para SIP
Como se observa en la figura anterior, en los mensajes de INVITE y 200OK, se envía el SDP.
Cabe notar que el INVITE va de llamante a llamado y el 200OK en el otro sentido. Dentro del
mensaje de SDP sobre el INVITE, se envía principalmente el listado (en orden de prioridad) de
CODECs con los que desea trabajar quien realiza la llamada y además, la IP y Puerto a donde
quien realiza la llamada, quiere recibir el RTP. En el mensaje de 200OK se envían los mismos
parámetros pero desde el llamado al llamante. No siempre el 200OK lleva el SDP, ya que
muchas veces, algún mensaje anterior lo lleva. Esto ocurre por ejemplo cuando se quiere enviar
3.2.2.1 Protocolos asociados a SIP
Los protocolos Real-Time Protocol y Compressed Real-Time Protocol están normalmente
disponibles en cualquiera de las arquitecturas de VoIP. El tráfico propio de VoIP a veces va por
caminos diferentes a la señalización, esto significa que pueden viajar de forma independiente.
RTP es el protocolo que soporta la voz del usuario. Cada paquete RTP contiene una muestra
pequeña de la conversación de voz. El tamaño del paquete y el tamaño de la muestra de voz,
dentro de dicho paquete, dependerán del CODEC utilizado.
En la figura siguiente se muestra la pila de protocolos RTP.
Ilustración 14. Pila de protocolos RTP
Fuente: RFC 1889
Si un paquete RTP se pierde o es descartado por la red, no será retransmitido, esto es debido a la
conveniencia de evitar largas pausas en la conversación telefónica. La red debería diseñarse para
que tan sólo unos pocos paquetes sean perdidos en la transmisión. En la cabecera RTP se incluye
información para identificar y gestionar cada llamada, de forma individual, desde un extremo a
otro. Esta información incluye un estampado del tiempo, un número de secuencia e información
3.2.2.1.1 RTP Comprimido
Una variante de RTP es RTP comprimido. RTP Comprimido elimina mucha de la información
de la cabecera del paquete. Eliminando estos bytes, la red se optimiza disminuyendo la
información añadida al paquete. Utilizando cRTP, un usuario puede doblar el número de
llamadas que al utilizar RTP estándar. Compressed RTP se utiliza en enlaces WAN,
especialmente en enlaces punto-punto. Como la cabecera de UDP y RTP se reduce a un máximo
de 4 bytes, no hay lugar para añadir en la cabecera la dirección IP. Por lo tanto, el paquete no
puede ser enrutado y sólo puede ser utilizarse en enlaces donde no resulte necesario
direccionamiento IP. La consecuencia de cRTP, similar a cualquier forma de compresión, es que
necesita más ciclos de procesado en el router para tratar el paquete. El router debe recrear cada
cabecera tan pronto llegue el paquete IP, y de esta forma, la información es enrutada a través de
la LAN hasta el teléfono IP.
3.2.2.1.2 RTCP9
Real-Time Control Protocol es un protocolo del plano de datos. Este protocolo permite a los
usuarios finales comunicar información relativa a la calidad de la llamada. RTCP permite a los
usuarios finales ajustar en tiempo real la calidad de la llamada. También contribuye a detectar
los posibles problemas. Con RTCP habilitado, cualquier analizador puede visualizar la calidad
de la llamada en los dos extremos, analizando los paquetes que envían los dos equipos de
comunicación. Se puede detectar la sección donde está la incidencia de una forma mucho más
rápida. De cualquier modo, aunque la información que aporta es muy útil, también añade ancho
de banda, por esta razón es el usuario quien tiene que decidir si quiere o no utilizarlo.
Ilustración 15. Comparativa RTP/cRTP
3.2.2.1.3 SDP10
Cuando se inician videoconferencias, llamadas sobre IP, vídeo en streaming o cualquier otro tipo
de sesiones, existe la necesidad por parte de los participantes de acordar detalles concernientes a
éstas como por ejemplo las direcciones, los puertos el protocolo de transporte a utilizar, entre
otros.
El protocolo SDP proporciona el formato para la representación de dicha información.
Puesto que SDP es sólo un protocolo de descripción no define ningún protocolo de transporte,
los mensajes SDP pueden ser transportados mediante distintos protocolos tales como SAP, SIP,
RTSP, correo electrónico con aplicaciones MIME o protocolos como HTTP.
SDP, al igual que SIP, utiliza una codificación textual. Así, un mensaje SDP se compone de una
serie de líneas denominadas campos. Estos tienen la forma de pares atributo-valor siendo su
sintaxis:
tipo = valor
Donde “tipo” hace referencia al nombre del campo y son representados por una sola letra
distinguiendo entre minúscula y mayúscula. “valor” es, como su propio nombre indica, el valor
de ese campo y su formato depende de qué “tipo” se trate. Los campos están en un orden
predeterminado para simplificar el análisis.
3.2.2.2 Direccionamiento en SIP11
Una de las funciones de los servidores SIP es la localización de los usuarios y resolución de
nombres. Normalmente, el agente de usuario no conoce la dirección IP del destinatario de la
llamada, sino su URI.
Las entidades SIP identifican a un usuario con las SIP URI13 las cuales tienen un formato
similar al del correo electrónico. Consta de un usuario y un dominio delimitado por una @,
como se muestra en los siguientes casos:
1. usuario@dominio: donde dominio es un nombre de dominio completo.
2. usuario@equipo: donde equipo es el nombre de la máquina.
3. usuario@dirección_ip: donde dirección_ip es la dirección IP del dispositivo.
4. número_teléfono@gateway: donde el gateway permite acceder al número de
teléfono a través de la red telefónica pública.
Una URI SIP no siempre ha de corresponderse con un sólo teléfono. Si un usuario está
disponible en más de un teléfono, al recibir una llamada se puede hacer que todos suenen a la
vez o en una secuencia determinada según hayamos configurado el servidor. Casi todos los SIP
registers soportan que un mismo usuario se registre en diferentes teléfonos.
SIP provee también una URI SIPS, la cual es una URI segura.
Una llamada hecha a una SIPS URI nos garantiza que los mensajes que se intercambiarán lo
harán usando un método de transporte seguro y encriptado llamado TLS.
Con esta forma de direccionar se tiene la ventaja de que la dirección del usuario no va unida a
ningún dispositivo en concreto como en H.323, pudiendo ser localizados con el mismo
identificador en cualquier teléfono donde se registre.
La solución de identificación de SIP, también puede estar basada en procedimientos DNS14
utilizados por los clientes para traducir una SIP URI en una dirección IP, puerta y protocolo de
transporte utilizado, o por los servidores para retornar una respuesta al cliente en caso de que la
petición falle.
3.3 Convirtiendo formas de onda analógicas a paquetes de VoIP12
La señal de voz es analógica, mientras que la información que circula por una red de datos es
digital. Por tanto es necesaria una transformación analógica-digital de la voz para que esta pueda
ser transportada a través de una red de datos.
El proceso de convertir ondas analógicas a información digital se hace con un
codificador-decodificador, llamado códec. Hay muchas maneras de transformar una señal de voz analógica
en digital, todas ellas gobernadas por varios estándares.
Además de la ejecución de la conversión de analógico a digital, el códec comprime la secuencia
de datos. La compresión de la forma de onda representada puede permitir un ahorro en el ancho
de banda. Esto es especialmente interesante en los enlaces de poca capacidad y permite tener un
mayor número de conexiones de VoIP simultáneamente. Otra manera de ahorrar ancho de banda
es el uso de la supresión del silencio, que es el proceso de no enviar los paquetes de voz entre
silencios en conversaciones humanas.
3.3.1 Muestreo y Cuantización
La conversión analógico/digital es el proceso usado para representar una cantidad de precisión
infinita, originalmente en su forma analógica variante con el tiempo (como una señal eléctrica
producida por un micrófono), por un set de números finito a una frecuencia de muestreo fija,
cada muestra representa el estado de la cantidad original en un instante específico. La conversión
analógico/digital es necesaria con el fin de permitir el análisis de señales basado en
computadoras, dado que las computadoras solo pueden procesar bits (1 ó 0).
La conversión analógico/digital está caracterizada por:
1. La frecuencia de muestreo (¿qué tanto es medida la variable continua?)
2. El método de Cuantización (el número de valores discretos que son usados para expresar
la medición (típicamente cierto número de bits), y como esos valores son distribuidos
(linealmente en la escala de medición, o en ciertas porciones de la escala de medición
Ilustración 16. Modulación en amplitud del pulso
Fuente: Digital Filters and Signal Processing
Matemáticamente, el proceso de muestreo puede ser definido como el resultado de la
multiplicación de un tren de pulsos periódicos infinitos de amplitud uno (con un período
correspondiente al período de muestreo), por la señal original continua en el tiempo a ser
muestreada. Esto nos lleva a lo que se conoce como PAM que es la representación discreta en el
tiempo de la señal, como se muestra en la figura anterior.
La conversión analógico/digital pierde cierta información contenida en la señal original, la cual
nunca puede ser recuperada (esto se puede observar en la figura siguiente). Es importante
escoger una frecuencia de muestreo y una escala de cuantización apropiadas, ya que estos
Ilustración 17. Reconstrucción de una señal continúa desde su señal discreta.
Fuente: Digital Filters and Signal Processing
3.3.2 Codificación
El objetivo fundamental de la codificación de voz es la conversión de la señal de voz a una
secuencia binaria o de representación digital. Dado el carácter analógico (señal continua en
tiempo y amplitud) de la señal de voz, la codificación de voz conlleva un proceso básico de
muestreo y cuantificación para conseguir una representación digital (conversión
analógico/digital). Mediante el muestreo tomamos el valor de la señal en un instante de tiempo
definido y mediante la cuantificación se toman valores definidos de la señal en amplitud. Para
que en este proceso de digitalización no exista pérdida de información, debemos muestrear la
señal a una velocidad (fm) que como mínimo sea el doble de la frecuencia más alta presente en la
señal que estamos digitalizando.
El proceso de codificación, propiamente dicho, toma como señal de entrada la obtenida de la
conversión A/D a una velocidad de fm x N bits/segundo y utilizando ciertas propiedades de la
señal de voz, se obtiene una nueva codificación con una velocidad de R bits/segundo inferior a la
Los codificadores de voz trabajan explotando las propiedades tanto temporales como en
frecuencia de la señal de voz y del sistema auditivo humano puesto que en último término va a
ser el sistema auditivo humano quien va a juzgar la calidad de la señal. Así, la correlación de la
señal es utilizada para reducir el margen dinámico de la señal y de este modo poderla cuantificar
con un número menor de bits, como por ejemplo en el codificador ADPCM que permite reducir
a 32 kb/s la velocidad de transmisión sin degradar la calidad de la señal.
Ilustración 18. Ejemplo de Codificación
Fuente: Wikipedia
3.3.3 Compresión
La compresión consiste en reducir el tamaño físico de bloques de información. La idea
fundamental de la compresión de datos es reducir el tamaño de los archivos de forma tal que
estos ocupen menos espacio y que dado el archivo comprimido pueda recuperarse el archivo
que los caracteres menos probables de forma tal que la longitud promedio del archivo
comprimido sea menor a la del archivo original.
Un compresor se vale de un algoritmo que se utiliza para optimizar los datos al tener en cuenta
consideraciones apropiadas para el tipo de datos que se van a comprimir. Por lo tanto, es
necesario un descompresor para reconstruir los datos originales por medio de un algoritmo
opuesto al que se utiliza para la compresión.
El método de compresión depende intrínsecamente del tipo de datos que se van a comprimir: no
se comprime una imagen del mismo modo que un archivo de audio.
A la hora de hablar de compresión hay que tener presentes dos conceptos:
1. Redundancia: Datos que son repetitivos o previsibles.
2. Entropía: La información nueva o esencial que se define como la diferencia entre la
cantidad total de datos de un mensaje y su redundancia.
La información que transmiten los datos puede ser de tres tipos:
1. Redundante: información repetitiva o predecible.
2. Irrelevante: información que no podemos apreciar y cuya eliminación por tanto no afecta
al contenido del mensaje. Por ejemplo, si las frecuencias que es capaz de captar el oído
humano están entre (16 a 20) Hz y (16 000 a 20 000) Hz, serían irrelevantes aquellas
frecuencias que estuvieran por debajo o por encima de estos valores.
3. Básica: la relevante. La que no es ni redundante ni irrelevante. La que debe ser
Teniendo en cuenta estos tres tipos de información, se establecen tres tipologías de compresión
de la información:
1. Sin pérdidas reales: es decir, transmitiendo toda la entropía del mensaje (toda la
información básica e irrelevante, pero eliminando la redundante).
2. Subjetivamente sin pérdidas: es decir, además de eliminar la información redundante se
elimina también la irrelevante.
3. Subjetivamente con pérdidas: se elimina cierta cantidad de información básica, por lo
que el mensaje se reconstruirá con errores perceptibles pero tolerables (por ejemplo: la
videoconferencia).
3.3.4 Códec13
La voz se debe digitalizar y codificar para que se pueda enviar a través del protocolo IP. Se
utilizan códec como los G.711, G.722, G.723, G.728 o G.729. Estos comprimen los datos de
audio para usar menos ancho de banda en la transmisión. De esta manera se permiten muchas
más conexiones en un mismo canal.
Hay que tener en cuenta que la calidad de los datos transmitidos es inversamente proporcional a
la compresión de los datos, si la compresión de datos es muy grande podemos perder
inteligibilidad. Existe pues un compromiso entre el ancho de banda que se quiere utilizar y una
calidad suficientemente buena para que haya claridad.
Según el Códec utilizado en la transmisión, se utilizará más o menos, determinado ancho de
banda. La cantidad de ancho de banda suele ser directamente proporcional a la calidad de los
datos transmitidos.
Tabla 3. Consumo de ancho de banda de los Códecs más usados
Fuente: Unión Internacional de Telecomunicaciones
Tabla 4. Consumo de ancho de banda TOTAL de los Códecs más usados
3.4 Elementos de VoIP
3.4.1 Elementos de una red SIP
SIP soporta funcionalidades para el establecimiento y finalización de las sesiones multimedia:
localización, disponibilidad, utilización de recursos, y características de negociación.
Para implementar estas funcionalidades existen dos elementos fundamentales en una
arquitectura SIP: los agentes de usuario y los servidores.
3.4.1.1 Agente de usuario
Un agente de usuario consta de dos partes distintas: el agente de usuario cliente y el agente de
usuario servidor. Un UAC es una entidad lógica que genera peticiones SIP y recibe respuestas a
esas peticiones. Un UAS es una entidad lógica que genera respuestas a las peticiones SIP.
Ambos se encuentran en todos los agentes de usuario, permitiendo así la comunicación entre
diferentes agentes de usuario mediante comunicaciones de tipo cliente-servidor.
3.4.1.2 Servidores SIP
Los servidores SIP pueden ser de tres tipos:
1. Servidor Proxy. Retransmite peticiones y decide a qué otro servidor debe remitirlas,
alterando los campos de la solicitud en caso necesario. Es una entidad intermedia que
actúa como cliente y servidor con el propósito de establecer llamadas entre los usuarios.
Este servidor tiene una funcionalidad semejante a la de un Proxy HTTP el cual tiene la
tarea de encaminar las peticiones que recibe de otras entidades más próximas al
destinatario. Las funciones que realiza cuando les llega una petición son las siguientes:
1. Validar la petición.
3. Determinar el destino de la petición.
4. Reenviar la petición a cada destino.
5. Procesar las respuestas a esa petición.
Existen dos tipos de Servidores Proxy:
1. Proxy “stateful”: guarda información de cada petición que recibe así como de
las respuestas que envía como consecuencia de haber procesado esas peticiones.
Esta información podrá afectar al procesamiento de futuros mensajes asociados
a una petición.
2. Proxy “stateless”: un proxy de este tipo sólo reenvía los mensajes que le llegan.
No guarda el estado de las transacciones, así una vez que ha retransmitido un
mensaje borra toda información sobre él.
2. Servidor de registro. Es un servidor que acepta peticiones de registro de los usuarios y
guarda la información de estas peticiones. Por tanto, suministra un servicio de
localización y traducción de direcciones en el dominio que controla.
3. Servidor de Redirección. Genera respuestas de redirección a las peticiones que recibe.
Cuando recibe una petición no la reenvía a otro servidor sino que genera una respuesta
con la dirección de destino de la petición. Cuando el cliente la recibe, rehace la petición
con esta información y la envía. Se suele utilizar cuando se quiere disminuir la carga de
procesamiento de ruteado de los servidores proxy.
Es muy importante tener en cuenta que la división de estos servidores es conceptual, cualquiera
de ellos puede estar físicamente en una única máquina. Esta división se suele hacer por motivos
3.4.2 Elementos de una red H.323
El propio Estándar H.323 define tres elementos fundamentales en su estructura:
1. Terminales: son los sustitutos de los actuales teléfonos. Se pueden implementar tanto en
software como en hardware.
2. Gatekeepers: son el centro de toda la organización VoIP, y serían el sustituto para las
actuales centrales. Normalmente implementadas en software, en caso de existir, todas las
comunicaciones pasarían por él.
3. Gateways: se trata del enlace con la red telefónica tradicional, actuando de forma
transparente para el usuario.
Ilustración 19. Componentes de H.323
3.4.2.1 Terminales
Un terminal es un extremo de la red que proporciona comunicaciones bidireccionales en tiempo
real con otro terminal, gateway o unidad de control multipunto. Esta comunicación consta de
señales de control, indicaciones, audio, imagen en color en movimiento y/o datos entre los dos
terminales. Conforme a la especificación, un terminal puede proporcionar sólo voz, voz y datos,
3.4.2.2 Gatekeeper
Es el dispositivo de la red que provee a los equipos terminales servicios tales como registro y
autentificación de usuarios, control de ancho de banda, resolución de direcciones, entre otros.
Este último quizás sea el más importante ya que hace posible que dos terminales se pueden
comunicar sin saber ninguno la dirección IP del otro.
Para ello cada dispositivo dentro de una zona (ámbito donde opera un gatekeeper, el cual puede
ser una LAN o un continente entero) debe llevar a cabo un proceso de registro. Éste consiste en
el envío de una petición de registro por parte del terminal donde se informa de las características
que lo identifican (número de teléfono, dirección IP, entre otros.).
El gatekeeper, después de haber registrado todos estos datos en memoria, envía al terminal un
mensaje de confirmación de registro indicándole que tiene vía libre para recibir y efectuar
llamadas.
3.4.2.3 Gateway
Es el dispositivo que hace de interfaz entre una red y otras redes como la PSTN e RDSI. En el
caso en el que en una conversación un equipo terminal no sea H.323 (por ejemplo), la llamada
deberá pasar por un gateway para que la comunicación sea posible.
3.5 Calidad de Servicio14
El auge de la telefonía IP es algo evidente y la principal razón es el reaprovechamiento de los
recursos y la disminución en el costo de las llamadas a través de Internet. Sin embargo, si de
algo adolece todavía la VoIP es de la calidad de los sistemas telefónicos tradicionales.
Los problemas de esta calidad son muchas veces inherentes a la utilización de la red (Internet y
su velocidad y ancho de banda) y podrán irse solventando en el futuro. Mientras tanto, cuanto
mejor conozcamos los problemas que se producen y sus posibles soluciones mayor calidad
disfrutaremos.
Los principales problemas en cuanto a la calidad del servicio de una red de VoIP, son la
Latencia, el Jitter (pérdida de paquetes) y el Eco.
Los problemas de la calidad del servicio en VoIP vienen derivados de dos factores
principalmente:
a) Internet es un sistema basado en conmutación de paquetes y por tanto la información no
viaja siempre por el mismo camino. Esto produce efectos como la pérdida de paquetes.
b) Las comunicaciones VoIP son en tiempo real lo que produce que efectos como el eco, la
pérdida de paquetes y el retardo (latencia) sean muy molestos y perjudiciales y deban ser
evitados.