Redes – Estándares de videoconferencia ESTÁNDARES DE VIDEOCONFERENCIA Amparo Domínguez Mascarell REDES Redes – Estándares de videoconferencia Índice 1.- Objetivo ............................................................................................................... 3 2.- Codificación de audio ........................................................................................... 3 G.711 G.722 G.723 G.728 G.729 3.- Codificación de vídeo ........................................................................................... 4 H.261 H.263 4.- Compartición de datos ......................................................................................... 5 T.120 5.- Estándares de videoconferencia .......................................................................... 6 H.320 H.321 H.322 H.323 H.324 H.310 6.- Estándares de control......................................................................................... 11 H.221 H.225 H.230 H.242 H.245 Redes – Estándares de videoconferencia 1.- OBJETIVO Estudiaremos los diversos estándares internacionales ofrecidos para el establecimiento de videoconferencias por su importancia para permitir la operabilidad entre los distintos fabricantes. Estos estándares abarcan la transmisión de audio y vídeo así como la compartición de datos entre usuarios conectados, y los propios para establecer videoconferencias basándose en los anteriores y en otros estándares de control. 2.- CODIFICACIÓN DE AUDIO La codificación es el proceso de transformación de una señal analógica a una señal digital que pueda ser transmitida por canales de ancho de banda bajo. Los pasos que se siguen en este proceso son: Filtro pasabanda: que limita el rango de frecuencia que se desea muestrear y reducir así los bits necesarios para digitalizar la señal analógica. Muestreo: convierte la señal analógica en una señal de valores discretos. Cuantificación: asigna un valor binario a las muestras obtenidas en la fase de muestreo. Codificación: existen diversas técnicas de codificación. - PCM (Pulse Code Modulation) que es la modulación por pulsos codificados (básicamente es el proceso de cuantificación). - DPCM (Differencia Pulse Code Modulation) que codifica la diferencia entre dos señales consecutivas. - ADPCM (Adaptive Differencial Code Modulation) que se adapta dinámicamente a los diferentes tipos de señal aumentando o disminuyendo la resolución. Los estándares especificados por la ITU-T para la codificación de audio son G.711, G.722, G.723, G.728 y G.729. G.711 Es el estándar de codificación de audio para telefonía y videotelefonía. Se basa en codificar muestras de la señal de audio a 8 KHz y asignar a esas muestras un código de 8 bits con el que conseguimos tener 256 posibles valores de la muestra con flujos de 64 Kbps. Es lo que se llama modulación por impulsos codificados (PCM). Es el estándar más apropiado para conexiones de alta velocidad. G.722 Este estándar utiliza la técnica ADCPM, es decir, no codifica el valor de la muestra sino la diferencia con el valor anterior de la muestra que se puede codificar con menos bits al ser una diferencia muy pequeña. Así, en este estándar se muestrea la señal a 16 KHz y se asignan códigos de 4 bits consiguiendo tener 16 posibles valores de la señal y obteniendo así mayor calidad que con el estándar G.711. Redes – Estándares de videoconferencia Si en el anterior estándar se convertían frecuencias de 3.1 KHz a 64 Kbps, este consigue convertir frecuencias de entre 50 Hz y 7 KHz a 5.3 y 6.3 Kbps reduciendo así el empleo de ancho de banda. G.723 Al igual que G.722 comprime frecuencias comprendidas entre 50 Hz y 7KHz pero lo hace a canales de 48, 56 y 64 Kbps, consiguiendo así mayor disponibilidad y mayor calidad en la transmisión y recepción. G.728 Este estándar se basa en fórmulas matemáticas para reproducir la señal y lo que codifica son los parámetros predictores utilizados en esas fórmulas para los que sólo son necesarios 2 bits con los que conseguimos sólo 4 niveles de cuantificación para la señal con 16 Kbps. Consigue codificar frecuencias de 3.1 KHz a flujos de 16 Kbps. G.729 Estándar equivalente a G.728 pero se reduce el régimen binario de 16 Kbps a 8 Kbps permitiendo comprimir así los 64 Kbps. 3.- CODIFICACIÓN DE VÍDEO La técnica de codificación de vídeo más común empleada por los estándares de videoconferencia es DCT (Discrete Cosine Transform), la transformada discreta del coseno. Aunque existen otras técnicas de codificación de vídeo como Fractales, Cuantización de Vectores o Codificación Aritmética. Mientras que los formatos de imagen más comunes utilizados por los diversos estándares de vídeo son CIF (Common Intermediate Format) que consta de 352 píxeles por línea y 288 líneas por imagen y QCIF (Quarter Common Intermediate Format) con 176 píxeles por línea y 144 líneas por imagen. De estos dos, el formato más utilizado es el CIF ya ofrece una calidad de imagen mayor. La codificación de vídeo viene especificada en los estándares H.261 y H.263. H.261 Es el estándar de vídeo común para todas las recomendaciones de videoconferencia, lo cual aumenta la interoperabilidad entre las distintas redes. Se encarga de definir el algoritmo de codificación de vídeo, el formato de las imágenes y la corrección de errores. La técnica empleada por este estándar para comprimir la información de cada fotograma es la redundancia espacial, es decir, asegura que la información correspondiente a un punto del fotograma será la misma para los puntos de alrededor, con lo que transmitiendo sólo la información de ese punto central se ahorra la de los demás. Redes – Estándares de videoconferencia Mientras que la técnica empleada para comprimir una secuencia de fotogramas es la redundancia temporal, basada en transmitir sólo la diferencia entre un fotograma y el siguiente en cuanto que la diferencia entre ambas imágenes será mínima. Este estándar se basa en una codificación de vídeo para velocidades entre 40 Kbps y 2 Mbps. Además, debe soportar obligatoriamente el formato de imagen QCIF, mientras que el formato CIF es opcional. H.263 Este estándar ofrece mejoras respecto a H.261 desde dos aspectos: Soporta más formatos de imagen, como son: 16CIF, 4CIF, CIF, QCIF y Sub-QCIF (para transmisiones en Internet de baja velocidad como módems de 28.8 Kbps). Mejora la técnica de redundancia temporal, ya que tiene en cuenta no sólo los fotogramas pasados sino también los siguientes esperados, y además ofrece mayor calidad al ampliar la zona en la que busca el macrobloque en la imagen siguiente a 32 puntos en lugar de los 16 que usa H.261. De forma que para una determinada velocidad de transferencia, H.263 ofrece mayor calidad de imagen que H.261 con resoluciones que van desde Sub-QCIF a 4xFCIF. 4.- COMPARTICIÓN DE DATOS La compartición de datos, documentos o aplicaciones entre los participantes de la videoconferencia viene contemplada en la serie de normas T.120. T.120 Este estándar define el transporte multipunto de datos multimedia. Asegura, por una parte, la interoperatividad transparente entre los diversos puntos de una conferencia de datos y, por otra parte, la compartición de información de forma eficaz y fiable en tiempo real, todo ello independientemente de la red y de la plataforma utilizadas. Los datos compartidos pueden estar en una pizarra o en un archivo binario, o pueden ser documentos que estén corriendo en plataformas distintas. La forma de enviar y recibir los paquetes de datos puede ser, o bien utilizando la capa H.225 o utilizar la capacidad de H.323 para transmitir datos directamente sobre la red. Para permitir la compartición de datos, las unidades de control multipunto deben soportar los estándares H.320 y T.120. La ITU-T ha definido una serie de recomendaciones T.120 detalladas a continuación: T.121 T.122 Plantillas de aplicación Genérica Servicio de datos multipunto orientado a conexi¢n. Proporciona difusión de datos Redes – Estándares de videoconferencia T.123 T.124 T.125 T.126 T.127 T.128 con control de flujo, direccionamiento multipunto y el camino más corto entre estaciones, entre otras cosas. Presenta al nivel superior un interfaz común, e independiente del medio de transporte. Establece la pila de protocolos para aplicaciones de teleconferencia audiovisual. Control de conferencia genérica Protocolo de servicio de comunicaci¢n multipunto. Especifica los mensajes de protocolo necesarios segun T.122. Transferencia de imágenes fijas multipunto y protocolos de anotación sobre esas imágenes. Transferencia de ficheros multipunto. Puede haber transferencias simultáneas de ficheros y niveles de prioridad para su distribución. Control audio visual para sistemas multipunto multimedia En la siguiente figura vemos cómo el estándar T.120 permite la interoperabilidad entre las capas de aplicación, de red y de transporte bajo H.323 que es uno de los estándares más comunes de videoconferencia. Figura 1. Interoperabilidad de la serie de recomendaciones T.120 con las demás capas. 5. ESTÁNDARES DE VIDEOCONFERENCIA H.320 Este estándar establece los conceptos básicos para el intercambio de audio y vídeo en un sistema de videoconferencia punto a punto o multipunto sobre redes que utilizan un canal con ancho de banda garantizado como RDSI. Redes – Estándares de videoconferencia Es la base para todos los sistemas de videoconferencia y garantiza la interoperabilidad de distintos fabricantes. Se encarga de definir las fases del establecimiento de una llamada y de definir 16 tipos distintos de terminales audiovisuales y sus modos de operación. Permite videoconferencia de alta calidad pero con ciertas limitaciones: requiere una infraestructura de red elevada al tener que ir por separado la parte de datos y la de vídeo, lo cual incrementa el coste. - no permite conectarse a un servidor por lo que no puede soportar servicios suplementarios de enrutado o tranferencia de llamadas. La codificación de vídeo se hace según el estándar H.261, mientras que la de audio se realiza según G.711, aunque puede soportar G.722 con el que se obtiene mayor calidad y G.728 que tiene menos requerimiento de ancho de banda. La velocidad de la red por la que H.320 interconecta los terminales de vídeo y los sistemas de videoconferencia es de 54 ó 64 Kbps a 2048 Kbps. Como protocolo de transporte utiliza H.221. Figura 2. Arquitectura de protocolos en videotelefonía RDSI según la recomendación H.320 H.321 Es el estándar de adaptación de H.320 (pensado para RDSI) a ATM, y para garantizar la interoperabilidad entre ambas redes aprovecha toda la infraestructura de H.320 como son los estándares H.261, H.221 y H.242. Redes – Estándares de videoconferencia Sin embargo, H.321 no aprovecha todas las ventajas que proporciona ATM por las siguientes razones: 1.al usar el estándar H.261 la transmisión de vídeo queda limitada a 2 Mbps mientras que usando otros estándares de vídeo podría aprovechar mejor el ancho de banda que ofrece ATM. 2.al usar AAL1 (ATM Adaptation Layer 1) con una tasa de bits constante no puede obtener las ventajas que ofrecería el servicio VBR de una tasa de transmisión variable. H.322 Es una extensión del estándar H.320 a redes de área local que garantizan el ancho de banda combinando las capacidades de RDSI (WAN) y 10BaseT (LAN). Proporciona una calidad de video equivalente a la basada en RDSI y es necesario que los terminales dispongan de los mecanismos de sincronización de la RDSI. Un ejemplo de ello lo ofrece ISO-Ethernet que proporciona a las estaciones los canales B y D de la RDSI haciéndolos llegar desde el hub hasta las estaciones que siguen disponiendo de un canal exclusivo para Ethernet 10-BaseT. Figura 3. Interconexión de videoconferencias basada en circuitos. H.323 Es considerado por la ITU más que como un estándar como una recomendación de forma que queda abierta para que los distintos fabricantes se adapten a ella según sus necesidades, permitiendo así que los usuarios se comuniquen sin tener que preocuparse de la compatibilidad entre sus sistemas. Se centra en la descripción de las comunicaciones multimedia entre terminales, equipos de redes y servicios en redes LAN, de forma que es el estándar utilizado para el establecimiento de videoconferencias sobre redes que no tienen garantizado el ancho de Redes – Estándares de videoconferencia banda y no tienen un retardo fijo, como son Ethernet, Token Ring o Internet. Se caracteriza por utilizar las ventajas que aportan las redes de conmutación de paquetes para el tráfico en tiempo real. Se ocupa además de gestionar el ancho de banda disponible para evitar que la LAN se colapse con la transmisión de audio y vídeo limitando el número de conexiones simultáneas. Los componentes definidos dentro de H.323 son: Terminal: es un extremo de la red que proporciona comunicaciones bidireccionales ( como señales de control, audio, vídeo o datos) en tiempo real con otro terminal H.323, gateway o unidad de control multipunto (MCU). Gatekeeper: realiza la traducción de direcciones y el control de acceso a la red de los terminales H.323, gateways y MCUs, además puede gestionar el ancho de banda y la localización de los gateways o pasarelas. Gateway: proporciona comunicaciones bidireccionales en tiempo real entre terminales H.323 en la red IP y otros terminales o gateways en una red conmutada. Es una pasarela entre el entorno de vídeo sobre IP H.323 y el entorno vídeo sobre RDSI H.320. - MCU: permite que tres o más terminales y gateways participen en una conferencia multipunto. Estos componentes interoperan con otros estándares en el otro extremo de la comunicación de la forma representada en la figura 4. Redes – Estándares de videoconferencia Utiliza H.261 y H.263 para la codificación de vídeo. Para audio usa los estándares G.711 y G.723. Y T.120 para conferencias con datos. H.323 usa la norma H.245 para llevar a cabo tareas tales como fijar el establecimiento de llamadas, el intercambio de la información, la terminación de las llamadas y la forma de codificar y decodificar. Las ventajas que aporta H.323 respecto a H.320 son: reducción de los costes de implantación: mientras que H.320 requiere doble cableado para transportar audio y vídeo, H.323 puede utilizar conexiones WAN. H.320 es un estándar orientado a terminal mientras que H.323 tiene sus capacidades distribuidas a través de la red lo que le permite disponer de funciones de comunicación complementarias. H.324 Este estándar define una terminal multimedia para la comunicación de voz, datos y vídeo sobre la red telefónica conmutada pública. Para ello utiliza módems sin detección ni corrección de errores para evitar los retrasos debidos a retransmisiones. Utiliza el estándar G.723 para la codificación de voz, H.263 para la codificación de vídeo, H.245 para el control y H.223 para multiplexación. La calidad de audio y vídeo es peor que la ofrecida por H.320 pero tiene los beneficios de ser una tecnología de bajo coste y que aprovecha red telefónica. H.310 Es la adaptación de los estándares de audio y vídeo sobre ATM. Contempla, además de H.261 y G.711, el uso del método de compresión MPEG. Permite soportar aplicaciones simétricas como la videoconferencia y asimétricas como el vídeo bajo demanda, servicios de mensajería y servicios de distribución como la TV broadcast. Este estándar incluye H.321 para la interconexión con otras redes. Y tiene la particularidad de definir distintos tipos de terminales según la capa de adaptación ATM en la que esté soportada la videoconferencia. Redes – Estándares de videoconferencia 6.- ESTÁNDARES DE CONTROL H.221 Define la estructura de la trama audiovisual en uno o en múltiples canales B de redes RDSI agrupados, utilizando así un ancho de banda de 64Kbps a 2Mbps. Esta trama permite multiplexar en los canales B información diversa como: audio y vídeo codificados o señales de control del sistema que son transportadas en un canal de señalización permanentemente abierto de que dispone la trama H.221. Figura 5. Estructura de trama H.221 sobre un acceso básico RDSI H.225 Estándar utilizado para dar formato a las tramas de vídeo, audio, datos y control para lanzarlos y recuperarlos de la red. Sus tareas son: definir la forma de empaquetar el vídeo, el audio y los datos en bits o paquetes para su transmisión por la red. determinar el orden de los paquetes. detectar errores que puedan producirse en la transmisión. Además, lleva a cabo las tareas de registro, admisión y control del canal de señalización RAS que realiza las conexiones entre el gatekeeper y los demás componentes. H.230 Establece el modo de realizar el refresco de las imágenes y la conmutación entre audio y vídeo en una multivideoconferencia. Define las señales de control y de indicación relacionadas con el vídeo, audio, gestión y el multipunto de una conferencia, y especifica, además, una tabla de códigos con las circunstancias bajo las cuales los códigos de control y de indicación son obligatorios u opcionales. Redes – Estándares de videoconferencia H.242 Define los protocolos para la negociación y establecimiento de videoconferencias entre terminales a través de canales digitales de hasta 2 Mbps. Se encarga de negociar las mejores características para mantener la videoconferencia. H.245 Estándar de control y señalización de llamada que permite a las terminales compatibles H.323 conectarse unas con otras. Se encarga de negociar parámetros como la razón de bits, razón de tramas y el formato de imagen, así como de la apertura y cierre de canales lógicos, peticiones de preferencia y mensajes de control de flujo. Principales webs consultadas: www.cs.ucl.ac.uk./staff/jon/jip/h323/h323_primer.html http://greco.dit.upm.es/~leverage/conf1/bellido.htm http://www.microsoft.com/windows/NetMeeting/Corp/reskit/Chapter11/default.asp http://www.comunicaciones.unitronics.es/tecnologia/H.323.html www.tid.es/presencia/publicaciones/comsid/esp/articulos/vol72/rdsi/videocom.html http://neutron.ing.ucv.ve/revista-e/No5/MMata.htm