Fue a finales de 1800 cuando Thomas A. Edison inventó (o tomó prestada la idea) de lo que se convertiría en el primer dispositivo de grabación de voz de la historia: el fonógrafo.

Este dispositivo convertía la voz humana en señales eléctricas que se registraban sobre una película de un material específico y que posteriormente se podían reproducir.

No se tardaría mucho en trasladar este invento al ya establecido telégrafo y, en consecuencia, dar lugar al nacimiento de la telefonía.

Con el paso del tiempo el ser humano ha ido perfeccionando las técnicas de muestreo de señales analógicas (la voz lo es) y ha dado paso a los procesos de digitalización: muestreo y cuantificación.

Gracias a estos sistemas cualquier señal puede ser representada por un número finito de bits, ya sabéis, cero o uno, y por tanto almacenada de forma mucho más sencilla.

Para el proceso de muestreo se hace uso de un teorema que desarrolló Harry Nyquist a principios del siglo XX y que de forma muy resumida y ligera viene a decirnos que para que no se pierda información la cantidad de muestras que deben tomarse de una señal debe ser el doble de su ancho de banda (cantidad de banda que ocupa esa señal). Tenéis el teorema mucho mejor explicado en este enlace: Teorema de Nyquist, pero sirva esa pequeña explicación para poder entender las limitaciones de muestreo.

Siguiendo con esta idea, estudios sobre el funcionamiento del oído humano demostraron que, de media, un oído común es capaz de detectar señales del rango entre 20 Hz y 20.000 Hz pero que nos basta con un ancho de banda entre 300 y 3.400 Hz para identificar correctamente el tono y el significado del habla humana.

Es comprensible que se buscase desde el comienzo minimizar los recursos necesarios para permitir la comunicación de voz y por ello se estableció el rango de frecuencias de hasta 4.000 Hz como estándar.

Así, haciendo uso del teorema de Nyquist necesitaríamos el doble de muestras para no perder información, esto es, 8.000 muestras por segundo.

El segundo aspecto del proceso de digitalización es la cuantificación: asignar un valor numérico a un determinado valor analógico. Aquí hay pérdida de información inherente y es imposible evitarla puesto que no podemos representar una escala infinita (mundo analógico) mediante una escala finita (mundo digital). Se estableció que cada muestra se representaría por un byte (8 bits).

Con esta información es bastante sencillo calcular el total de ancho de banda en bytes que se requiere para la comunicación de voz estándar: 8.000 muestras por segundo, 1 byte por muestra = 8.000 bytes por segundo o, lo que es lo mismo, 64.000 bits por segundo (64 kbps).

Se conoce como Digital Signal 0 (DS0) al canal básico de telefonía cuyo ancho de banda es, como podréis intuir, de 64 kbps.

Una vez alcanzada la capacidad de digitalizar la señal era cuestión de tiempo que los ingenieros de redes desarrollaran la posibilidad de enviar la información de voz a través de las redes de interconexión de datos actuales pasando de una conmutación de circuitos donde se establecía un circuito único entre emisor y receptor a una conmutación de paquetes donde pequeñas porciones de la comunicación viajan por distintos caminos desde el emisor para ser recibidas, ordenadas y correctamente escuchadas por el receptor, dando origen a lo que conocemos como Voz sobre IP.

Gracias a esta tecnología disponemos en la actualidad de la capacidad de integrar todos los servicios de comunicación: voz, vídeo y datos a través de una única red de intercomunicación lo que, sumado a los altos anchos de banda que se están alcanzando, nos abre la puerta a una amplia cantidad de aplicaciones de comunicación.