Princípios da teoria rate-distortion
Tendencialmente os dados de imagem possuem um elevado grau de redundância espacial, o que significa que os valores dos pixéis tendem a repetir-se com muita frequência. Por outro lado, os dados de imagem são destinados essencialmente à apresentação a um utilizador humano e, por isso, como forma de diminuir ao mínimo possível o débito binário fundamental para a obtenção de um fluxo de dados de imagem é crucial explorar as características de cada componente do sistema de compressão com perdas.
Nos sistemas de compressão com perdas, a compressão é obtida através da exploração das redundâncias espaciais contidas na imagem e das características perceptivas do sistema visual humano, fazendo com que a perda introduzida pela compressão seja imperceptível ao sistema visual do utilizador humano.
Função rate-distortion para imagens
A compressão com perdas, dada a eliminação de informação, fornece rácios de compressão mais elevados que a compressão sem perdas. No entanto, em qualquer sistema de compressão com perdas existe uma solução de compromisso entre a perda (distorção), D, que se pretende minimizar e o débito binário do fluxo de dados comprimido, R, que também se pretende minimizar para comprimir a informação da imagem.
Assim, o valor de R exprime-se em bits por cada símbolo codificado (pixéis) e o valor de D é normalizado pela variância dos dados de entrada no codificador. O rácio de compressão correspondente a um determinado débito binário obtém-se dividindo o débito binário da imagem de entrada (profundidade de cor) pelo débito binário (R) da imagem comprimida.
Quantificação
A principal forma de compressão em qualquer método de compressão com perdas é constituída pelo processo de quantificação dado que é durante este processo que ocorre a perda.
Antes da quantificação, a imagem pode conter um grande número de valores distintos para codificar a cor e o brilho dos pixéis. O algoritmo aplicado pelo quantificador, para na redução do número total de valores diferentes necessário para a apresentação de uma imagem digital com eficiência, determina a forma como os valores de entrada serão distribuídos pelos níveis de quantificação disponíveis à saída do quantificador. Os valores de entrada e de saída do quantificador podem ser escalares que podem ser uniformes ou não-uniformes.
O quantificador escalar uniforme reparte os valores de entrada por intervalos de quantificação com uma largura fixa. Os limites dos intervalos de quantificação designam-se por fronteiras de decisão do quantificador e os valores de entrada que se situam dentro de cada intervalo de quantificação são substituídos pelo valor médio do mesmo intervalo. A largura de cada intervalo de quantificação é designada por passo de quantificação e representa-se pelo símbolo .
Os quantificadores escalares uniformes podem ser de dois tipos: midtread e midrise.
Os primeiros (midtread) possuem o 0 como um dos seus valores de saída, ou seja, como um dos níveis de quantificação, sendo utilizados quando se necessita de um número impar de intervalos de quantificação. Contrariamente, no segundo tipo de quantificadores (midrise) não existe nenhum intervalo de quantificação com o valor 0, pelo que mapeiam um valor 0 de entrada num intervalo de quantificação diferente de 0, sendo utilizados quando se necessita de um numero par de intervalos de quantificação.
O quantificador midtread é útil nas situações onde existem vários valores próximos de 0 nos dados de entrada que são quantificados no valor 0 à saída.
O quantificador escalar não uniforme recorre a intervalos de quantificação que contêm larguras diferentes, consoante a região do sinal de entrada a que se aplicam. Existem dois tipos de quantificação não-uniforme: o quantificador Lloyd-Max e o quantificador companhed.
O algoritmo do quantificador Lloyd-Max permite, a partir de uma estimativa inicial dos valores dos níveis de quantificação, estimar alternativamente as fronteiras de divisão óptimas, partindo da estimativa actual dos níveis de quantificação óptimos. Posteriormente, a estimativa dos valores dos níveis de quantificação é actualizada utilizando os novos valores que determinou para as fronteiras de decisão. Este processo é repetido tantas vezes quantas as necessárias até que os níveis de quantificação sejam convergentes.
No quantificador companhed, o sinal de entrada é inicialmente mapeado por uma função compressora e seguidamente quantificado por um quantificador uniforme. Posteriormente à transmissão ou armazenamento e recuperação, os valores quantificados têm de ser obtidos através da operação inversa.
Fonte: Ribeiro, Nuno; Torres, José. Tecnologias de Compressão Multimédia. 3ª Edição. FCA – Editora de Informática, Lda. 2007.
Sem comentários:
Enviar um comentário