Details
Nothing to say, yet
Nothing to say, yet
Sampling is the process of discretizing time, while quantization is the process of discretizing amplitude. Quantization is the result of sampling, where a continuous analog signal is converted into discrete digital values. Digitalization is the conversion of analog information into binary values. The number of bits used for quantization determines the resolution of the digital signal. Cameras and printers use pixels to represent images, and the resolution is determined by the number of pixels. The RGB color model is based on the additive combination of red, green, and blue. The CMY color model is based on the subtractive combination of cyan, magenta, and yellow. The human eye is more sensitive to luminance (brightness) than to chrominance (color). The YCbCr color model is commonly used for representing colors in digital images and videos. Luminance requires more bits for encoding compared to chrominance. The human eye is less sensitive to blue compared to other primary colors. In pract Textos que sĂ£o chave, vamos iniciar aqui, amostragem tem a ver com tempo discreto e quantizaĂ§Ă£o tem a ver com amplitude discreta. A quantizaĂ§Ă£o Ă© a correspondĂªncia de uma quantidade analĂ³gica consequĂªncia de bits e a quantizaĂ§Ă£o ocorre a partir da amostragem, ou seja, em intervalos de tempos iguais eu tenho a minha amostragem, que vai levar a quantizaĂ§Ă£o. Novamente outras frases chave, analĂ³gica tem a ver com intensidade, nĂºmero real. Valores binĂ¡rios sĂ£o dĂgitos, nĂºmeros inteiros. O processo de digitalizaĂ§Ă£o Ă© um processo de conversĂ£o da informaĂ§Ă£o analĂ³gica para valor binĂ¡rio, ou seja, analĂ³gico que Ă© intensidade, nĂºmero real, eu passo para valores binĂ¡rios, dĂgitos e nĂºmeros inteiros. A amostragem Ă© um tempo discreto e quantizaĂ§Ă£o Ă© uma amplitude discreta. Signos da digitalizaĂ§Ă£o, armazenamento, preservaĂ§Ă£o da informaĂ§Ă£o, fiel e idĂªntica, manipulaĂ§Ă£o, programas, extensa gama de aplicações. Sinal real analĂ³gico Ă© representado por um sinal senoidal, ele Ă© perfeito, uma perfeita senoide e um sinal amostrado e quantizado, ele Ă© aquela senoide como se fossem umas escadinhas, Ă© o senoide de escadas, que Ă© o sinal amostrado e quantizado. CĂ¢meras digitais, nĂ³s estamos falando em megapixels, impressoras e scanners, estamos falando em DPI, que Ă© Dots Per Inch, quando se fala em resoluĂ§Ă£o, se fala em nĂºmero de pixels por unidade de espaço ou Ă¡rea, importante agora, um bit, ele representa a imagem preto e branco, puros, tipo fax, ok, aqui a gente estĂ¡ falando em codificaĂ§Ă£o de cores para pixel, entĂ£o um bit Ă© uma imagem preto e branco, puro, tipo fax, ok, um byte seria 256 tons de cinza, que Ă© 2 elevado a oitava, Ă© tipo uma TV preto e branco, dois bytes jĂ¡ sĂ£o 64 mil cores, que Ă© 2 elevado a 16, selecionadas de uma paleta, trĂªs bytes, Ă© um byte para cada cor, sĂ£o 16,7 milhões de cores, ok, pixel Ă© uma amostra da imagem original, um pixel Ă© o menor elemento de informaĂ§Ă£o em uma imagem, quanto mais pixels se usa para representar uma imagem capturada por algum dispositivo mais prĂ³ximos ela se assemelha Ă imagem original, quando se fala em resoluĂ§Ă£o espacial, se fala em nĂºmero de pixels em uma imagem, quando se fala em nĂºmero de elementos de sensor de imagem, se fala em neologismo sem seu, quando se fala em nĂºmero de elementos de imagem em exibiĂ§Ă£o digital, a gente estĂ¡ falando entĂ£o em artes, relĂ³gios, indicadores de temperatura e etc, qual a diferença entre pixel e sensor? Nas cĂ¢meras temos algo semelhante aos pixels, mas sĂ£o diferentes, pois os pixels de imagem saem da imagem e vĂªm aos seus olhos, agora quando se fala em sensor, se fala em sensores, como se fossem pixels e eles recebem a luz, e a luz ali Ă© um processo de transduĂ§Ă£o que recebe luminosidade para a corrente elĂ©trica, isso acontece nas mĂ¡quinas fotogrĂ¡ficas e para diferenciar isso se usa a palavra sensor, a diferença entre pixel e sensor Ă© que o primeiro vocĂª estĂ¡ olhando e no segundo Ă© a mĂ¡quina que estĂ¡ olhando, para se calcular um valor em megapixel Ă© simples, vocĂª multiplica a largura em pixels vezes a altura em pixels e divide por um milhĂ£o, essa Ă© a forma de vocĂª representar entĂ£o a conversĂ£o de pixels para megapixels, por exemplo, se vocĂª tiver uma resoluĂ§Ă£o de 1280 por 1024 pixels, basta que vocĂª multiplique 1280 por 1024 que vai dar um milhĂ£o trezentos e dez setecentos e vinte e divide por um milhĂ£o que vai dar um vĂrgula trinta e um megapixels. Quanto representa o campo de visĂ£o humano? O campo de visĂ£o humano corresponde aproximadamente a uma matriz de trĂªs mil por trĂªs mil pixels, isso Ă© importante, o nĂºmero de pixels nos revela apenas a resoluĂ§Ă£o espacial, mas nĂ£o a gradaĂ§Ă£o de intensidade, cor ou luminosidade, como as cores podem ser representadas? Qualquer cor pode ser obtida com uma mistura, combinaĂ§Ă£o linear de apenas trĂªs cores bĂ¡sicas, isso Ă© importante, o que Ă© o modelo de representaĂ§Ă£o de cores RGB? O modelo ou sistema de representaĂ§Ă£o de cores mais utilizado e baseado na combinaĂ§Ă£o linear das cores bĂ¡sicas, vermelho, verde e azul, essas sĂ£o as cores primĂ¡rias aditivas usadas no sistema RGB, Red, Green and Blue, tambĂ©m conhecido como sistema aditivo de cores, o sistema RGB Ă© representado por um cubo com uma cor em cada vĂ©rtice. Como se dĂ¡ o esquema de cores no RGB? No cubo RGB o preto Ă© representado pela origem e as cores primĂ¡rias vermelho, verde e azul sĂ£o representadas pelos vĂ©rtices adjacentes Ă origem, o branco Ă© representado pelo vĂ©rtice oposto, a origem diagonal e as cores secundĂ¡rias sĂ£o o ciano turquesa, a magenta que Ă© o roxo e o amarelo, sĂ£o representadas pelas demais vĂ©rtices, medidas importantes, preto e azul, 0 0 0, ele nĂ£o tem nenhuma das representações RGB, ele estĂ¡ em um dos vĂ©rtices, o azul Ă© 0 0 1 Ă© outro vĂ©rtice, o vermelho Ă© 1 0 0 Ă© outro vĂ©rtice e o verde Ă© 0 1 0, agora aqui no outro sistema, a gente tem que o preto Ă© o inĂcio lĂ¡, Ă© a origem das coordenadas, Ă© 0 0 0, o azul Ă© 0 0 1, o vermelho Ă© 1 0 0 e o verde Ă© 0 1 0, agora o magenta Ă© 1 0 1, esse Ă© o magenta, o ciano Ă© 0 1 1 e com isso nĂ³s temos essas para ser decorado, de novo, preto Ă© 0 0 0, o vermelho Ă© 1 0 0, o azul Ă© 0 0 1, o ciano Ă© 0 1 1, o verde Ă© 0 1 0, o amarelo Ă© 1 1 0 e o magenta Ă© 1 0 1. Funciona o sistema de cores CNY, o CNY Ă© sigla para Cyan, Magenta e Yellow, ou seja, o azulzinho claro, o magenta e o amarelo, ok? EntĂ£o, eles sĂ£o cores primĂ¡rias subtrativas, nĂ³s estamos falando sobre o aditivo que Ă© o RGB e agora nĂ³s estamos falando do aditivo, sim, o subtrativo que Ă© o CNY, entĂ£o as cores primĂ¡rias no subtrativo Ă© o Cyan, Magenta e Yellow, agora as cores primĂ¡rias no aditivo Ă© o Red, Green e Blue, entĂ£o hĂ¡ uma diferença aĂ. Uma outra representaĂ§Ă£o de nĂºmeros para as trĂªs dimensões de cores Ă© o branco, o branco Ă© 1 1 1, enquanto preto Ă© 0 0 0, enquanto o azul Ă© 0 0 1, enquanto o vermelho Ă© 1 0 0, enquanto o verde Ă© 0 1 0. Importante, as cores secundĂ¡rias do sistema aditivo sĂ£o as cores primĂ¡rias do sistema subtrativo, ou seja, quem sĂ£o as cores primĂ¡rias do sistema aditivo? É o Red, Green e Blue, que Ă© o RGB. E quem sĂ£o as cores primĂ¡rias do sistema subtrativo? O subtrativo Ă© o Cyan, Magenta e Yellow, ok, o amarelo, entĂ£o elas sĂ£o as cores primĂ¡rias do sistema subtrativo. Agora, se a gente falar as cores secundĂ¡rias do subtrativo, sĂ£o as primĂ¡rias do aditivo, que Ă© o RGB. E se a gente falar nas cores secundĂ¡rias do sistema aditivo, a gente vai falar no Cyan, Magenta e Amarelo. Importante, os pigmentos reais sĂ£o contaminados pelo branco, na prĂ¡tica nĂ£o Ă© possĂvel obter a cor preta, combinando apenas o Cyan, Magenta e Yellow, por isso que adiciona-se tinta preta, o Black, de forma que forma o sistema CMYK, onde K Ă© de Black. Super importante, RGB, eles adicionam luz, por isso que eles sĂ£o aditivos. O CMY, que Ă© o Cyan, Magenta e Yellow, eles absorvem luz, ou seja, absorĂ§Ă£o de luz que subtraem, subtrativos, ok? E outra coisa bem importante tambĂ©m, o que Ă© Matiz? Matiz, o comprimento de onda luminosa predominante em uma imagem, exemplo, mais vermelho que azul, essa Ă© a Matiz. A luminĂ¢ncia, o quanto uma imagem estĂ¡ clara ou escura, Ă© o que dĂ¡ aquela questĂ£o da sombra, presença de sombras, luminĂ¢ncia. SaturaĂ§Ă£o, a proporĂ§Ă£o da quantidade de cor em relaĂ§Ă£o Ă cor cinza mĂ©dia, saturaĂ§Ă£o Ă© cor cinza mĂ©dia, que possui saturaĂ§Ă£o zero, ok? EntĂ£o, guarde isso, o Matiz tem a ver com onda de luminosidade predominante em uma imagem, mais vermelho do que azul. LuminĂ¢ncia, aqui a imagem estĂ¡ clara ou escura, lembra de luz, luminĂ¢ncia, clara ou escura, e a saturaĂ§Ă£o Ă© a questĂ£o do cinza, com relaĂ§Ă£o Ă cor cinza, que possui saturaĂ§Ă£o zero, o zero na cor cinza Ă© saturaĂ§Ă£o zero. Lembrando que Nuance e Matiz Ă© a mesma coisa, ok? A luminĂ¢ncia Ă© o brilho, a saturaĂ§Ă£o tem a ver com a predominĂ¢ncia do comprimento de onda, predominante na imagem, e a Matiz Ă© aquilo que dĂ¡ um ambiente calmo, tranquilo, porque vocĂª varia entre o vermelho e o azul. É bem importante agora, no sistema YCbCr, nĂ³s entĂ£o temos a seguinte situaĂ§Ă£o, ok? O Y, ele Ă© um componente de iluminaĂ§Ă£o, luminĂ¢ncia, o Cb Ă© um componente de diferença de croma, ele Ă© azul, e o Cr Ă© o componente de diferença de croma vermelho, ok? Croma Ă© a abreviatura de crominĂ¢ncia, conjunto de informações de cor, ok? O YCb e o Y'CbCr Ă© uma famĂlia de espaços de cores, usados como parte do processo de representaĂ§Ă£o de cores, de uma imagem, de um vĂdeo ou de sistemas de fotografia digital, ok? Agora Ă© bem importante isso que eu vou falar, vocĂª vĂª que o Y, ele Ă© o componente de iluminaĂ§Ă£o, Ă© a luminĂ¢ncia, agora o Y' , o Y com apĂ³strofe, ele Ă© o luma, viu a diferença? O Y normal, luminĂ¢ncia, Y com apĂ³strofe Ă© o luma, ok? Quando eu ponho isso somente em luminĂ¢ncia, eu tenho sĂ³ o Y, quando eu penso em luma, aĂ eu jĂ¡ tenho o removo da luminĂ¢ncia, cromitĂ¢ncia, que eu quero, tenho sĂ³ a luma, tĂ¡? A luma Ă© o brilho da parte acromĂ¡tica da imagem. Portante, os seres humanos, eles sĂ£o muito mais sensĂveis Ă luminĂ¢ncia do que Ă crominĂ¢ncia, conforme pode-se observar no prĂ³ximo slide aqui, mas enfim, fica com isso na cabeça, os seres humanos sĂ£o muito mais sensĂveis Ă luminĂ¢ncia, luminĂ¢ncia estĂ¡ a ver com luminosidade, lembra? Do que Ă crominĂ¢ncia, lembrando novamente que a luminĂ¢ncia tem a ver com a imagem estĂ¡ clara ou escura, ok? A luminĂ¢ncia Ă© o brilho da imagem, quando estĂ¡ claro ou escuro e presença de sombras, entĂ£o novamente, quando a gente fala aqui do ser humano, os seres humanos sĂ£o muito mais sensĂveis Ă luminĂ¢ncia, ao brilho, nĂ©? Do que Ă crominĂ¢ncia. Sobre a luminĂ¢ncia, bem importante, a luminĂ¢ncia ela requer mais bits para a codificaĂ§Ă£o, pois sempre Ă© um processo de prever, sempre Ă© preciso prever a transformaĂ§Ă£o de uma imagem colorida em preto e branco, tons de cinza, entĂ£o aĂ vocĂª usa aquele 8 bits lĂ¡, mas isso Ă© informaĂ§Ă£o importante, a luminĂ¢ncia ela requer mais bits para a sua codificaĂ§Ă£o. InformaĂ§Ă£o importante, o olho humano Ă© menos sensĂvel ao azul em relaĂ§Ă£o Ă s outras cores primĂ¡rias, muito importante. Muitos sistemas prĂ¡ticos nĂ£o suportam true color, nesse caso se usa o conceito de paleta, o valor do pixel nĂ£o Ă© enviado ao monitor, mas serve de Ăndice para uma tabela de cores ou paleta, tĂ¡? EntĂ£o a paleta fixa Ă© o nĂºmero total de cores, Ă© limitado ao tamanho da paleta, normalmente igual a 256. Importante aqui pessoal, imagens nĂ£o sĂ£o realistas, mas pode-se trocar resoluĂ§Ă£o espacial por resoluĂ§Ă£o de cores usando dithering, lembra do dithering? Alternando cores em pixels prĂ³ximos, criando a ilusĂ£o de uma gradaĂ§Ă£o real, o olho enxerga como uma mistura de cores, ok? Importante vocĂª ver o dithering. DefiniĂ§Ă£o importante, as ondas sĂ£o produzidas pela vibraĂ§Ă£o, eu estou falando de ondas sonoras, ok? As ondas sĂ£o produzidas pela vibraĂ§Ă£o de um corpo sonoro, que se espalham atravĂ©s do ar, trazendo para o tĂmpano um estĂmulo que a mente interpreta como som, ok? Isso aqui Ă© uma definiĂ§Ă£o de Galileu. Novamente, as ondas sĂ£o produzidas pela vibraĂ§Ă£o de um corpo sonoro, que se espalham atravĂ©s do ar, trazendo para o tĂmpano um estĂmulo que a mente interpreta como som, ok? Altura e intensidade do som. Altura, ela classifica os sons em graves ou agudos. Quanto maior a frequĂªncia, mais agudo. Quanto menor a frequĂªncia, mais grave. E a intensidade, som forte ou som fraco, Ă© a taxa de energia por unidade, unidade diĂ¡ria, inclui a pressĂ£o exercida por ondas propagando-se. Quais sĂ£o as etapas do processo de digitalizaĂ§Ă£o? Um, amostragem. Dois, quantizaĂ§Ă£o. TrĂªs, codificaĂ§Ă£o. SĂ£o trĂªs etapas. O que Ă© amostragem? É um processo de captura instantĂ¢nea de um sinal analĂ³gico em intervalos regulares, lembrem-se, Ă© o mundo real em intervalos regulares, e o intervalo regular fixo entre as amostras Ă© determinada por pulsos de sincronismo. A frequĂªncia desses pulsos de sincronismo Ă© chamada de taxa de amostragem, e seu inverso da taxa de amostragem Ă© 1 sobre FA, Ă© o prĂ³prio intervalo fixo entre as amostras, tambĂ©m conhecido como perĂodo de amostragem. A conversĂ£o de um sinal analĂ³gico em sequĂªncia de amostras uniformemente espaçadas, ela gera um sinal discreto, trata-se de uma discretizaĂ§Ă£o do tempo. Isso Ă© muito importante, nĂ©? EntĂ£o vamos lĂ¡. QuestĂ£o prĂ¡tica importante referente Ă amostragem de sinais. Qual a taxa de amostragem mĂnima que devo utilizar assim de nĂ£o perder nenhuma informaĂ§Ă£o relevante presente no sinal analĂ³gico? Eu preciso de um critĂ©rio, de um parĂ¢metro ou de uma fĂ³rmula, ok? A perda de alguma informaĂ§Ă£o do seu som causarĂ¡ uma distorĂ§Ă£o, fazendo com que seu som seja diferente. Importante, Joseph Fourier, em 1807, ele revolucionou a matemĂ¡tica e a fĂsica, quando ele demonstrou matematicamente que qualquer funĂ§Ă£o periĂ³dica, ela Ă© composta por uma sĂ©rie infinita de senos e cossenos. Fourier tambĂ©m mostrou que todas as funções matemĂ¡ticas, leia-se todos os sinais analĂ³gicos, podem ser aproximados por meio de sĂ©ries trigonomĂ©tricas finitas. Leia-se de compostos em vĂ¡rios sinais senoidais de frequĂªncia, frequĂªncias crescentes. Vamos falar rapidamente aqui das definições, tĂ¡? A amostragem, um sinal do som, voz, por exemplo, Ă© amostrada em intervalos regulares. Em outras palavras, sĂ£o tiradas medidas de amplitude do sinal a intervalos de tempos especĂficos, ok? Que Ă© a quantizaĂ§Ă£o. Cada amostra obtida durante o processo de amostragem, ela Ă© atribuĂda a um valor digital correspondente. Um valor Ă© quantizado para um determinado nĂºmero de bits, o que determina a precisĂ£o da representaĂ§Ă£o digital. CodificaĂ§Ă£o. Os valores quantizados sĂ£o entĂ£o codificados em formato binĂ¡rio, geralmente usando representaĂ§Ă£o de complemento de dois. E o armazenamento ou transmissĂ£o, nĂ©? Os dados digitais resultantes podem ser armazenados em dispositivos de armazenamento digital, como os discos rĂgidos ou transmitidos por meio de canais digitais como redes de computadores. Muito importante agora, hein? Henry Niquist, em 1928, nĂ©? Henry Niquist, dos laboratĂ³rios Bell, nos Estados Unidos, estabeleceu que a representaĂ§Ă£o discreta, que seria a discretizaĂ§Ă£o no tempo, de um sinal analĂ³gico, seria funcionalmente idĂªntica Ă forma de onda original, se a taxa de amostragem fosse, pelo menos, pelo menos, duas vezes superior Ă mĂ¡xima frequĂªncia presente na forma de onda analĂ³gica. Ou seja, FA, que Ă© a taxa de amostragem, ele tem que ser maior do que duas vezes a frequĂªncia mĂ¡xima. Bem importante entĂ£o. Depois do teorema de Niquist, a voz humana, a qualidade de telefone, com uma frequĂªncia mĂ¡xima de 4.000 Hz, ela requer, no mĂnimo, 8.000 amostras por segundo, enquanto que um Ă¡udio qualidade de CD, com frequĂªncia mĂ¡xima de 20.000 Hz, requer, no mĂnimo, 40.000 amostras por segundo. Olha sĂ³, gente, Ă© muita amostra mesmo. Vamos lĂ¡, gente. Caso o teorema de Niquist nĂ£o seja obedecido, isto Ă©, se a amostragem for feita com uma taxa de amostragem menor que duas vezes a frequĂªncia mĂ¡xima, ocorrerĂ¡ um fenĂ´meno ou um efeito conhecido como aliasing, sem traduĂ§Ă£o exata, que pode ser entendido como o embaralhamento das frequĂªncias replicadas com as frequĂªncias do sinal original. EntĂ£o, o aliasing, ele torna impossĂvel a reversĂ£o do processo de amostragem, sem que ocorra uma distorĂ§Ă£o claramente audĂvel no caso do som. ImportantĂssimo, o que Ă© esse negĂ³cio da quantizaĂ§Ă£o? Vamos tentar falar de forma prĂ¡tica. Ele Ă© um processo de transformar a amplitude real de uma amostra do sinal em uma amplitude discreta, tomada de um conjunto finito de possĂveis amplitudes. EntĂ£o, assim, como o processo de amostragem Ă© uma discretizaĂ§Ă£o do sinal no tempo, a quantizaĂ§Ă£o Ă© uma discretizaĂ§Ă£o do sinal em amplitude. Importante isso, tĂ¡? O processo de amostragem Ă© uma discretizaĂ§Ă£o do sinal no tempo e a quantizaĂ§Ă£o Ă© uma discretizaĂ§Ă£o do sinal em amplitude. Essa parte Ă© bem importante, tĂ¡? Como vimos, a amostragem pode ser um processo sem perdas. HĂ¡ amostragem, porĂ©m a quantizaĂ§Ă£o Ă© sempre com perdas. Por quĂª? Porque ela tira amostras, nĂ©? EntĂ£o, os quantizadores podem ser classificados em uniformes e nĂ£o uniformes, dependendo da forma de espaçamento de seus nĂveis. NĂveis igualmente espaçados, quantizaĂ§Ă£o uniforme ou linear, ou caso contrĂ¡rio, temos a quantizaĂ§Ă£o nĂ£o linear. E isso, inclusive, Ă© curioso, porque tem um exercĂcio que o professor fez com relaĂ§Ă£o a essa questĂ£o da gente ter aquele, aquela, quando vocĂª faz um grĂ¡fico e vocĂª representa, vamos dizer assim, uma... EntĂ£o, Ă© uma exponencial. EntĂ£o, quando a gente fala nessa exponencial, que ela Ă© invertida, as duas pontas dessa exponencial, ela toca o eixo x no seu valor mĂ¡ximo e o eixo y no seu valor mĂ¡ximo. EntĂ£o, esse daĂ Ă© um sinal que ele Ă© uniforme. E aĂ, o que acontece? Com os vĂ¡rios valores que tem de intensidade, vocĂª tem maior probabilidade de erro. EntĂ£o, para resolver essa questĂ£o que sempre acontece, nĂ©, na uniformidade, vocĂª vai utilizar o mĂ©todo nĂ£o uniforme. E o mĂ©todo nĂ£o uniforme, ele aplica intensidades menores, valores menores para intensidades menores e valores maiores para intensidades maiores. EntĂ£o, esse Ă© um ponto bem importante tambĂ©m. CodificaĂ§Ă£o, que Ă© um dos processos, a terceira etapa do processo de digitalizaĂ§Ă£o. De forma mais ampla, a codificaĂ§Ă£o significa a modificaĂ§Ă£o das caracterĂsticas de um sinal para tornĂ¡-lo apropriado para uma aplicaĂ§Ă£o especĂfica. Como, por exemplo, transmissĂ£o ou armazenamento de dados, nĂ©? E aqui, gente, sĂ³ para exemplificar essa questĂ£o da codificaĂ§Ă£o, que do professor aqui estĂ¡ um pouco mais complicado, nĂ©? O chat GPT jĂ¡... CodificaĂ§Ă£o. Os valores quantizados sĂ£o, entĂ£o, codificados em formato binĂ¡rio, geralmente usando representaĂ§Ă£o de complemento de dois. EntĂ£o, isso que quer dizer a codificaĂ§Ă£o. Vamos falar que o professor nĂ£o colocou semelhante ao chat GPT, ele colocou aqui, sim. Tem um slide que significa o seguinte. CodificaĂ§Ă£o de Ă¡udio. O sinal digital de Ă¡udio, resultante deste processo completo de amostragem, quantizaĂ§Ă£o e codificaĂ§Ă£o Ă© uma sequĂªncia de bits conhecida como PCN. PCN, que Ă© o Pulse Code Modulation. E os arquivos de som, nos formatos AF e WAV ou AU, usam a codificaĂ§Ă£o PCN. As faixas de um CD de Ă¡udio contĂ©m sinais digitais amostrados a uma taxa de 44,1 kHz, com 16 bits por amostra. Pessoal, bem importante essa parte tambĂ©m que Ă© a reconstruĂ§Ă£o do sinal analĂ³gico. Para reconstruir a forma de onda analĂ³gica a partir de um sinal digitalizado, basta reverter o processo realizando os seguintes passos. Primeiro, vocĂª usa um tipo de circuito integrado chamado conversor digital analĂ³gico, Ă© o coder. Os bits sĂ£o reconvertidos para a representaĂ§Ă£o de amostras quantizadas. EntĂ£o, vocĂª usa lĂ¡ um filtro do tipo passa baixos, que sĂ£o completamente eliminadas as frequĂªncias replicadas, isto Ă©, todas as frequĂªncias maiores que a frequĂªncia mĂ¡xima, fazendo a forma de onda retornar ao formato analĂ³gico original, que Ă© aquela senoide perfeita, contendo apenas um erro de quantizaĂ§Ă£o, que serĂ¡ tanto menor quanto maior for o nĂºmero de bits utilizado. EntĂ£o, isso daĂ Ă© a forma de reconstruĂ§Ă£o do sinal analĂ³gico. Tante tambĂ©m, tĂ¡? É impossĂvel comprimir o som usando mĂ©todos totalmente sem perdas, lossless compression. Mas, para alguns casos especiais, vocĂª pode conseguir uma compressĂ£o com perda quase nula. Temos trĂªs casos a seguir. Primeiro, vocĂª pode ser obtido atravĂ©s de alguma compressĂ£o de trechos de Ă¡udio, usando a codificaĂ§Ă£o RLE, que Ă© o One Length Encoding, para amostras com amplitude abaixo de um linear, que pode ser considerado para representar o Ă¡udio. O dois, o uso do mĂ©todo denominado compensĂ£o, que utiliza a quantizaĂ§Ă£o nĂ£o linear, nĂ£o linear pessoal, para comprimir sinais de voz. As leis de compensĂ£o do tipo MICA e A, sĂ£o usadas na telefonia digital, que Ă© o sistema PCM. Lembra do sistema PCM? EntĂ£o, e o uso do mĂ©todo PCM, que Ă© o Adaptative Differential Pulse Code Modulation, que Ă© o ADPCM, que funciona atravĂ©s do armazenamento de informações sobre a diferença entre o valor real da amostra e o valor previsto na mesma, tambĂ©m Ă© usado na telefonia. EntĂ£o, veja bem, isso aqui foi uma coisa de prova. Ele pegou a definiĂ§Ă£o do compensĂ£o, falando que se o compensĂ£o fazia, ele era realmente essa diferença do real e da amostra, nĂ£o. O real da amostra Ă© o PCM, o ADPCM. O compensĂ£o, ele Ă© um mĂ©todo denominado, que utiliza a quantizaĂ§Ă£o nĂ£o-linear. Lembra da quantizaĂ§Ă£o nĂ£o-linear? EntĂ£o, aqui entra o compensĂ£o, ele usa essa quantizaĂ§Ă£o nĂ£o-linear. JĂ¡ o PCM, nĂ£o, o PCM aqui, ele vai fazer a diferença do valor real e da amostra, um valor previsto da mesma, entendeu? Isso que ele faz. Lembrando que o primeiro mĂ©todo Ă© o RLE, que tambĂ©m Ă© usado para fazer a compressĂ£o das imagens, lembra disso? A gente falou lĂ¡ do GIF, o TIFF, o TIFF com certeza usa. O GIF, o processo de compressĂ£o dele, vocĂª lembra? Ele usa, entĂ£o, a biblioteca, a biblioteca, porque ele tem o I, lembra disso? O TIFF tambĂ©m usa a biblioteca, os dois que usam. Agora, por exemplo, o Bitmap, ele jĂ¡ usa o RLE, e o RLE Ă© justamente esse aqui, ok? EntĂ£o, vamos continuar. Vamos fazer esse comentĂ¡rio aqui, que Ă© bem importante, Ă© princĂpios de compressĂ£o de Ă¡udio digital, Ă© Ă¡udio aqui, e aqui vocĂª usa o esquema de codificaĂ§Ă£o com perdas, que Ă© o Lossy Compression, baseado em fenĂ´menos psicoacĂºsticos. Lembra que o Lossy Compression nas imagens era o JPEG, lembra disso? Que ele utilizava, que era um sistema de perda, mas ele utilizava lĂ¡ o mĂ©todo de compressĂ£o, era a transcodificaĂ§Ă£o do seno, exatamente, transcriĂ§Ă£o do seno, alguma coisa assim. Aqui, o Lossy Compression, ele usa fenĂ´menos no Ă¡udio, ele usa fenĂ´menos psicoacĂºsticos, capazes de realizar compressĂ£o transparente e perceptivelmente sem perdas de sinais de Ă¡udio de alta fidelidade, ok? EntĂ£o, testes subjetivos de audiĂ§Ă£o realizados mostraram que com uma taxa de compressĂ£o 6 para 1, os sinais codificados e originais sĂ£o perceptivelmente indistinguĂveis, ou seja, 6 para 1 realmente Ă© complicado, nĂ©? Se o humano nĂ£o conseguir perceber essas perdas, Ă© como se essas perdas nĂ£o tivessem ocorrido, ok? Algumas pessoas tĂªm percepĂ§Ă£o de som maior que outras. Bom, aqui jĂ¡ Ă© som. O som tem aquele negĂ³cio chamado bandas crĂticas, que o ouvido interno representa o espectro de potĂªncias do sinal em escala nĂ£o-linear, na forma de bandas de frequĂªncia, bandas crĂticas. Aqui Ă© uma parĂ¡bola, tem um grĂ¡fico aqui que Ă© uma parĂ¡bola de cabeça para baixo e ela toca os dois pontos no eixo X, tem o X1 e o X2, os dois pontos tocam lĂ¡ o eixo das coordenadas, entendeu? EntĂ£o, aqui ele estĂ¡ caracterizando isso, tĂ¡? E vocĂª tem no eixo X a frequĂªncia em Hertz e vocĂª tem o ganho em decibĂ©is no eixo Y, ok? Agora vamos falar de mascaramento auditivo. Quando dois sinais, um sinal de baixa intensidade e outro sinal de alta intensidade ocorrem simultaneamente, estĂ£o prĂ³ximos em frequĂªncia. Isso, entĂ£o, se chama mascaramento auditivo. Bom, agora caracterĂsticas psicoacĂºsticas do sinal humano. Se o sinal mais fraco estiver abaixo de linear de mascaramento, o sinal mais forte o torna inaudĂvel, ou seja, ele vai sumir por conta do sinal mais forte. E dizemos que o sinal de baixa intensidade Ă© mascarado pelo sinal de alta intensidade. Este efeito Ă© mais intenso se os dois sinais ocorrem na mesma banda crĂtica, entendeu? EntĂ£o, aqui a gente tem lĂ¡ um grĂ¡fico em que mostra duas parĂ¡bolas, elas sĂ£o juntas, de concavidade para cima, e vocĂª tem entre a junĂ§Ă£o delas o ponto mais alto, que Ă© aquela crista, quando vocĂª pensa lĂ¡ numa senoidal, e vocĂª tem ali o sinal mascarante de 500 Hz. Ou seja, tudo que estiver abaixo desse linear de mascaramento, quando vocĂª olha para esse grĂ¡fico, ele vai ser entĂ£o mascarado, por conta desse sinal mascarante aĂ. A pessoa nĂ£o consegue ouvir abaixo dessa parĂ¡bola. E aĂ vocĂª tem a comparaĂ§Ă£o agora desse sinal mascarante com trĂªs outros sinais, os dois que estĂ£o na mesma frequĂªncia deles, e aĂ nĂ£o tem jeito, esses dois sinais nĂ£o vĂ£o ser ouvidos, porque ele Ă© o mascarante, os dois que estĂ£o abaixo ainda do linear de mascaramento vĂ£o ser, enfim, mascarados. Agora, o outro sinal, que seria o terceiro, o verde, esse daĂ jĂ¡ estĂ¡ no outro lado da banda, esse daĂ jĂ¡ estĂ¡ do lado da banda meio a meio, parte teoricamente nĂ£o seria ouvido e parte seria ouvido. Mas a questĂ£o Ă©, como ele nĂ£o estĂ¡ na mesma frequĂªncia do sinal mascarante, aquele grandĂ£o, aquele mais extenso, ele entĂ£o Ă© ouvido, esse sinal de frequĂªncia menor. Ele Ă© atĂ© menor frequĂªncia dele do que os outros que estĂ£o lĂ¡ junto na mesma faixa de frequĂªncia do sinal mascarante. Curioso isso. Informações importantes a respeito do mascaramento. Sinais de Ă¡udio reais podem ser decompostos em vĂ¡rios sinais tomos mascarantes em diferentes frequĂªncias. O linear de mascaramento global Ă© calculado a partir de todos os lineares individuais dos sons mascarantes. O linear de mascaramento Ă© uma funĂ§Ă£o da frequĂªncia variante no tempo, que indica o ruĂdo inaudĂvel mĂ¡ximo em cada frequĂªncia. PolĂªmica da prova. MP3, formato MP3. O MPEG 1 Audio Layer 3, mais comumente referido como MP3, Ă© um formato de codificaĂ§Ă£o digital de Ă¡udio patenteado. O MP3 Ă© o formato de compressĂ£o de Ă¡udio mais usado para armazenamento de Ă¡udio de consumo. HĂ¡ perdas. A sua efetividade de compressĂ£o Ă© medida em kbps, quilobits por segundo, sendo que 128 kbps Ă© a qualidade padrĂ£o mais usada na qual a reduĂ§Ă£o do tamanho do arquivo Ă© de cerca de 90%, ou seja, a razĂ£o Ă© de 10 para 1. Ainda sob o formato MP3, a sua taxa de compressĂ£o atualmente pode chegar atĂ© 320 kbps, a qualidade mĂ¡xima na qual a reduĂ§Ă£o do tamanho do arquivo Ă© de cerca de 25%, ou seja, uma razĂ£o de 4 para 1, passando antes por 192 kbps que Ă© 6,66 para 1, ou 256 kbps que Ă© de 5 para 1. EntĂ£o o mĂ©todo de compressĂ£o com perdas empregado na compressĂ£o do MP3, ele Ă© baseado no fenĂ´meno de mascaramento auditivo. MP3 Ă© baseado no fenĂ´meno de mascaramento auditivo. O processo de codificaĂ§Ă£o do formato MP3 Ă© o seguinte, sinal de Ă¡udio vem, o PCM, ele passa primeiro o processo que Ă© a rede de mapeamento tempo-frequĂªncia, em paralelo ele utiliza aquele modelo psicoacĂºstico, e depois da rede de mapeamento tempo-frequĂªncia ele jĂ¡ vai direto para o quantizador e codificador, aĂ ele passa pela montagem de quadro atĂ© gerar os fluxos de bits codificados. O codificador do formato MP3, a rede de mapeamento tempo-frequĂªncia decompõe o sinal de Ă¡udio em mĂºltiplas sub-bandas. O mapeamento Ă© feito em 3 bandas, vendo MP3, 3, 3 bandas, 3 camadas na verdade, nomeadas 1, 2 e 3, em ordem crescente de complexidade e desempenho perceptual subjetivo. O algoritmo da camada 3 Ă© o mais refinado e ficou popularmente conhecido como MP3, que Ă© o MPEG-1 Layer 3. Caiu isso na prova, hein? Agora o modelo psicoacĂºstico, ele analisa o conteĂºdo espectral do sinal de Ă¡udio e calcula a relaĂ§Ă£o sinal-mĂ¡scara, que Ă© o SM, para cada sub-banda. E o quantizador-codificador, que Ă© a outra etapa, ele realiza uma alocaĂ§Ă£o dinĂ¢mica de bits, de forma a minimizar a audibilidade do ruĂdo de quantizaĂ§Ă£o. EntĂ£o a montagem de quadros faz o empacotamento das amostras quantizadas no padrĂ£o MPEG-1. Muito legal isso, nĂ© gente? Agora a gente vai falar aqui o seguinte, o decodificador simplesmente reverte as operações de processamento de sinal realizadas no codificador, convertendo a sequĂªncia de bits recebida em um sinal de Ă¡udio no domĂnio do tempo. EntĂ£o Ă© isso aĂ, decodificador de formato MP3. Ele posteriormente foi desenvolvido o padrĂ£o MPEG-2, Ă¡udio para TV digital, utilizado no padrĂ£o europeu, com possibilidade de codificar atĂ© 5 canais de Ă¡udio home E a camada 1 alcança uma relaĂ§Ă£o de compressĂ£o de 4 para 1, com uma taxa de 384 kbps, estĂ©reo. EntĂ£o a correspondente relaĂ§Ă£o de compressĂ£o para as camadas MP3 sĂ£o 8 para 1 e 12 para 1, a uma taxa de 192 kbps, estĂ©reo. EntĂ£o a qualidade subjetiva do padrĂ£o MPEG-1, Ă© equivalente ao do CD PCM, 16 bits. Bem importante agora o Advanced Audio Coding, AAC, que Ă© o MPEG-4, AAC, Ă© um esquema de compressĂ£o de Ă¡udio digital com perdas. Ele pode ser concebido para ser o sucessor do formato MP3. O AAC geralmente alcança melhor qualidade de som do que o MP3 nas mesmas taxas de bits. O AAC foi padronizado pela ISO e pela IEC, como parte das especificações dos padrões MPEG-2 e MPEG-4. O AAC Ă© tambĂ©m o formato de Ă¡udio padrĂ£o para Iphone, Apple, iPod, iTunes, Playstation 3, Celular e Sony, Nintendo Wii, Nintendo DS e o padrĂ£o MPEG-4 VĂdeo. Melhorias do AAC sobre o MP3, comparativo, mais frequĂªncias de amostragem de 8 Hz a 96 kHz do que o MP3 de 16 a 48 kHz. Ele suporta atĂ© 48 canais de Ă¡udio. O MP3 suporta atĂ© 2 canais no modo MPEG-1 e atĂ© 5 canais no modo MPEG-2. A taxa de bits do AAC sĂ£o bits arbitrĂ¡rios e frames de comprimento variĂ¡vel. O banco de filtros mais simples e eficiente ao invĂ©s da codificaĂ§Ă£o hĂbrida do MP3. O AAC usa uma MDCT pura. Lembra-se que a MDCT Ă© transformada discreta de cosseno modificado. Isso aqui Ă© o MPEG, o JPEG, aqui Ă© o MPEG. O JPEG usava o DCT, que Ă© a discreta cosseno modificada. Bom, vamos lĂ¡, melhorias do AAC sobre o MP3, ainda nĂ£o acabou. Maior eficiĂªncia na codificaĂ§Ă£o de sinais estacionĂ¡rios. EntĂ£o o AAC usa um tamanho de bloco de 1,24 x 960 amostras e ela permite a codificaĂ§Ă£o mais eficiente do que os blocos fixos de 576 amostras do MP3. EntĂ£o mais precisĂ£o na codificaĂ§Ă£o de sinais transitĂ³rios. O AAC usa um tamanho de bloco de 128 ou 120 amostras e permite a codificaĂ§Ă£o mais precisa que os blocos fixos de 192 amostras do MP3. Ainda o formato A3, que Ă© o AAC, que Ă© sucesso. Ele usa um algoritmo de codificaĂ§Ă£o de Ă¡udio de banda larga que explora duas estratĂ©gias principais de codificaĂ§Ă£o para reduzir drasticamente a quantidade de dados necessĂ¡ria para representar Ă¡udio digital de alta qualidade. EntĂ£o, um, componentes sĂ£o perceptivelmente irrelevantes, sĂ£o descartados, se ele descarta mesmo, nĂ£o Ă© relevante, descartou. O AAC Ă© assim. RedundĂ¢ncia, os sinais sĂ£o eliminados. Deu redundĂ¢ncia, ele elimina. AAC Ă© fantĂ¡stico. EntĂ£o o processo de codificaĂ§Ă£o do AAC Ă© composto pelas seguintes etapas. Primeira, o sinal Ă© convertido do domĂnio do tempo para o domĂnio da frequĂªncia, que Ă© o negĂ³cio da transformada discreta cosseno modificada. Dois, o sinal do domĂnio de frequĂªncia Ă© quantizado e codificado com base em modelo psicoacĂºstico similar ao do MP3. Importante isso. NĂ£o Ă© sĂ³ o MP3 que tem psicoacĂºstico. O AAC tambĂ©m tem. SĂ£o irmĂ£os nesse processo. PsicoacĂºstico igual. E trĂªs, cĂ³digo de correĂ§Ă£o de erros de bit sĂ£o adicionados ao sinal digital codificado. Muito bom. Agora aqui Ă© aquele caso que veio destruir todo esse processo de patenteaĂ§Ă£o chamado Ogg Vorbis. FantĂ¡stico. É um free, Ă© um software libre, vamos dizer assim. Apesar de serem os mais difundidos no MP3 e AAC, que sĂ£o proprietĂ¡rios, qualquer produto comercial que utilize precisa pagar errores. EntĂ£o Ă© complicado isso. Agora o Vorbis, o Ogg Vorbis, Ă© outro esquema. É um software libre, open source, do projeto liderado pela fundaĂ§Ă£o Schiff Org. É uma especificaĂ§Ă£o do formato tambĂ©m, a implementaĂ§Ă£o de software Codec para a compressĂ£o de Ă¡udio com perda. Com perda. O formato Vorbis Ă© mais comumente usado em conjunto com o formato Contempor Org. E por isso muitas vezes referido o Ogg Vorbis, ou seja, que Ă© o parzinho. O formato Vorbis se tornou popular entre os adeptos do software livre. Eles argumentam que por sua alta fidelidade, por ser livre de patentes, isso torna o substituto adequado para os formatos patenteados restritos com o MP3. Muitos jogos de videogame usam os Vorbis. O Hello Unreal Tournament 2004, o Crimsonland, Devil May Cry 3, Live for Speed and Guitar Hero. VĂ¡rios websites, incluindo Wikipedia, usam Vorbis. TambĂ©m usam o formato Vorbis vĂ¡rias estações de rĂ¡dio espalhadas pelo mundo, como a CBC Radio, a Jazz Radio, Absolute Radio, Radio Nova ZelĂ¢ndia, New Zealand e o Dutch Light Radio. Serviço de streaming de Ă¡udio, Spotify, usa Vorbis para suas transmissões de Ă¡udio. FantĂ¡stico, nĂ©? Teste de adiĂ§Ă£o tem tentado encontrar a melhor qualidade na comparaĂ§Ă£o de codecs de Ă¡udio esperando nas mesmas taxas de bits. Eis algumas conclusões obtidas em recentes testes de audiĂ§Ă£o. Isso Ă© muito importante, cara. Parou, presta atenĂ§Ă£o. Quando a baixa a taxa de bits, que Ă© menos 64k bits por segundo, o mais recente teste pĂºblico, o multiformatado de 48 bits por segundo, mostra que Vorbis tem uma qualidade melhor do que o WMA e o AAC e LC. E a mesma qualidade do WMA Professional e uma qualidade inferior ao HE AAC. Mas ele Ă© fantĂ¡stico, nĂ©? Para a baixa taxa de bits Ă© o Vorbis. Taxas mĂ©dias agora, de 128 a 64k bits por segundo. Testes privados de 80k bits em 96k bits mostram que o Vorbis tem uma qualidade melhor do que outros codecs de Ă¡udio, como o LC AAC, o AE AAC, o MP3 MPC e o WMA. Agora nas altas taxas, mais de 128k bits. A maioria das pessoas nĂ£o percebe diferença significativa, certo? Por conta dessas altas taxas. Os ouvintes mais treinados podem ouvir muitas vezes diferença significativa entre os codecs em idĂªnticas taxas. E se verificou que os Vorbis soam melhor que o LAC, o LC AAC, o MP3 e o MPC. FantĂ¡stico, nĂ©? Vorbis! Log Vorbis! Uhul! Bom, agora vamos falar de tĂ©cnicas de sĂntese digital de som. SĂntese digital de mĂºsica, mais conhecida como mĂºsica eletrĂ´nica, foi uma das primeiras tecnologias de multimĂdia digital desenvolvidas. Os primeiros sintetizadores eletrĂ´nicos eram analĂ³gicos. Os sintetizadores mais populares atualmente usam microprocessadores CPU especializados, beleza? As principais tĂ©cnicas de sĂntese digital em tempo real sĂ£o a sĂntese FM e a sĂntese PCM. A sĂntese FM Ă© baseada na tĂ©cnica da modulaĂ§Ă£o e frequĂªncia. Era usada em teclados mais antigos e nas primeiras placas de som. Agora a PCM Ă© baseada na gravaĂ§Ă£o de formas de ondas instrumentais reais. É usada nos teclados mais modernos e nas placas de som mais avançadas. EntĂ£o aqui vocĂª tem o M.I.D.I, M.I.D.I ou M.I.D.I, tĂ¡? EntĂ£o aqui vocĂª tem lĂ¡ todo um processo que fala desse sintetizador fantĂ¡stico. EntĂ£o com isso a gente finaliza a aula 5 tambĂ©m. Põe na conta aĂ que vamos ao topo, Santiago!