Details
Nothing to say, yet
Details
Nothing to say, yet
Comment
Nothing to say, yet
In this video lecture, the main topics discussed are the characteristics of video, analog and digital video formats, video compression principles, and various video formats such as MPEG-1, MPEG-2, and MPEG-4 AVC. The lecture also covers the concept of frame rate and resolution, aspect ratio and bit rate in video, as well as the differences between analog and digital video. The advantages of digital video, such as easy editing and duplication, are highlighted, along with the importance of codecs in video encoding and decoding. The lecture concludes with an explanation of video compression principles, including sub-sampling of chrominance and the use of different ratios in compression schemes. Aula 7, Vídeo, Compressão e Formatos de Vídeo Digital. Nesta aula abordaremos então características de vídeo, formatos de vídeo analógico, vídeo digital, princípios de compressão de vídeo, formatos MPE de MPEG-1 e MPEG-2, e formato MPEG-4 AVC. Características de vídeo Framerate Framerate é o número de imagens, quadros apresentados por unidade de tempo, no caso de frames per second, FPS, e uma unidade de tempo ao segundo. Vídeos com baixo FPS ou FPS menor que 15 parecem estar congelados, uma vez que nosso olho e nosso cérebro são capazes de captar e processar um número mais elevado de quadros por segundo. Atualmente, câmeras modernas conseguem captar até 120 FPS. Nós humanos conseguimos captar e processar no máximo 60 FPS. O formato de vídeo analógico NTSC utiliza 29,97 quadros por segundo. O formato PAL utiliza a taxa de 25 FPS. O formato usado na Europa e no Brasil é o PAL-M. Define a quantidade de pixels, aliás, resolução. Resolução define a quantidade de pixels em cada quadro de vídeo. Normalmente apresentado no formato A versus B vezes R, A sendo o número de colunas ou pixels por linha, B o número de linhas e R o número de quadros por segundo. Nós temos então que este é o FPS, que é o Frame Per Second. TVs de alta definição HDTV exibem resoluções de até 1920x1080 por segundo. Agora nós vamos falar sobre razão de aspecto, Aspect Ratio e Bit Rate. Aspect Ratio descreve as dimensões relativas dos objetos do vídeo na tela. Televisões comuns apresentam Aspect Ratio 4 para 3. Televisões mais modernas apresentam Aspect Ratio 16 por 9. 4 por 3, 16 por 9. Agora vamos usar o Bit Rate, aplicável somente a vídeos digitais. Digitais tem bits, o analógico não tem bits. Então Bit Rate descreve o número de bits necessários para representar cada pixel do vídeo, expresso em bits per pixel, BPP. Agora vamos falar sobre formatos de vídeo analógico. O formato de vídeo analógico, o vídeo analógico nada mais é que uma forma de onda que resulta da varredura sequencial das linhas de uma tela quando são registradas as intensidades e a cor de cada pixel. O formato dos sistemas analógicos de vídeo obedece as normas específicas. As principais são POL, SECAM, e o NTSC, que seria TV e VHS. Aqui no Brasil o POL, ou P-A-L, no Brasil usa o P-A-L-M. Agora que a gente tem então a ideia de uma TV a tubo, antiga. No início a gente tem o catodo e o anodo, o A e o C. Sequência então o D, que é a tela revestida de fósforo, o E, que é o feixe de elétrons, e o F, que é a camada de sombra. Então isso acontece que após você lançar o feixe, que é o RGB, o RED, o GREEN e o BLUE, automaticamente se iluminam os feixes de elétrons fazendo com que apareçam as cores. Então aqui a gente tem um exemplo de uma televisão, no formato analógico, modelo Braun HF1, da Alemanha de 1958. Então o armazenamento dos dados analógicos é normalmente feito em uma película magnética. Ainda é muito usual as películas magnéticas para armazenamento de dados analógicos. POL-M, que é o Phase Alternating Line, POL-M, utilizado no Brasil e na Europa. E nós temos agora também o NTSC, que é o National Television Standards Committee. Vídeos de 525 linhas, que é o POL-M. Linhas de imagem mais linhas para sincronização. É de 30 frames per second, 30 quadros por segundo. E a relação de largura sobre altura ao aspect ratio é de 4.3, ou 4 para 3. Imagens entrelaçadas, linhas divididas em ímpares e pares. E a varredura a 60 vezes por segundo, que é os 60 Hz. Então aqui a gente tem um exemplo do quadro de entrelaçamento de cada linha sendo de uma cor. Entre azul, vermelho e o branco. São pares e ímpares. Na medida que o processo de varredura vai acontecendo, temos um processo formado por linhas pares e depois por linhas ímpares. Nós não percebemos essa alternância em quadros e muito menos essa alternância entre linhas. A varredura acontece a 60 vezes por segundo e coincide com 60 Hz. De tal forma, evitar um fenômeno que é o inconveniente da cintilação, que é a iteração do sinal da rede elétrica com a imagem acima à direita. Que ilustra bem como é feito o entrelaçamento da formação da imagem com o vídeo analógico. É o mesmo quadro formado por um entrelaçamento. Então eu tenho sempre um quadro para um certo intervalo de tempo. Vamos falar agora de características de vídeos. Vale tanto para analógico quanto para digital. Agora, na verdade, vamos falar de vídeo digital. Utilização de imagens digitais em rápida sucessão a uma taxa constante. Rápida sucessão a uma taxa constante acontece também para o analógico. As técnicas de compressão e correção de erros permitiram um incremento considerável na capacidade de transmissão de informação. A taxa constante dá percepção visual com certa qualidade. Vídeo digital ainda. O vídeo digital se populariza com o uso crescente de computadores pessoais. Acesso a conexão banda larga com a internet e a venda de televisores que suportam a tecnologia. Televisores do tipo LCD. Mas a maior qualidade da imagem não é a única razão da adoção cada vez maior desse padrão de codificação e transmissão. Quando se pensa em vídeo digital, você pensa em manipular, modificar, transmitir e armazenar essa imagem em um formato digital. Vantagens do vídeo digital. O acesso direto a usar quadros e imagens possibilita a transmissão quase instantânea para qualquer ponto de um filme. Permite o corte, colagem e edição do vídeo de diversas maneiras, bem como a adição de diversos efeitos visuais. Permite duplicação de forma fácil e sem perda de qualidade. Oferece suporte à interatividade que surge com a tendência tecnológica mais promissora para os próximos anos. Ainda sobre a codificação de vídeo. Um codec de vídeo é um dispositivo, um software responsável pela codificação, que seria o encoder, codificador, e a decodificação, que seria o decoder, o decodificador, de um vídeo digital. O objetivo de utilizar um codec é principalmente diminuir a quantidade de informação necessária para armazenamento de vídeos. Em um dispositivo CD, DVD, disco rígido, etc. Ou transmissão em tempo real, pois o vídeo capturado por uma câmera não apresenta compactação, compressão. Lembrando que a compressão é a diminuição da quantidade de bytes ocupada por um vídeo. Eu só irei mandar, obviamente, a informação relevante e tudo mais. Eu só irei mandar, obviamente, a informação relevante e que irá produzir um resultado desejado ou esperado. Ainda sobre a codificação de vídeo. Para que o objetivo de um codec seja alcançado, é necessário um equilíbrio entre 1. Qualidade do vídeo. Se quer a qualidade, mas às vezes tem que se abrir mão dela. 2. Quantidade de dados necessários para transmitir. Seria a taxa de bits, bitrate. 3. Complexidade dos algoritmos de codificação e decodificação. 4. A robustez contra a perda de dados. Então são 4 itens que precisam ser atendidos. A qualidade, a quantidade, complexidade e robustez. Quando se fala no 2, que é a quantidade de dados necessários para transmiti-lo, alguns meios de transmissão comportam uma quantidade de bits superior, outras não. Alguns meios, ou bandas largas, é possível trafegar ao longo do meio uma quantidade grande de bits. Às vezes não é possível, principalmente se for em tempo real. Vamos falar agora de princípios de compressão de vídeo. Antes de qualquer compressão, quase sempre é aplicada uma técnica chamada subamostragem de Cormância. Subamostragem de Cormância. Subamostragem de Crominância, ou Croma Subsampline. Sampline, sampling. Croma Subsamplar. O esquema de subamostragem é geralmente expresso com uma proporção de 3 partes, de J a B. O J está para A que está para B. Então, por exemplo, 4 para 2 para 2. Que descrevem o número de amostras de luminância e cromancia em uma tela conceitual, virtual, que tem J pixels de largura e 2 pixels de altura. Isso daqui é uma recapitulação da aula 2. Então, quando se fala na proporção 4, 2, 2, não estamos falando de uma tela que está sendo formada, mas sim de uma razão de proporção entre cores e luminosidade. Componentes como cor CB e CR, que é o blue e red, onde todo o conjunto forma o green, no final terem uma imagem como se estivesse usando RGB, de uma forma diferenciada no contexto de espaço de cores. Princípios de compressão de vídeo. O significado das partes da proporção J a B usada em qualquer esquema de subamostragem. J, referência de amostragem horizontal, largura em pixels, 4 em geral. Esse 4 não se trata de pixels, sim de proporção. A, número de amostras de crominância, CR e CB, na primeira linha de J pixels. E B, que é o número de amostras de crominância, CR e CB, na segunda linha de J pixels. Então, aqui a gente tem um exemplo, um princípio de compressão de vídeo, onde você tem 4 quadros em proporções diferentes. O primeiro com 4 para 1 para 1, o segundo 4 para 2 para 0, o terceiro 4 para 2 para 2, e o quarto quadro, o quarto vídeo, é 4 para 4 para 4. Então, olhando o primeiro quadro, ele tem lá um quadradinho como se fosse xadrez nas duas primeiras linhas, alternando entre branco e preto, branco e preto, preto e branco, preto e branco. E aí, na linha de baixo, nós temos, então, o azul e o vermelho, uma linha de azul e uma linha de vermelho. Quando você faz a combinação, então, da primeira linha, que é o branco, o preto, o branco e o preto com o azul, você tem, então, uma outra linha formada, sendo o branco com o azul vai dar o azul claro, o preto com o azul vai dar o azul escuro, o branco com o azul dá o azul claro e o preto com o azul dá o azul escuro. Na segunda linha que nós temos o preto, branco, preto, branco, está combinando, aliás, na segunda linha, nós vamos ter a combinação de preto com vermelho, que vai dar o vermelho escuro, o branco com o vermelho que vai dar o rosa e o preto com o vermelho que vai dar o vermelho escuro e o branco com o vermelho que vai dar o rosa. Então, ou seja, essa caixa é a composição das cores, sendo que a primeira linha é composta pela sobreposição da primeira linha cinza e a branca, o preto e branca, e a primeira linha blue. E a segunda linha, o DZ, de preto e branco, da segunda linha, red, na caixa branca. Lembrando que o preto e branco nada mais é que o branco, ou seja, o claro é ar e o preto é o escurecer. Vamos para a próxima. Princípios da compressão de vídeo. A norma CCIR 601 define um padrão de amostragem de vídeo digital com 720 amostras de iluminância, sendo E duas vezes 360 amostras de diferença de cores por linha. Sistema Y', Y', CB e CR, com proporção 4 para 2 para 2 subamostragem de crominância. Um exemplo. Com a proporção de 4 para 2 para 2 para 2 milhões de pixels nós temos, dividindo os 2 milhões em 8 partes, que são 4 mais 2 mais 2, cada parte tem 250 mil pixels. No final, 4 partes de 1 milhão serão para Luma, 2 para CB, que seriam 500 mil, e 2 partes para 2 CR, que seriam 500 mil. Isso tem uma relação muito forte com a quantidade de memória para formar uma imagem. Princípios de compressão de vídeo. A subamostragem cromática se diferencia um pouco do rigor da ciência das cores. Pois os componentes Luma e Croma são formados como uma soma ponderada de componentes R', G' e B', em vez de uma soma direta linear dos componentes RGB. Como resultado, a luminância e a cromancia não são completamente independentes uma da outra. Repetindo. Como resultado, a luminância e a crominância não são completamente independentes uma da outra. Ou seja, há algum vazamento de informação luminância e cromancia entre os componentes Luma e Croma. Lembrando que Luma, nada de crominância, e Croma, nada de luminância. Então, ou seja, acontece devido à existência da subamostragem. Ou seja, o vazamento acontece devido à existência da subamostragem devido ao processamento da imagem no contexto do vídeo. Y, que é a luminância, tem relação com RGB. Ou seja, leva as informações de cor quando se fala em Y, Cb, Cr. Estamos falando da aula 2. Y' é Luma. Portanto, não leva as informações de cor e não tem relação com RGB. Princípios de compressão de vídeo. O vazamento. O erro é maior para as cores altamente saturadas e por ser razoavelmente perceptível entre as barras magenta e verde de um padrão de teste de barras de cor. Onde foi aplicada a subamostragem cromática. Essa aproximação de engenharia ao inverter a ordem das operações usando a soma ponderada em lugar da soma linear permite que a subamostragem de cores possa ser mais facilmente implementada. Você tem a barra de cores original e à direita a barra de cores com erro. Onde o verde junto com o magenta tem uma região que tem um erro. Ela apresenta, vamos dizer assim, não tem clareza nas cores. Ou seja, faltando uma maior definição. Então quando eu aplico uma subamostragem aparece o erro conforme ao lado. Ou seja, com subamostragem de crominância Codec Sony Vegas proporção 4.1.1 Princípios de compressão de vídeo. A subamostragem cromática se desvia um pouco do rigor da ciência das cores. Pois as componentes luma e croma são formadas com uma soma ponderada de componentes RG, R', G' e B' em vez de uma soma direta linear de componentes RGB. Como resultado, a luminância e a crominância não são completamente independentes uma da outra. Ou seja, há algum vazamento de informação de luminância e cromancia entre os componentes luma e croma. O vazamento novamente acontece devido à existência da subamostragem devido ao processamento da imagem no contexto de vídeo. Então, com isso, a gente finaliza aliás, não finalizamos temos os princípios de compressão de vídeo. A maioria dos codecs de vídeo atuais usa compressão espacial, intraframe e temporal, interframe, combinadas. A compreensão espacial de frames de vídeo individuais é geralmente baseada na DCT Discrete Cosine Transform que é a transformada discreta cosseno como no formato JPEG reverá aula 3. O formato DV usado em fitas de vídeo digital usa unicamente a compressão espacial. Ele estende a técnica do JPEG escolhendo tamanhos variáveis para transformar os blocos para DCT e também usando a técnica de embaralhar os blocos de um mesmo quadro. Princípios de compressão de vídeo A compactação temporal funciona calculando a diferença entre os quadros em vez de armazenar cada um na íntegra. O método mais utilizado funciona através da comparação de cada quadro frame do vídeo com o anterior. Se o quadro contém áreas onde nada mudou o sistema simplesmente emite um comando curto que copia essas áreas bit a bit para o interior do próximo quadro. Princípios de compressão de vídeo Caso contrário, se algumas seções de pixels áreas do quadro simplesmente se moveram o compressor emite um comando que informa ao decodificador para deslocar, girar, clarear ou escurecer a cópia da área respectiva do quadro anterior. Isso significa mais um comando. Porém, ele é ainda muito menos oneroso do que a compressão intra-quadro usando um DCT. Menos oneroso, pensando computacionalmente. Compressão intra-quadros não é bom para edições. Compressão intra-quadros funciona bem para aplicações onde o vídeo simplesmente deve ser assistido pelo espectador. Mas pode causar problemas se a sequência de vídeo precisar ser editada. Razão pela qual o formato DV não a utiliza. Interframes Comando ao invés da própria imagem dentro do sistema de computação é melhor. Eu tenho mais comandos dizendo deslocar, clarear, escurecer. É mais barato computacionalmente falando do que a imagem propriamente dita. E com isso nós finalizamos a gravação da aula 7.