H264 principios básicos

Prefaciar
O algoritmo de compresión de vídeo H264 é agora sen dúbida o máis utilizado e o máis popular de todas as técnicas de compresión de vídeo. Coa introdución de bibliotecas de código aberto como x264 / openh264 e ffmpeg, a maioría dos usuarios xa non necesitan investigar demasiado sobre os detalles de H264, o que reduce moito o custo das persoas que usan H264.

Pero para facer un bo uso do H264, aínda temos que descubrir os principios básicos do H264. Hoxe botaremos unha ollada aos principios básicos de H264.

A tecnoloxía de compresión H264 utiliza principalmente os seguintes métodos para comprimir datos de vídeo. incluír:

A compresión de predición intra-cadro resolve o problema da redundancia de datos espaciais.
A compresión de predición entre fotogramas (estimación de movemento e compensación) resolve o problema da redundancia de datos de dominio de tempo.
Transformada de coseno discreto enteiro (DCT), que transforma a correlación espacial en datos irrelevantes no dominio de frecuencia e logo cuantifícaa.
Compresión CABAC.
O marco comprimido divídese en: marco I, marco P e marco B:

Marco I: marco clave, usando tecnoloxía de compresión intra-marco.
Marco P: marco de referencia cara adiante, cando se comprime, só se refire ao marco procesado previamente. Utiliza a tecnoloxía de compresión de audio de cadros.
Marco B: marco de referencia bidireccional. Durante a compresión, refírese ao marco anterior e ao seguinte. Empregando tecnoloxía de compresión entre fotogramas.
Ademais dos fotogramas I / P / B, tamén hai secuencias de imaxes GOP.

GOP: Entre dous fotogramas I hai unha secuencia de imaxes e só hai un fotograma I nunha secuencia de imaxes. Como se mostra a continuación:

Tecnoloxía de compresión H264
O principio básico de H264 é realmente moi sinxelo, imos describir brevemente o proceso de compresión de datos H264. Os fotogramas de vídeo capturados pola cámara (calculados a 30 fotogramas por segundo) envíanse ao buffer do codificador H264. O codificador primeiro debe dividir os macrobloques para cada imaxe.

Macrobloque de partición
H264 usa por defecto unha área 16X16 como bloque macro e tamén se pode dividir en tamaño 8X8.

Por analoxía, calcúlase o valor do píxel de cada macrobloque nunha imaxe e todos os macrobloques se procesan do seguinte xeito.

Sub-bloque
H264 usa macrobloques 16X16 para imaxes relativamente planas. Non obstante, para conseguir unha taxa de compresión máis alta, tamén se poden dividir subblocos máis pequenos en macrobloques 16X16. O tamaño do sub-bloque pode ser 8X16, 16X8, 8X8, 4X8, 8X4, 4X4, que é moi flexible.

Na imaxe superior, a maioría dos macroblocos 16X16 no marco vermello teñen un fondo azul e parte da imaxe das tres aguias está debuxada neste macrobloc. Para procesar mellor as imaxes parciais das tres aguias, varios subblocos H264 divídense en macrobloques 16X16.

Deste xeito, despois da compresión dentro do cadro, pódense obter datos máis eficientes. A figura seguinte é o resultado de comprimir os macroblocos anteriores usando mpeg-2 e H264 respectivamente. A metade esquerda é o resultado da compresión despois da división do sub-bloque MPEG-2 e a metade dereita é o resultado da compresión do sub-bloque H264. Pódese ver que o método de división H264 ten máis vantaxes.

Despois de dividir o bloque macro, pódense agrupar todas as imaxes do búfer do codificador H264.

Agrupación de cadros
Para os datos de vídeo, hai principalmente dous tipos de redundancia de datos, un é a redundancia de datos no tempo e o outro é a redundancia de datos no espazo. Entre eles, a redundancia de datos no tempo é a maior. Primeiro falemos do problema de redundancia do tempo de datos de vídeo.

Por que a redundancia temporal é a maior? Supoñendo que a cámara capta 30 fotogramas por segundo, os datos destes 30 fotogramas están relacionados na súa maioría. Tamén é posible que máis de 30 fotogramas de datos, decenas de fotogramas ou centos de fotogramas de datos estean particularmente relacionados.

De feito, para estes fotogramas moi relacionados só necesitamos gardar un fotograma de datos e pódense predicir outros fotogramas a partir deste fotograma segundo certas regras, polo que os datos de vídeo teñen a maior redundancia de tempo.

Para conseguir que os fotogramas relevantes comprimen datos a través do método de predición, é necesario agrupar os fotogramas de vídeo. Entón, como determinar que certos cadros están estreitamente relacionados e poden agruparse? Vexamos un exemplo. A continuación móstrase un cadro de vídeo capturado dun grupo de bolas de billar en movemento. As bolas de billar rodan desde a esquina superior dereita ata a esquina inferior esquerda.

O codificador H264 sacará dous cadros adxacentes cada vez para comparar os macrobloques para calcular a semellanza dos dous cadros. Como se mostra a continuación:

A través da exploración de bloques de macro e da busca de bloques de macro, pódese comprobar que a correlación entre os dous cadros é moi alta. Ademais, compróbase que o grao de correlación deste grupo de cadros é moi alto. Polo tanto, os cadros anteriores pódense dividir nun grupo. O algoritmo é: nas imaxes adxacentes, os píxeles que xeralmente son diferentes só están nun 10%, a diferenza de brillo non supera o 2% e a diferenza de cromaticidade só cambia nun 1%. Pensamos que as gráficas pódense agrupar.

Neste grupo de cadros, despois da codificación, só conservamos os datos completos do primeiro post e os demais cadros calcúlanse facendo referencia ao cadro anterior. Ao primeiro fotograma chamámolo fotograma IDR / I e a outros fotogramas chamámolo fotograma P / B, polo que chamamos ao grupo de fotogramas de datos codificado GOP.

Estimación e compensación do movemento
Despois de agrupar os cadros no codificador H264, é necesario calcular os vectores de movemento dos obxectos do grupo de cadros. Tomando como exemplo o cadro de vídeo de billar móbil anterior, botemos unha ollada a como calcula o vector de movemento.

O codificador H264 saca primeiro dous fotogramas de datos de vídeo da cabeceira do búfer en secuencia e despois realiza a exploración de bloque de macros. Cando se atopa un obxecto nunha das imaxes, a busca realízase nas proximidades da outra imaxe (na xanela de busca). Se o obxecto se atopa noutra imaxe neste momento, entón pódese calcular o vector de movemento do obxecto. A seguinte imaxe mostra a posición da bola de billar despois de buscar.

A través da diferenza entre as posicións das bolas de billar na imaxe superior, pódese calcular a dirección e a distancia da imaxe da mesa. H264 rexistra a distancia e a dirección do movemento da pelota en cada cadro á súa vez e convértese no seguinte.

Despois de calcular o vector de movemento, resta a mesma parte (é dicir, a parte verde) para obter os datos de compensación. Ao final, só necesitamos comprimir e gardar os datos de compensación e, a continuación, a imaxe orixinal pode restaurarse ao descodificar. Os datos comprimidos só precisan rexistrar unha pequena cantidade de datos. Como segue:

Chamamos vector de movemento e compensación como tecnoloxía de compresión entre fotogramas, que resolve a redundancia de datos dos fotogramas de vídeo no tempo. Ademais da compresión entre fotogramas, a compresión de datos tamén debe realizarse dentro do fotograma. A compresión de datos dentro do marco resolve a redundancia de datos espaciais. Agora imos presentar a tecnoloxía de compresión dentro do cadro.

Predicción intra
O ollo humano ten un grao de recoñecemento da imaxe, é moi sensible ao brillo de baixa frecuencia e non é moi sensible ao brillo de alta frecuencia. Polo tanto, baseándose nalgunhas investigacións, pódense eliminar dunha imaxe datos que non son sensibles aos ollos humanos. Deste xeito, proponse a tecnoloxía intra predicción.

A compresión dentro do cadro de H264 é moi similar á JPEG. Despois de dividir unha imaxe en macrobloques, cada macrobloque pode predecirse en 9 modos. Busque o modo de predición máis próximo á imaxe orixinal.

A seguinte imaxe é o proceso de predición de cada bloque de macro en toda a imaxe.

A comparación entre a imaxe despois da predición intra e a imaxe orixinal é a seguinte:

Despois, a imaxe orixinal e a imaxe intrapredicida restan para obter un valor residual.

A continuación, garde a información do modo de predición que obtivemos antes, para poder restaurar a imaxe orixinal ao descodificar. O efecto é o seguinte:

Despois da compresión entre fotogramas e entre fotogramas, aínda que os datos son moi reducidos, aínda hai espazo para a optimización.

Fai DCT sobre datos residuais
Os datos residuais poden someterse a unha transformación de coseno discreto enteiro para eliminar a correlación dos datos e comprimir máis. Como se mostra na seguinte figura, o lado esquerdo é o bloque macro dos datos orixinais e o lado dereito é o bloque macro dos datos residuais calculados.

O macrobloque de datos residuais dixitalízase como se mostra na seguinte figura:

Despois de eliminar os datos asociados, podemos ver que os datos se comprimen aínda máis.

Despois de facer o DCT, non é suficiente e necesítase CABAC para a compresión sen perdas.

CABAC
A compresión intra-cadro anterior é unha técnica de compresión con perdas. Noutras palabras, despois de comprimir a imaxe, non se pode restaurar completamente. CABAC é unha tecnoloxía de compresión sen perdas.

A tecnoloxía de compresión sen perdas pode ser a máis familiar para todos: a codificación Huffman, un código curto para palabras de alta frecuencia, un código longo para palabras de baixa frecuencia para acadar o propósito da compresión de datos. O VLC usado en MPEG-2 é este tipo de algoritmo, tomamos AZ como exemplo, A pertence a datos de alta frecuencia e Z pertence a datos de baixa frecuencia. Vexa como se fai.

CABAC tamén é un código curto para datos de alta frecuencia e un código longo para datos de baixa frecuencia. Ao mesmo tempo, comprimirase en función do contexto, que é moito máis eficiente que o VLC. O efecto é o seguinte:

Pola imaxe anterior é obvio que o esquema de compresión sen perdas que usa CACBA é moito máis eficiente que o VLC.

resumo
Neste punto, rematamos o principio de codificación H264. Este artigo fala principalmente dos seguintes puntos:
1. Jianyin introduciu algúns conceptos básicos en H264. Como o marco I / P / B, GOP.
2. Explicou detalladamente os principios básicos da codificación H264, incluíndo:

División de bloques macro
Agrupación de imaxes
Principio da tecnoloxía de compresión dentro do cadro
O principio da tecnoloxía de compresión entre cadros.
DCT
Principio de compresión CABAC.

Como distante (long) a tapa do transmisor?

A franxa de transmisión depende de moitos factores. A distancia real baséase na altura da antena de instalar, a ganancia da antena, usando ambiente como a construción e outras obturacións, a sensibilidade do receptor, a antena do receptor. Instalación de antena máis alta e usando o campo, a distancia vai moito máis lonxe.

EXEMPLO 5W FM Transmitter usar na cidade e cidade natal:

Teño un uso do cliente 5W transmisor FM EUA con antena GP na súa cidade natal, e proba-lo con un coche, cubrir 10km (6.21mile).

I probar o transmisor FM 5W con antena GP na miña cidade natal, que cobren aproximadamente 2km (1.24mile).

I probar o transmisor FM 5W con antena GP na cidade de Guangzhou, que abranguen aproximadamente única 300meter (984ft).

Abaixo amósanse ao descanso aproximado de diferentes transmisores de enerxía FM. (O intervalo é de diámetro)

0.1W ~ 5W Transmisor FM: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

15W ~ 80W Transmisor FM: 3KM ~ 10KM

80W ~ 500W Transmisor FM: 10KM ~ 30KM

500W ~ 1000W Transmisor FM: 30KM ~ 50KM

1KW ~ 2KW Transmisor FM: 50KM ~ 100KM

2KW ~ 5KW Transmisor FM: 100KM ~ 150KM

5KW ~ 10KW Transmisor FM: 150KM ~ 200KM

Como contactar connosco para o transmisor?

Chama-me + 8618078869184 OU
Enviar email me [protexido por correo electrónico]
1.How lonxe quere cubrir de diámetro?
2.How altura de torre ti?
3.Where es?
E imos dar-lle consellos máis profesional.

Sobre nós

FMUSER.ORG é unha empresa de integración de sistemas centrada en equipos de transmisión / transmisión de audio sen fíos de radio / estudio de vídeo e procesamento de datos. Estamos ofrecendo todo desde asesoramento e consultoría a través da integración de rack ata a instalación, posta en servizo e adestramento.

Ofrecemos transmisor de FM, transmisor de TV analóxico, transmisor de TV dixital, transmisor UHF de VHF, antenas, conectores de cable coaxial, STL, procesamento de aire, produtos de transmisión para o estudio, monitorización de sinais de RF, codificadores de RDS, procesadores de audio e unidades de control de sitios remotos. Produtos IPTV, codificador / decodificador de audio / vídeo, deseñados para satisfacer as necesidades de grandes redes de transmisión internacionais e pequenas estacións privadas.

A nosa solución ten estación de radio FM / estación de televisión analóxica / estación de TV dixital / equipos de estudio de vídeo e vídeo / enlace de transmisión de estudio / sistema de telemetría de transmisor / sistema de TV de hotel / transmisión en directo IPTV / transmisión en directo de transmisión / conferencia de vídeo / sistema de transmisión CATV.

Estamos a usar produtos de tecnoloxía avanzada para todos os sistemas, porque sabemos que a alta fiabilidade e alto rendemento son tan importantes para o sistema e a solución. Ao mesmo tempo, temos que asegurarnos que o noso sistema de produtos a un prezo moi razoable.

Temos clientes de radiodifusores públicos e comerciais, operadores de telecomunicacións e autoridades reguladoras, e tamén ofrecemos solucións e produtos a moitos centos de emisoras locais e comunitarias máis pequenas.

FMUSER.ORG leva máis de 15 anos exportando e ten clientes en todo o mundo. Con 13 anos de experiencia neste campo, temos un equipo profesional para resolver todo tipo de problemas do cliente. Dedicámonos a ofrecer prezos extremadamente razoables de produtos e servizos profesionais. Correo electrónico de contacto: [protexido por correo electrónico]

nosa fábrica

Temos modernización da fábrica. Estás convidado a visitar a nosa fábrica cando chegar a China.

Actualmente, xa existen clientes 1095 en todo o mundo visitan nosa oficina Guangzhou Tianhe. Se ve a China, está invitado a visitar-nos.

na Feira

Esta é a nosa participación en 2012 Global Sources Hong Kong Fair Electrónica . Clientes de todo o mundo finalmente ter a oportunidade de estar xuntos.

Onde está Fmuser?

Podes buscar nestes números " 23.127460034623816,113.33224654197693 "en google map, entón podes atopar a nosa oficina fmuser.

oficina FMUSER Guangzhou está Tianhe District, que é a centro do cantón . moi preto ao Feira de Cantón , Estación ferroviaria Guangzhou, estrada Xiaobei e dashatou , Só ten minutos 10 tomar TAXI . Benvidos amigos de todo o mundo a visitar e negociar.

Contacto: Ceo azul
Móbil: + 8618078869184
WhatsApp: + 8618078869184
Wechat: + 8618078869184
E-mail: [protexido por correo electrónico]
QQ: 727926717
Skype: sky198710021
Dirección: No.305 cuarto Huilan Edificio No.273 Huanpu Estrada Guangzhou China Zip: 510620

Inglés: Aceptamos todos os pagos, como PayPal, tarxeta de crédito, Western Union, Alipay, Money Bookers, T / T, LC, DP, DA, OA, Payoneer, Se tes algunha pregunta, póñase en contacto comigo [protexido por correo electrónico] ou WhatsApp + 8618078869184

PayPal.  www.paypal.com

Recomendamos que use Paypal para mercar os nosos produtos, PayPal é unha forma segura de mercar en internet.

Cada da nosa lista de elementos de páxina de fondo na parte superior ten un logotipo PayPal para pagar.

Tarxeta de crédito.Se non ten paypal, pero ten tarxeta de crédito, tamén se pode facer clic no botón amarelo PayPal para pagar coa súa tarxeta de crédito.

-------------------------------------------------- -------------------

Pero se non ten unha tarxeta de crédito e non ten unha conta PayPal ou de difícil ten un accout PayPal, pode utilizar o seguinte:
Western Union.  www.westernunion.com

Pago por Western Union para min:

Nome / nome: Yingfeng
Apelido / Apelido / Apelido: Zhang
Nome completo: Yingfeng Zhang
País: China
Cidade: Guangzhou

-------------------------------------------------- -------------------

T / T.  pago por T / T (transferencia bancaria / transferencia telegráfica / Transferencia bancaria)
Primeira información bancaria (conta da empresa):

SWIFT BIC: BKCHHKHHXXX
Nome do banco: BANK OF CHINA (HONG KONG) LIMITED, HONG KONG
Enderezo bancario: BANK OF CHINA TOWER, 1 GARDEN ROAD, CENTRAL, HONG KONG
CÓDIGO BANCO: 012
Nome da conta: FMUSER INTERNATIONAL GROUP LIMITED
Conta NON. : 012-676-2-007855-0

-------------------------------------------------- -------------------
Segunda INFORMACIÓN BANCARIA (CONTA DA EMPRESA):
Beneficiario: Fmuser International Group Inc.
Número de conta: 44050158090900000337
Banco do beneficiario: China Construction Bank Sucursal de Guangdong
Código SWIFT: PCBCCNBJGDX
Enderezo: estrada Tianhe NO.553, Cantón, Guangdong, distrito de Tianhe, China
** Nota: cando transfira cartos á nosa conta bancaria, NON escriba nada na área de comentarios, se non, non poderemos recibir o pago debido á política gobernamental sobre o comercio internacional.

* Será enviado en 1 2 día de traballo cando o pagamento clara.

* Nós imos envialo seu enderezo de paypal. Se queres cambiar de dirección, por favor, envíe o seu enderezo correcto e número de teléfono para o meu e-mail [protexido por correo electrónico]

* Se os paquetes está baixo 2kg, que serán enviados vía correo aéreo, vai levar preto de 15-25days para a súa man.

Se o paquete é máis que 2kg, nós enviamos vía EMS, DHL, UPS, FedEx entrega rápida expresa, vai levar preto de 7 ~ 15days para a súa man.

Se o paquete de máis de 100kg, enviarémoslle vía DHL ou transporte aéreo. Isto levará uns 3 ~ 7days para a súa man.

Todos os paquetes son a forma China Guangzhou.

* O paquete enviarase como un "agasallo" e descartarase o menos posible, o comprador non terá que pagar o "IMPOSTO".

* Despois de navío, nós enviarémosche un correo electrónico e darlle o número de rastreamento.

Para garantía.
Contacte connosco --- >> Devólvenos o artigo --- >> Reciba e envíe outro substituto.

Nome: Liu Xiaoxia
Dirección: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu Guangzhou China.
CEP: 510620
Teléfono: + 8618078869184

Por favor, retorne a este enderezo e escribir o seu paypal enderezo, nome, problema na nota: