一 : YUV
色差输出 S-Video YUV YCbCr YPbPr详细介绍
色差输出
色差信号y,r-y,b-y信号一般通称为y, cr,cb; 习惯上y,cr,cb为数字(pcm)的色差信号,模拟的色差信号则称y,pr,pb,所以我们常在dvd player的内部看到y,cr,cb而在dvd player的外部看到色差输出标示为y,pr,pb或yuv;yuv则是在欧洲电视系统pal中的色差信号的通称,包含数字及模拟的色差信号都称 yuv,所以当您看到yuv时您就要联想到它是pal系统中的y,r-y,b-y信号,它可能是数字(pcm)的yuv,也可能是模拟的yuv S-Video
S-Video具体英文全称叫Separate Video,为了达到更好的视频效果,人们开始探求一种更快捷优秀、清晰度更高的视频传输方式,这就是当前如日中天的S-Video(也称二分量视频接口),Separate Video 的意义就是将Video 信号分开传送,也就是在AV接口的基础上将色度信号C和亮度信号Y进行分离,再分别以不同的通道进行传输,它出现并发展于上世纪90年代后期通常采用标准的4 芯(不含音效) 或者扩展的7 芯( 含音效)。带S-Video接口的视频设备( 譬如模拟视频采集/ 编辑卡电视机和准专业级监视器电视卡/电视盒及视频投影设备等) 当前已经比较普遍,同AV 接口相比由于它不再进行Y/C混合传输,因此也就无需再进行亮色分离和解码工作,而且由于使用各自独立的传输通道在很大程度上避免了视频设备内信号串扰而产生的图像失真,极大提高了图像的清晰度,但S-Video 仍要将两路色差信号(Cr Cb)混合为一路色度信号C,进行传输然后再在显示设备内解码为Cb 和Cr 进行处理,这样多少仍会带来一定信号损失而产生失真(这种失真很小但在严格的广播级视频设备下进行测试时仍能发现) ,而且由于Cr Cb 的混合导致色度信号的带宽也有一定的限制,所以S -Video 虽然已经比较优秀但离完美还相去甚远,S-Video虽不是最好的,但考虑到目前的市场状况和综合成本等其它因素,它还是应用最普遍的视频接口。
YUV
电视传输用的名词,一个亮度信号(Y),两个色差信号(U分量、V分量)
YUV(亦称YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(属于PAL)。YUV主要用于优化彩色视频信号的传输,使其向后兼容老式黑白电视。与RGB视频信号传输相比,它最大的优点在于只需占用极少的带宽(RGB要求三个独立的视频信号同时传输)。其中“Y”表示明亮度(Luminance或 Luma),也就是灰阶值;而“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。“亮度”是通过RGB输入信号来创建的,方法是将RGB信号的特定部分叠加到一起。“色度”则定义了颜色的两个方面—色调与饱和度,分别用Cr和CB 来表示。其中,Cr反映了GB输入信号红色部分与RGB信号亮度值之间的差异。而CB反映的是RGB输入信号蓝色部分与RGB信号亮度值之同的差异。
在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD(点耦合器件)摄像机,它把摄得的彩色图像信号,经分色、分别放大校正得到RGB,再经过矩阵变换电路得到亮度信号Y和两个色差信号R-Y、B-Y,最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。这就是我们常用的YUV色彩空间。
YUV格式通常有两大类:打包(packed)格式和平面(planar)格式。前者将YUV分量存放在同一个数组中,通常是几个相邻的像素组成一个宏像素(macro-pixel);而后者使用三个数组分开存放YUV三个分量,就像是一个三维平面一样。表2.3中的YUY2到Y211都是打包格式,而IF09到YVU9都是平面格式。(注意:在介绍各种具体格式时,YUV各分量都会带有下标,如Y0、U0、V0表示第一个像素的YUV分量,Y1、U1、V1表示第二个像素的YUV分量,以此类推。)
MEDIASUBTYPE_YUY2 YUY2格式,以4:2:2方式打包
MEDIASUBTYPE_YUYV YUYV格式(实际格式与YUY2相同)
MEDIASUBTYPE_YVYU YVYU格式,以4:2:2方式打包
MEDIASUBTYPE_UYVY UYVY格式,以4:2:2方式打包
MEDIASUBTYPE_AYUV 带Alpha通道的4:4:4 YUV格式
MEDIASUBTYPE_Y41P Y41P格式,以4:1:1方式打包
MEDIASUBTYPE_Y411 Y411格式(实际格式与Y41P相同)
MEDIASUBTYPE_Y211 Y211格式
MEDIASUBTYPE_IF09 IF09格式
MEDIASUBTYPE_IYUV IYUV格式
MEDIASUBTYPE_YV12 YV12格式
MEDIASUBTYPE_YVU9 YVU9格式
YUV主要的采样格式
主要的采样格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比较常用,其含义为:每个点保存一个 8bit 的亮度值(也就是Y值),每 2x2 个点保存一个 Cr 和Cb 值, 图像在肉眼中的感觉不会起太大的变化。所以, 原来用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 个点需要 8x3=24 bites。而现在仅需要 8+(8/4)+(8/4)=12bites, 平均每个点占12bites。这样就把图像的数据压缩了一半。
上边仅给出了理论上的示例,在实际数据存储中是有可能是不同的,下面给出几种具体的存储形式:
(1)YUV 4:4:4 表示色度频道没有下采样
YUV三个信道的抽样率相同,因此在生成的图像里,每个象素的三个分量信息完整(每个分量通常8比特),经过8比特量化之后,未经压缩的每个像素占用3个字节。
下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3
图 1 显示了 4:4:4 图片中使用的采样网格。灯光样例用叉来表示,色度样例则用圈表示。
图 1. YUV 4:4:4 样例位置
(2)YUV 4:2:2 表示 2:1 的水平下采样,没有垂直下采样。对于每两个 U 样例或 V 样例,每个扫描行都包含四个 Y 样例。
每个色差信道的抽样率是亮度信道的一半,所以水平方向的色度抽样率只是4:4:4的一半。对非压缩的8比特量化的图像来说,每个由两个水平方向相邻的像素组成的宏像素需要占用4字节内存。
下面的四个像素为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为:Y0 U0 Y1 V1 Y2 U2 Y3 V3
映射出像素点为:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]
4:2:2 采样的这种主要形式在 ITU-R Recommendation BT.601 中进行了定义。图 2 显示了此标准定义的采样网格。
图 2. YUV 4:2:2 样例位置
(3)YUV 4:1:1 表示 4:1 的水平下采样,没有垂直下采样。对于每个 U 样例或 V 样例,每个扫描行都包含四个 Y 样例。
4:1:1的色度抽样,是在水平方向上对色度进行4:1抽样。对于低端用户和消费类产品这仍然是可以接受的。对非压缩的8比特量化的视频来说,每个由4个水平方向相邻的像素组成的宏像素需要占用6字节内存。
下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为: Y0 U0 Y1 Y2 V2 Y3
映射出像素点为:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]
(4)YUV4:2:0 表示 2:1 的水平下采样,2:1 的垂直下采样。
4:2:0并不意味着只有Y,Cb而没有Cr分量。它指得是对每行扫描线来说,只有一种色度分量以2:1的抽样率存储。相邻的扫描行存储不同的色度分量,也就是说,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。对每个色度分量来说,水平方向和竖直方向的抽样率都是2:1,所以可以说色度的抽样率是4:1。对非压缩的8比特量化的视频来说,每个由2x2个2行2列相邻的像素组成的宏像素需要占用6字节内存。 下面八个像素为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
[Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]
存放的码流为:Y0 U0 Y1 Y2 U2 Y3
Y5 V5 Y6 Y7 V7 Y8
映射出的像素点为:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]
[Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]
4:2:0 采样有两种常见的变化形式。其中一种形式用于 MPEG-2 视频,另一种形式用于 MPEG-1 以及 ITU-T recommendations H.261 和 H.263。图 3 显示了 MPEG-1 方案中使用的采样网格,图 4 显示了 MPEG-2 方案中使用的采样网格。
图 3. YUV 4:2:0 样例位置(MPEG-1 方案)
图 4. YUV 4:2:0 样例位置(MPEG-2 方案)
与 MPEG-1 方案相比,在 MPEG-2 方案与为 4:2:2 和 4:4:4 格式定义的采样网格之间进行转换更简单一些。因此,在 Windows 中首选 MPEG-2 方案,应该考虑将其作为 4:2:0 格式的默认转换方案。
表面定义
本节讲述推荐用于视频呈现的 8 位 YUV 格式。这些格式可以分为几个类别:
4:4:4 格式,每像素 32 位
4:2:2 格式,每像素 16 位
4:2:0 格式,每像素 16 位
4:2:0 格式,每像素 12 位
首先,您应该理解下列概念,这样才能理解接下来的内容:
表面原点。对于本文讲述的 YUV 格式,原点 (0,0) 总是位于表面的左上角。
跨距。表面的跨距,有时也称为间距,指的是表面的宽度,以字节数表示。对于一个表面原点位于左上角的表面来说,跨距总是正数。
对齐。表面的对齐是根据图形显示驱动程序的不同而定的。表面始终应该 DWORD 对齐,就是说,表面中的各个行肯定都是从 32 位 (DWORD) 边界开始的。对齐可以大于 32 位,但具体取决于硬件的需求。
打包格式与平面格式。YUV 格式可以分为打包 格式和平面 格式。在打包格式中,Y、U 和 V 组件存储在一个数组中。像素被组织到了一些巨像素组中,巨像素组的布局取决于格式。在平面格式中,Y、U 和 V 组件作为三个单独的平面进行存储。
4:4:4 格式,每像素 32 位
推荐一个 4:4:4 格式,FOURCC 码为 AYUV。这是一个打包格式,其中每个像素都被编码为四个连续字节,其组织顺序如下所示。
图 5. AYUV 内存布局
标记了 A 的字节包含 alpha 的值。
4:2:2 格式,每像素 16 位
支持两个 4:2:2 格式,FOURCC 码如下:
YUY2
UYVY
两个都是打包格式,其中每个巨像素都是编码为四个连续字节的两个像素。这样会使得色度水平下采样乘以系数 2。
YUY2
在 YUY2 格式中,数据可被视为一个不带正负号的 char 值组成的数组,其中第一个字节包含第一个 Y 样例,第二个字节包含第一个 U (Cb) 样例,第三个字节包含第二个 Y 样例,
第四个字节包含第一个 V (Cr) 样例,如图 6 所示。
图 6. YUY2 内存布局
如果该图像被看作由两个 little-endian WORD 值组成的数组,则第一个 WORD 在最低有效位 (LSB) 中包含 Y0,在最高有效位 (MSB) 中包含 U。第二个 WORD 在 LSB 中包含 Y1,在 MSB 中包含 V。
YUY2 是用于 Microsoft DirectX? Video Acceleration (DirectX VA) 的首选 4:2:2 像素格式。预期它会成为支持 4:2:2 视频的 DirectX VA 加速器的中期要求。
UYVY
此格式与 YUY2 相同,只是字节顺序是与之相反的 — 就是说,色度字节和灯光字节是翻转的(图 7)。如果该图像被看作由两个 little-endian WORD 值组成的数组,则第一个 WORD 在 LSB 中包含 U,在 MSB 中包含 Y0,第二个 WORD 在 LSB 中包含 V,在 MSB 中包含 Y1。
图 7. UYVY 内存布局
4:2:0 格式,每像素 16 位
推荐两个 4:2:0 每像素 16 位格式,FOURCC 码如下:
IMC1
IMC3
两个 FOURCC 码都是平面格式。色度频道在水平方向和垂直方向上都要以系数 2 来进行再次采样。
IMC1
所有 Y 样例都会作为不带正负号的 char 值组成的数组首先显示在内存中。后面跟着所有 V (Cr) 样例,然后是所有 U (Cb) 样例。V 和 U 平面与 Y 平面具有相同的跨距,从而生成如图 8 所示的内存的未使用区域。
图 8. IMC1 内存布局
IMC3
此格式与 IMC1 相同,只是 U 和 V 平面进行了交换:
图 9. IMC3 内存布局
4:2:0 格式,每像素 12 位
推荐四个 4:2:0 每像素 12 位格式,FOURCC 码如下:
IMC2
IMC4
YV12
NV12
在所有这些格式中,色度频道在水平方向和垂直方向上都要以系数 2 来进行再次采样。 IMC2
此格式与 IMC1 相同,只是 V (Cr) 和 U (Cb) 行在半跨距边界处进行了交错。换句话说,就是色度区域中的每个完整跨距行都以一行 V 样例开始,然后是一行在下一个半跨距边界处开始的 U 样例(图 10)。此布局与 IMC1 相比,能够更加高效地利用地址空间。它的色度地址空间缩小了一半,因此整体地址空间缩小了 25%。在各个 4:2:0 格式中,IMC2 是第二首选格式,排在 NV12 之后。
图 10. IMC2 内存布局
IMC4
此格式与 IMC2 相同,只是 U (Cb) 和 V (Cr) 行进行了交换:
图 11. IMC4 内存布局
YV12
所有 Y 样例都会作为不带正负号的 char 值组成的数组首先显示在内存中。此数组后面紧接着所有 V (Cr) 样例。V 平面的跨距为 Y 平面跨距的一半,V 平面包含的行为 Y 平面包含行的一半。V 平面后面紧接着所有 U (Cb) 样例,它的跨距和行数与 V 平面相同(图 12)。
图 12. YV12 内存布局
NV12
所有 Y 样例都会作为由不带正负号的 char 值组成的数组首先显示在内存中,并且行数为偶数。Y 平面后面紧接着一个由不带正负号的 char 值组成的数组,其中包含了打包的 U (Cb) 和 V (Cr) 样例,如图 13 所示。当组合的 U-V 数组被视为一个由 little-endian WORD 值组成的数组时,LSB 包含 U 值,MSB 包含 V 值。NV12 是用于 DirectX VA 的首选 4:2:0 像素格式。预期它会成为支持 4:2:0 视频的 DirectX VA 加速器的中期要求。
YUV格式解析2
又确认了一下H264的视频格式——H264支持4:2:0的连续或隔行视频的编码和解码 谈YPbPr、YCbCr
YPbPr 和YCbCr两种标识,前者表示逐行扫描色差输出,后者表示隔行扫描色差输出. 数字电视的色彩空间和计算机不同,不是RGB空间,而是采用一个亮度信号(Y)和两个色差信号(R-Y、B-Y)的YUV空间或者叫YCbCr空间。数字电视采用YUV(YCbCr)色彩空间的原因主要就是为了减少数据储存空间和数据传输带宽,同时又能非常方便的兼容黑白电视(R-Y和B-Y信号为零)。 YUV(YCbCr)空间和RGB空间可以相互转换,转换公式如下:
Y = 0.299 R + 0.587 G + 0.114 B
Cb = - 0.1687 R - 0.3313 G + 0.5 B + 128
Cr = 0.5 R - 0.4187 G - 0.0813 B + 128
反过来也可以:
R = Y + 1.402 (Cr-128)
G = Y - 0.34414 (Cb-128) - 0.71414 (Cr-128)
B = Y + 1.772 (Cb-128)
YCbCr表示的是数字电视(视频)的色彩空间及数字接口,这是国际通用的标准。YPbPr
表示的仅仅是模拟视频分量接口,而且仅仅是美国的标准(包括采用美国标准的其他国家)
色相定位Co-sited
Definition of: co-sited
Sampled at the same time. See .
Co-sited sampling
This is a sampling technique applied to colour difference component video signals (Y, Cr, Cb) where the colour difference signals, Cr and Cb, are sampled at a sub-multiple of the luminance, Y, frequency – for example as in 4:2:2. If co-sited sampling is applied, the two colour difference signals are sampled at the same instant, and simultaneously with a luminance sample. Co-sited sampling is the ‘norm’ for component video as it ensures the luminance and the chrominance digital information is coincident, minimising chroma/luma delay.
Definition of: chroma subsampling
A reduced color resolution in digital component video signals. To
accommodate storage and bandwidth limitations, the two color components (Cb, Cr) in digital video signals are compressed by sampling them at a lower rate than the brightness (Y). Color information is actually discarded.
YCbCr is the YUV color space recorded digitally. Y is brightness (luma), and Cb and Cr are the U and V color difference signals (see for details). In chroma
subsampling, only the colors are compressed, not the luma because the eye is more sensitive to brightness than to the color components.
The 4:4:4, 4:2:2, 4:2:0...
YCbCr is designated as 4:n:n. The 4 represents a sampling rate of 13.5 MHz, which is the standard frequency (ITU-R BT.601) for digitizing analog NTSC, PAL and SECAM. The next two digits represent the Cb and Cr rate. Review the illustrations below for details. Each 8x8 matrix represents a "macroblock" of 64 pixels in a video frame. The pink squares are the pixel locations where the sample is taken. Sony's HDCAM uses a different notation because it compresses both the luma and the colors (see
).
4:4:4 (Cb/Cr Same as Luma)
Cb and Cr are sampled at the same full rate as the luma. MPEG-2 supports 4:4:4 coding, but having the same number of color difference samples as the luma is
considered overkill and not worth the additional bandwidth to transmit it. When video is converted from one color space to another, it is often resampled to 4:4:4
first.
4:2:2 (1/2 the Luma Samples)
Cb and Cr are sampled at half the horizontal resolution of Y. Co-sited means that Cb/Cr samples are taken at the same time as Y. 4:2:2 color sampling is widely used and considered very high quality. It is used for prosumer and professional digital video recording, including DV (at 50 Mbps), Digital Betacam and DVCPRO 50 and is
an option in MPEG-2.
4:1:1 (1/4 the Luma Samples)
Cb and Cr are sampled at one quarter the horizontal resolution. Co-sited means that Cb/Cr samples are taken at the same time as the Y. Co-sited 4:1:1 is used in DV,
DVCAM and DVCPRO formats.
4:2:0 (1/4 the Luma Samples)
The zero in 4:2:0 means that Cb and Cr are sampled at half the vertical resolution of Y. MPEG-1 and MPEG-2 use 4:2:0, but the samples are taken at different intervals.
By the time MPEG-2 came along, it was known that 4:2:2 coding was often converted to 4:2:0, which is why MPEG-2 sampling more closely lines up with the
4:2:2 pattern. H.261/263 also uses 4:2:0.
Definition of: CMYK
(Cyan Magenta Yellow blacK) The color space used for commercial printing and most color computer printers. In theory, cyan, magenta and yellow (CMY) can print all colors, but inks are not pure and black comes out muddy. The black ink (K) is required for quality printing. See , and
.
Separated Colors
Each of the four colors are printed independently, but blend together to form all colors. (Image courtesy of Intergraph Computer Systems.)
A CMYK Printer
Typical of a color laser printer, this Tally 8106 printer uses four separate cartridges: one each for cyan, magenta, yellow and black (CMYK). Unlike the commercial print process, which prints the paper four times, in a color laser printer, each of the four inks is applied to the drum before the page is printed.
CMYK Ribbon
This shows a four-color dye sublimation or thermal wax transfer ribbon where four panels of dye or wax-based ink exist for each page, and each panel is as large as the page. After each page is printed, the ribbon is advanced to the next four-color ribbon set.
Definition of: RGB
(Red Green Blue) The computer's native color space, which is the color system for capturing and displaying images. RGB was derived from our own perception of color because human eyes are sensitive to red, green and blue (see ). Capturing
Cameras and scanners capture color with sensors that record the varying intensities of red, green and blue at each pixel location in the frame (see , and ).
Display and Printing (RGB and CMYK)
For screen display, red, green and blue pixels (dots) are energized to the
appropriate intensity. When all three pixels are turned on high, white is produced. As intensities are equally lowered, shades are derived. The base color of the screen appears when all pixels are off.
For printing on paper, the CMYK color space is used, not RGB. Combinations of cyan, magenta, yellow and black ink make up all the colors. See .
Video Processing (RGB or YUV)
TV/video signals are mostly in the YUV color space. They are converted to RGB in the computer for editing when RGB is the desired output. If YUV is the desired
output, and the video editing program supports YUV, there is no need to convert to RGB for internal processing. However, no matter which color space is used for
editing, all data is converted to RGB for screen display. See and .
Color Mixing Methods
The two major ways to create colors are RGB and CMY. RGB uses red, green and blue pixels for the display screen. CMY uses cyan, magenta and yellow inks to print on paper. In theory, equal parts of cyan, magenta and yellow ink make black, but the blacks tend to be muddy. Thus, a pure black fourth ink is always used in the four color CMYK process (K for blacK).
二 : YUV
色差输出 S-Video YUV YCbCr YPbPr详细介绍
色差输出
色差信号y,r-y,b-y信号一般通称为y, cr,cb; 习惯上y,cr,cb为数字(pcm)的色差信号,模拟的色差信号则称y,pr,pb,所以我们常在dvd player的内部看到y,cr,cb而在dvd player的外部看到色差输出标示为y,pr,pb或yuv;yuv则是在欧洲电视系统pal中的色差信号的通称,包含数字及模拟的色差信号都称 yuv,所以当您看到yuv时您就要联想到它是pal系统中的y,r-y,b-y信号,它可能是数字(pcm)的yuv,也可能是模拟的yuv S-Video
S-Video具体英文全称叫Separate Video,为了达到更好的视频效果,人们开始探求一种更快捷优秀、清晰度更高的视频传输方式,这就是当前如日中天的S-Video(也称二分量视频接口),Separate Video 的意义就是将Video 信号分开传送,也就是在AV接口的基础上将色度信号C和亮度信号Y进行分离,再分别以不同的通道进行传输,它出现并发展于上世纪90年代后期通常采用标准的4 芯(不含音效) 或者扩展的7 芯( 含音效)。[www.61k.com)带S-Video接口的视频设备( 譬如模拟视频采集/ 编辑卡电视机和准专业级监视器电视卡/电视盒及视频投影设备等) 当前已经比较普遍,同AV 接口相比由于它不再进行Y/C混合传输,因此也就无需再进行亮色分离和解码工作,而且由于使用各自独立的传输通道在很大程度上避免了视频设备内信号串扰而产生的图像失真,极大提高了图像的清晰度,但S-Video 仍要将两路色差信号(Cr Cb)混合为一路色度信号C,进行传输然后再在显示设备内解码为Cb 和Cr 进行处理,这样多少仍会带来一定信号损失而产生失真(这种失真很小但在严格的广播级视频设备下进行测试时仍能发现) ,而且由于Cr Cb 的混合导致色度信号的带宽也有一定的限制,所以S -Video 虽然已经比较优秀但离完美还相去甚远,S-Video虽不是最好的,但考虑到目前的市场状况和综合成本等其它因素,它还是应用最普遍的视频接口。
YUV
电视传输用的名词,一个亮度信号(Y),两个色差信号(U分量、V分量)
YUV(亦称YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(属于PAL)。YUV主要用于优化彩色视频信号的传输,使其向后兼容老式黑白电视。与RGB视频信号传输相比,它最大的优点在于只需占用极少的带宽(RGB要求三个独立的视频信号同时传输)。其中“Y”表示明亮度(Luminance或 Luma),也就是灰阶值;而“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。“亮度”是通过RGB输入信号来创建的,方法是将RGB信号的特定部分叠加到一起。“色度”则定义了颜色的两个方面—色调与饱和度,分别用Cr和CB 来表示。其中,Cr反映了GB输入信号红色部分与RGB信号亮度值之间的差异。而CB反映的是RGB输入信号蓝色部分与RGB信号亮度值之同的差异。
在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD(点耦合器件)摄像机,它把摄得的彩色图像信号,经分色、分别放大校正得到RGB,再经过矩阵变换电路得到亮度信号Y和两个色差信号R-Y、B-Y,最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。这就是我们常用的YUV色彩空间。
YUV格式通常有两大类:打包(packed)格式和平面(planar)格式。前者将YUV分量存放在同一个数组中,通常是几个相邻的像素组成一个宏像素(macro-pixel);而后者使用三个数组分开存放YUV三个分量,就像是一个三维平面一样。表2.3中的YUY2到Y211都是打包格式,而IF09到YVU9都是平面格式。(注意:在介绍各种具体格式时,YUV各分量都会带有下标,如Y0、U0、V0表示第一个像素的YUV分量,Y1、U1、V1表示第二个像素的YUV分量,以此类推。)
MEDIASUBTYPE_YUY2 YUY2格式,以4:2:2方式打包
MEDIASUBTYPE_YUYV YUYV格式(实际格式与YUY2相同)
MEDIASUBTYPE_YVYU YVYU格式,以4:2:2方式打包
yuv YUV
MEDIASUBTYPE_UYVY UYVY格式,以4:2:2方式打包
MEDIASUBTYPE_AYUV 带Alpha通道的4:4:4 YUV格式
MEDIASUBTYPE_Y41P Y41P格式,以4:1:1方式打包
MEDIASUBTYPE_Y411 Y411格式(实际格式与Y41P相同)
MEDIASUBTYPE_Y211 Y211格式
MEDIASUBTYPE_IF09 IF09格式
MEDIASUBTYPE_IYUV IYUV格式
MEDIASUBTYPE_YV12 YV12格式
MEDIASUBTYPE_YVU9 YVU9格式
YUV主要的采样格式
主要的采样格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。[www.61k.com)其中YCbCr 4:1:1 比较常用,其含义为:每个点保存一个 8bit 的亮度值(也就是Y值),每 2x2 个点保存一个 Cr 和Cb 值, 图像在肉眼中的感觉不会起太大的变化。所以, 原来用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 个点需要 8x3=24 bites。而现在仅需要 8+(8/4)+(8/4)=12bites, 平均每个点占12bites。这样就把图像的数据压缩了一半。
上边仅给出了理论上的示例,在实际数据存储中是有可能是不同的,下面给出几种具体的存储形式:
(1)YUV 4:4:4 表示色度频道没有下采样
YUV三个信道的抽样率相同,因此在生成的图像里,每个象素的三个分量信息完整(每个分量通常8比特),经过8比特量化之后,未经压缩的每个像素占用3个字节。
下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3
图 1 显示了 4:4:4 图片中使用的采样网格。灯光样例用叉来表示,色度样例则用圈表示。
图 1. YUV 4:4:4 样例位置
(2)YUV 4:2:2 表示 2:1 的水平下采样,没有垂直下采样。对于每两个 U 样例或 V 样例,每个扫描行都包含四个 Y 样例。
每个色差信道的抽样率是亮度信道的一半,所以水平方向的色度抽样率只是4:4:4的一半。对非压缩的8比特量化的图像来说,每个由两个水平方向相邻的像素组成的宏像素需要占用4字节内存。
下面的四个像素为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为:Y0 U0 Y1 V1 Y2 U2 Y3 V3
映射出像素点为:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]
4:2:2 采样的这种主要形式在 ITU-R Recommendation BT.601 中进行了定义。图 2 显示了此标准定义的采样网格。
yuv YUV
图 2. YUV 4:2:2 样例位置
(3)YUV 4:1:1 表示 4:1 的水平下采样,没有垂直下采样。[www.61k.com)对于每个 U 样例或 V 样例,每个扫描行都包含四个 Y 样例。
4:1:1的色度抽样,是在水平方向上对色度进行4:1抽样。对于低端用户和消费类产品这仍然是可以接受的。对非压缩的8比特量化的视频来说,每个由4个水平方向相邻的像素组成的宏像素需要占用6字节内存。
下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为: Y0 U0 Y1 Y2 V2 Y3
映射出像素点为:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]
(4)YUV4:2:0 表示 2:1 的水平下采样,2:1 的垂直下采样。
4:2:0并不意味着只有Y,Cb而没有Cr分量。它指得是对每行扫描线来说,只有一种色度分量以2:1的抽样率存储。相邻的扫描行存储不同的色度分量,也就是说,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。对每个色度分量来说,水平方向和竖直方向的抽样率都是2:1,所以可以说色度的抽样率是4:1。对非压缩的8比特量化的视频来说,每个由2x2个2行2列相邻的像素组成的宏像素需要占用6字节内存。 下面八个像素为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
[Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]
存放的码流为:Y0 U0 Y1 Y2 U2 Y3
Y5 V5 Y6 Y7 V7 Y8
映射出的像素点为:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]
[Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]
4:2:0 采样有两种常见的变化形式。其中一种形式用于 MPEG-2 视频,另一种形式用于 MPEG-1 以及 ITU-T recommendations H.261 和 H.263。图 3 显示了 MPEG-1 方案中使用的采样网格,图 4 显示了 MPEG-2 方案中使用的采样网格。
图 3. YUV 4:2:0 样例位置(MPEG-1 方案)
yuv YUV
图 4. YUV 4:2:0 样例位置(MPEG-2 方案)
与 MPEG-1 方案相比,在 MPEG-2 方案与为 4:2:2 和 4:4:4 格式定义的采样网格之间进行转换更简单一些。(www.61k.com)因此,在 Windows 中首选 MPEG-2 方案,应该考虑将其作为 4:2:0 格式的默认转换方案。
表面定义
本节讲述推荐用于视频呈现的 8 位 YUV 格式。这些格式可以分为几个类别:
4:4:4 格式,每像素 32 位
4:2:2 格式,每像素 16 位
4:2:0 格式,每像素 16 位
4:2:0 格式,每像素 12 位
首先,您应该理解下列概念,这样才能理解接下来的内容:
表面原点。对于本文讲述的 YUV 格式,原点 (0,0) 总是位于表面的左上角。
跨距。表面的跨距,有时也称为间距,指的是表面的宽度,以字节数表示。对于一个表面原点位于左上角的表面来说,跨距总是正数。
对齐。表面的对齐是根据图形显示驱动程序的不同而定的。表面始终应该 DWORD 对齐,就是说,表面中的各个行肯定都是从 32 位 (DWORD) 边界开始的。对齐可以大于 32 位,但具体取决于硬件的需求。
打包格式与平面格式。YUV 格式可以分为打包 格式和平面 格式。在打包格式中,Y、U 和 V 组件存储在一个数组中。像素被组织到了一些巨像素组中,巨像素组的布局取决于格式。在平面格式中,Y、U 和 V 组件作为三个单独的平面进行存储。
4:4:4 格式,每像素 32 位
推荐一个 4:4:4 格式,FOURCC 码为 AYUV。这是一个打包格式,其中每个像素都被编码为四个连续字节,其组织顺序如下所示。
图 5. AYUV 内存布局
标记了 A 的字节包含 alpha 的值。
4:2:2 格式,每像素 16 位
支持两个 4:2:2 格式,FOURCC 码如下:
YUY2
UYVY
两个都是打包格式,其中每个巨像素都是编码为四个连续字节的两个像素。这样会使得色度水平下采样乘以系数 2。
YUY2
在 YUY2 格式中,数据可被视为一个不带正负号的 char 值组成的数组,其中第一个字节包含第一个 Y 样例,第二个字节包含第一个 U (Cb) 样例,第三个字节包含第二个 Y 样例,
yuv YUV
第四个字节包含第一个 V (Cr) 样例,如图 6 所示。(www.61k.com]
图 6. YUY2 内存布局
如果该图像被看作由两个 little-endian WORD 值组成的数组,则第一个 WORD 在最低有效位 (LSB) 中包含 Y0,在最高有效位 (MSB) 中包含 U。第二个 WORD 在 LSB 中包含 Y1,在 MSB 中包含 V。
YUY2 是用于 Microsoft DirectX? Video Acceleration (DirectX VA) 的首选 4:2:2 像素格式。预期它会成为支持 4:2:2 视频的 DirectX VA 加速器的中期要求。
UYVY
此格式与 YUY2 相同,只是字节顺序是与之相反的 — 就是说,色度字节和灯光字节是翻转的(图 7)。如果该图像被看作由两个 little-endian WORD 值组成的数组,则第一个 WORD 在 LSB 中包含 U,在 MSB 中包含 Y0,第二个 WORD 在 LSB 中包含 V,在 MSB 中包含 Y1。
图 7. UYVY 内存布局
4:2:0 格式,每像素 16 位
推荐两个 4:2:0 每像素 16 位格式,FOURCC 码如下:
IMC1
IMC3
两个 FOURCC 码都是平面格式。色度频道在水平方向和垂直方向上都要以系数 2 来进行再次采样。
IMC1
所有 Y 样例都会作为不带正负号的 char 值组成的数组首先显示在内存中。后面跟着所有 V (Cr) 样例,然后是所有 U (Cb) 样例。V 和 U 平面与 Y 平面具有相同的跨距,从而生成如图 8 所示的内存的未使用区域。
图 8. IMC1 内存布局
IMC3
此格式与 IMC1 相同,只是 U 和 V 平面进行了交换:
yuv YUV
图 9. IMC3 内存布局
4:2:0 格式,每像素 12 位
推荐四个 4:2:0 每像素 12 位格式,FOURCC 码如下:
IMC2
IMC4
YV12
NV12
在所有这些格式中,色度频道在水平方向和垂直方向上都要以系数 2 来进行再次采样。(www.61k.com) IMC2
此格式与 IMC1 相同,只是 V (Cr) 和 U (Cb) 行在半跨距边界处进行了交错。换句话说,就是色度区域中的每个完整跨距行都以一行 V 样例开始,然后是一行在下一个半跨距边界处开始的 U 样例(图 10)。此布局与 IMC1 相比,能够更加高效地利用地址空间。它的色度地址空间缩小了一半,因此整体地址空间缩小了 25%。在各个 4:2:0 格式中,IMC2 是第二首选格式,排在 NV12 之后。
图 10. IMC2 内存布局
IMC4
此格式与 IMC2 相同,只是 U (Cb) 和 V (Cr) 行进行了交换:
图 11. IMC4 内存布局
yuv YUV
YV12
所有 Y 样例都会作为不带正负号的 char 值组成的数组首先显示在内存中。[www.61k.com)此数组后面紧接着所有 V (Cr) 样例。V 平面的跨距为 Y 平面跨距的一半,V 平面包含的行为 Y 平面包含行的一半。V 平面后面紧接着所有 U (Cb) 样例,它的跨距和行数与 V 平面相同(图 12)。
图 12. YV12 内存布局
NV12
所有 Y 样例都会作为由不带正负号的 char 值组成的数组首先显示在内存中,并且行数为偶数。Y 平面后面紧接着一个由不带正负号的 char 值组成的数组,其中包含了打包的 U (Cb) 和 V (Cr) 样例,如图 13 所示。当组合的 U-V 数组被视为一个由 little-endian WORD 值组成的数组时,LSB 包含 U 值,MSB 包含 V 值。NV12 是用于 DirectX VA 的首选 4:2:0 像素格式。预期它会成为支持 4:2:0 视频的 DirectX VA 加速器的中期要求。
YUV格式解析2
又确认了一下H264的视频格式——H264支持4:2:0的连续或隔行视频的编码和解码 谈YPbPr、YCbCr
YPbPr 和YCbCr两种标识,前者表示逐行扫描色差输出,后者表示隔行扫描色差输出. 数字电视的色彩空间和计算机不同,不是RGB空间,而是采用一个亮度信号(Y)和两个色差信号(R-Y、B-Y)的YUV空间或者叫YCbCr空间。数字电视采用YUV(YCbCr)色彩空间的原因主要就是为了减少数据储存空间和数据传输带宽,同时又能非常方便的兼容黑白电视(R-Y和B-Y信号为零)。 YUV(YCbCr)空间和RGB空间可以相互转换,转换公式如下:
Y = 0.299 R + 0.587 G + 0.114 B
Cb = - 0.1687 R - 0.3313 G + 0.5 B + 128
Cr = 0.5 R - 0.4187 G - 0.0813 B + 128
反过来也可以:
R = Y + 1.402 (Cr-128)
G = Y - 0.34414 (Cb-128) - 0.71414 (Cr-128)
B = Y + 1.772 (Cb-128)
YCbCr表示的是数字电视(视频)的色彩空间及数字接口,这是国际通用的标准。YPbPr
yuv YUV
表示的仅仅是模拟视频分量接口,而且仅仅是美国的标准(包括采用美国标准的其他国家)
色相定位Co-sited
Definition of: co-sited
Sampled at the same time. See .
Co-sited sampling
This is a sampling technique applied to colour difference component video signals (Y, Cr, Cb) where the colour difference signals, Cr and Cb, are sampled at a sub-multiple of the luminance, Y, frequency – for example as in 4:2:2. If co-sited sampling is applied, the two colour difference signals are sampled at the same instant, and simultaneously with a luminance sample. Co-sited sampling is the ‘norm’ for component video as it ensures the luminance and the chrominance digital information is coincident, minimising chroma/luma delay.
Definition of: chroma subsampling
A reduced color resolution in digital component video signals. To
accommodate storage and bandwidth limitations, the two color components (Cb, Cr) in digital video signals are compressed by sampling them at a lower rate than the brightness (Y). Color information is actually discarded.
YCbCr is the YUV color space recorded digitally. Y is brightness (luma), and Cb and Cr are the U and V color difference signals (see for details). In chroma
subsampling, only the colors are compressed, not the luma because the eye is more sensitive to brightness than to the color components.
The 4:4:4, 4:2:2, 4:2:0...
YCbCr is designated as 4:n:n. The 4 represents a sampling rate of 13.5 MHz, which is the standard frequency (ITU-R BT.601) for digitizing analog NTSC, PAL and SECAM. The next two digits represent the Cb and Cr rate. Review the illustrations below for details. Each 8x8 matrix represents a "macroblock" of 64 pixels in a video frame. The pink squares are the pixel locations where the sample is taken. Sony's HDCAM uses a different notation because it compresses both the luma and the colors (see
).
4:4:4 (Cb/Cr Same as Luma)
Cb and Cr are sampled at the same full rate as the luma. MPEG-2 supports 4:4:4 coding, but having the same number of color difference samples as the luma is
yuv YUV
considered overkill and not worth the additional bandwidth to transmit it. When video is converted from one color space to another, it is often resampled to 4:4:4
first.
4:2:2 (1/2 the Luma Samples)
Cb and Cr are sampled at half the horizontal resolution of Y. Co-sited means that Cb/Cr samples are taken at the same time as Y. 4:2:2 color sampling is widely used and considered very high quality. It is used for prosumer and professional digital video recording, including DV (at 50 Mbps), Digital Betacam and DVCPRO 50 and is
an option in MPEG-2.
4:1:1 (1/4 the Luma Samples)
Cb and Cr are sampled at one quarter the horizontal resolution. Co-sited means that Cb/Cr samples are taken at the same time as the Y. Co-sited 4:1:1 is used in DV,
DVCAM and DVCPRO formats.
yuv YUV
4:2:0 (1/4 the Luma Samples)
The zero in 4:2:0 means that Cb and Cr are sampled at half the vertical resolution of Y. MPEG-1 and MPEG-2 use 4:2:0, but the samples are taken at different intervals.
By the time MPEG-2 came along, it was known that 4:2:2 coding was often converted to 4:2:0, which is why MPEG-2 sampling more closely lines up with the
4:2:2 pattern. H.261/263 also uses 4:2:0.
Definition of: CMYK
(Cyan Magenta Yellow blacK) The color space used for commercial printing and most color computer printers. In theory, cyan, magenta and yellow (CMY) can print all colors, but inks are not pure and black comes out muddy. The black ink (K) is required for quality printing. See , and
.
Separated Colors
yuv YUV
Each of the four colors are printed independently, but blend together to form all colors. (Image courtesy of Intergraph Computer Systems.)
A CMYK Printer
Typical of a color laser printer, this Tally 8106 printer uses four separate cartridges: one each for cyan, magenta, yellow and black (CMYK). Unlike the commercial print process, which prints the paper four times, in a color laser printer, each of the four inks is applied to the drum before the page is printed.
CMYK Ribbon
yuv YUV
This shows a four-color dye sublimation or thermal wax transfer ribbon where four panels of dye or wax-based ink exist for each page, and each panel is as large as the page. After each page is printed, the ribbon is advanced to the next four-color ribbon set.
Definition of: RGB
(Red Green Blue) The computer's native color space, which is the color system for capturing and displaying images. RGB was derived from our own perception of color because human eyes are sensitive to red, green and blue (see ). Capturing
Cameras and scanners capture color with sensors that record the varying intensities of red, green and blue at each pixel location in the frame (see , and ).
Display and Printing (RGB and CMYK)
For screen display, red, green and blue pixels (dots) are energized to the
appropriate intensity. When all three pixels are turned on high, white is produced. As intensities are equally lowered, shades are derived. The base color of the screen appears when all pixels are off.
For printing on paper, the CMYK color space is used, not RGB. Combinations of cyan, magenta, yellow and black ink make up all the colors. See .
Video Processing (RGB or YUV)
TV/video signals are mostly in the YUV color space. They are converted to RGB in the computer for editing when RGB is the desired output. If YUV is the desired
output, and the video editing program supports YUV, there is no need to convert to RGB for internal processing. However, no matter which color space is used for
editing, all data is converted to RGB for screen display. See and .
Color Mixing Methods
The two major ways to create colors are RGB and CMY. RGB uses red, green and blue pixels for the display screen. CMY uses cyan, magenta and yellow inks to print on paper. In theory, equal parts of cyan, magenta and yellow ink make black, but the blacks tend to be muddy. Thus, a pure black fourth ink is always used in the four color CMYK process (K for blacK).
三 : YUV
RGB颜色表示系统
1.相加混色和相减混色
相加混色是由发光体发出的光相加而产生的颜色,而相减混色是先有白色光,而后从中减去某些成分(吸收)得到各种彩色;相加混色的三基色是红、绿、蓝(RGB),而相减混色的三基色是青(Cyan)、品(Magenta)、黄(Yellow)(CMY,一般不确切的说成是黄、蓝、红);相加混色和相减混色有不同规律(指颜料相混)。
于是相应的有:
RGB:位图颜色的一种编码方法,用红、绿、蓝三原色的光学强度来表示一种颜色。这是最常见的位图编码方法,可以直接用于屏幕显示。
CMYK:位图颜色的一种编码方法,用青、品红、黄、黑四种颜料含量来表示一种颜色。常用的位图编码方法之一,可以直接用于彩色印刷。
2.CIE的RGB颜色表示系统
国际照明委员会(CIE)选择红色(λ=700.00nm)、绿色(λ=546.1nm)和蓝色(435.8nm)三种单色光作为表色系统的三基色。产生1lm的白光所需要的三基色的近似值可用下面的亮度方程来表示:
1lm(W)= 0.30lm(R)+ 0.59lm(G)+ 0.11lm(B)
为了计算方便采用T单位制:
1lm(W)= 1T(R)+ 1T(G)+ 1T(B)
3.人类的彩色感觉
4.色彩深度
色彩深度又叫色彩位数,即位图中要用多少个二进制位来表示每个点的颜色,是分辨率的一个重要指标。常用有1位(单色),2位(4色,CGA),4位(16色,VGA),8位(256色),16位(增强色),24位和32位(真彩色)等。色深16位以上的位图还可以根据其中分别表示RGB三原色或CMYK四原色(有的还包括Alpha通道)的位数进一步分类,如16位位图图片还可分为RGB565,RGB555X1(有1位不携带信息),RGB555A1,RGB444A4等等。
色彩空间
1.YUV色彩空间
YUV是PAL和SECAM模拟彩色电视制式采用的颜色空间。Y表示亮度(Luminance或Luma),是不同权重的R、G、B的平均:
Y = kr R + kg G + kb B
色彩信息可以表示为色差(Chrominance或Chroma),每一个色差表示了RGB与Y的差:
U = B - Y
V = R - Y
这样彩色图像的完整信息——亮度和色差,就由Y和UV分别给出了。
与RGB视频信号传输相比,YUV最大的优点在于只需占用极少的频宽(RGB要求三个独立的视频信号同时传输);采用YUV还有一个原因是,使彩色视频信号的传输兼容老式黑白电视。如果只有Y信号分量而没有U、V分量,那么这样表示的图像就是黑白灰度图像。
YUV与RGB相互转换的公式 (RGB取值范围均为0-255)
Y = 0.299R + 0.587G + 0.114B
U = -0.147R - 0.289G + 0.436B
V = 0.615R - 0.515G - 0.100B
R = Y + 1.14V
G = Y - 0.39U - 0.58V
B = Y + 2.03U
2.YCbCr色彩空间
YCbCr 则是在世界数字组织视频标准研制过程中作为ITU-R BT1601 建议的一部分,其实是YUV经过缩放和偏移的翻版。其中Y与YUV 中的Y含义一致, Cb , Cr 同样都指色彩, 只是在表示方法上不同而已。在YUV家族中, YCbCr 是在计算机系统中应用最多的成员,其应用领域很广泛,JPEG、MPEG均采用此格式。一般人们所讲的YUV大多是指YCbCr。YCbCr 有许多取样格式, 如4:4:4, 4:2:2 , 4:1:1 和4:2:0。
3.YUV 、YIQ、YCbCr的区别
对于YUV模型,实际上很多时候,我们是把它和YIQ/YCbCr模型混为一谈的。
实际上,YUV模型用于PAL和SECAM制式的电视系统,Y表示亮度,UV并非任何单词的缩写。
YIQ模型与YUV模型类似,用于NTSC制式的电视系统。YIQ颜色空间中的I和Q分量相当于将YUV空间中的UV分量做了一个33度的旋转。
YCbCr颜色空间是由YUV颜色空间派生的一种颜色空间,主要用于数字电视系统中。从RGB到YCbCr的转换中,输入、输出都是8位二进制格式。
三者与RGB的转换方程如下:
RGB -> YUV:
Y = 0.299R + 0.587G + 0.114B, U= -0.147R - 0.289G + 0.436B, V = 0.615R - 0.515G - 0.100B
RGB -> YIQ:
Y = 0.299R + 0.587G + 0.114B, I = 0.596R - 0.275G - 0.321B, Q =0.212R - 0.523G + 0.311B
RGB -> YCbCr:
Y = 0.299R + 0.587G + 0.114B, Cb = -0.169R - 0.331G + 0.500B, Cr =0.500R - 0.419B - 0.103B
从公式中,我们关键要理解的一点是,UV/CbCr信号实际上就是蓝色差信号和红色差信号,进而言之,实际上一定程度上间接的代表了蓝色和红色的强度,理解这一点对于我们理解各种颜色变换处理的过程会有很大的帮助。
我们在数字电子多媒体领域所谈到的YUV格式,实际上准确的说,是以YCbCr色彩空间模型为基础的具有多种存储格式的一类颜色模型的家族(包括YUV444 / YUV422 / YUV420 /YUV420P等等)。并不是传统意义上用于PAL制模拟电视的YUV模型。这些YUV模型的区别主要在于UV数据的采样方式和存储方式,这里就不详述。
而在Camera Sensor中,最常用的YUV模型是YUV422格式,因为它采用4个字节描述两个像素,能和RGB565模型比较好的兼容。有利于Camera Sensor和Cameracontroller的软硬件接口设计。
YCbCr采样格式
1.YUV与YCbCr的区别
YUV色彩模型来源于RGB模型,该模型的特点是将亮度和色度分离开,从而适合于图像处理领域。
应用:basic color model used in analogue color TV broadcasting。
YCbCr模型来源于YUV模型。YCbCr is a scaled and offsetversion of the YUV color space。
应用:数字视频,ITU-R BT.601 recommendation。
通过上面的比较可以确定,我们在h.264,mpeg等编码标准中用的YUV其实是YCbCr,大家不要被名称搞混淆了。
2.YCbCr主要的采样格式
人类的视觉系统(HVS)对色度的敏感程度低于亮度,所以,色度频道的采样率可比Y频道低,同时不会明显降低视觉质量,从而达到了压缩的目的。主要的采样格式有YCbCr4:4:4、YCbCr 4:2:2、YCbCr 4:2:0和YCbCr4:1:1。MPEG-4和H.264支持前三种采样格式,YCbCr 4:2:2用于高质量的彩色视频中;应用最广泛的是YCbCr4:2:0,比如视频会议、数字电视、DVD等,用与PAL制式;YCbCr 4:1:1则多用于后者用于NTSC制的DV数据中。
(1) YUV 4:4:424bit/pixel
YUV三个信道的抽样率相同,因此在生成的图像里,每个象素的三个分量信息完整(每个分量通常8比特),经过8比特量化之后,未经压缩的每个像素占用3个字节。
下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3
(2) YUV4:2:216bit/pixel
每个色差信道的抽样率是亮度信道的一半,所以水平方向的色度抽样率只是4:4:4的一半。对非压缩的8比特量化的图像来说,每个由两个水平方向相邻的像素组成的宏像素需要占用4字节内存。
下面的四个像素为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为:Y0 U0 Y1 V1 Y2 U2 Y3 V3
映射出像素点为:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]
(3) YUV4:1:112bit/pixel
4:1:1的色度抽样,是在水平方向上对色度进行4:1抽样。对于低端用户和消费类产品这仍然是可以接受的。对非压缩的8比特量化的视频来说,每个由4个水平方向相邻的像素组成的宏像素需要占用6字节内存。
下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的码流为: Y0 U0 Y1 Y2 V2 Y3
映射出像素点为:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]
(4)YUV4:2:012bit/pixel
4:2:0并不意味着只有Y,Cb而没有Cr分量。它指得是对每行扫描线来说,只有一种色度分量以2:1的抽样率存储。相邻的扫描行存储不同的色度分量,也就是说,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0……以此类推。对每个色度分量来说,水平方向和竖直方向的抽样率都是2:1,所以可以说色度的抽样率是4:1。对非压缩的8比特量化的视频来说,每个由2x2个2行2列相邻的像素组成的宏像素需要占用6字节内存。
下面八个像素为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3] [Y5 U5 V5][Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]
存放的码流为:Y0 U0 Y1 Y2 U2 Y3 Y5 V5 Y6 Y7 V7 Y8
映射出的像素点为:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7] [Y5 U0 V5][Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]
另外,4:2:0 采样有两种常见的变化形式。其中一种形式用于MPEG-2视频,另一种形式用于MPEG-1 以及 H.261 和H.263。下图左边显示了MPEG-2方案中使用的采样网格,右边显示了MPEG-1以及H.261和H.263方案中使用的采样网格。
下图是YUV 4:1:1和YUV 4:2:0的区别:
电视制式
1.电视制式概要
电视信号的标准也称为电视的制式。目前各国的电视制式不尽相同,制式的区分主要在于其帧频的不同、分解率的不同、信号带宽以及载频的不同、色彩空间的转换关系的不同等等。
电视制式就是用来实现电视图像信号和伴音信号,或其它信号传输的方法,和电视图像的显示格式,以及这种方法和电视图像显示格式所采用的技术标准。严格来说,电视制式有很多种,对于模拟电视,有黑白电视制式,彩色电视制式,以及伴音制式等;对于数字电视,有图像信号、音频信号压缩编码格式(信源编码),和TS流(TransportStream)编码格式(信道编码),还有数字信号调制格式,以及图像显示格式等制式。
2.彩色电视制式
NTSC | PAL | SECAM | |
解释 | 正交平衡调幅制——National Television StandardsCommittee | 正交平衡调幅逐行倒相制——Phase-Alternative Line | 行轮换调频制——Sequential Coleur Avec Memoire |
帧频(Hz) | 30 | 25 | 25 |
场频(Hz) | 60 | 50 | 50 |
点*行 | 858*525 | 864*625 | 864*625 |
分辨率 | 760*480 | 720*576 | 720*576 |
亮度带宽(MHz) | 4.2 | 6 | 6 |
色度带宽(MHz) | 1.3(I),0.6(Q) | 1.3(U),1.3(V) | >1.0(U),>1.0(V) |
彩色幅载波(MHz) | 3.58 | 4.43 | 4.25 |
声音载波(MHz) | 4.5 | 6.5 | 6.5 |
使用地区 | 美国、加拿大等大部分西半球国家以及中国的台湾、日本、韩国、菲律宾等 | 德国、英国等一些西欧国家,新加坡、中国大陆及香港,澳大利亚、新西兰等 | 法国、东欧和中东一带 |
一个与人的视觉生理特点有关,当图像的刷新速度达到5 帧/秒的时候,人开始感觉图像是活动的,而达到24帧/秒的时候,人感觉图像是完全连续和流畅的(电影所使用的帧频就是24 Hz ),所以视频信号帧频应大于等于24Hz。理论上来说帧频越高越好,但是帧频越高对电路的要求也越高,技术越复杂,成本也越高。另一个原因是因为我国的电网频率是50Hz,当采用25 Hz 帧频时,隔行扫描时的场频为50 Hz,正好与电网同频,这样,电源对图像的干扰是固定的,人眼不容易感觉出来,所以选择了25Hz的帧频。
电视在显示图像的时候,把一帧分成了两场来显示,一个场由帧中的奇数行组成,叫做奇场;另一个场由帧中的偶数行组成,叫做偶场。之所以要这样做,主要是因为在CRT显像管上每秒钟显示25帧图像时,人眼感觉到连续性还是不太好,而且还有明显的闪烁,一帧分成两场后,场频为50Hz,图像更加连续一些。当然还有一些别的原因,与电路设计方面有关。
PAL制式每帧图像共625行,每场为312.5行,在每场的312.5行中,有一些行要用作场消隐,是不包含视频信号的。按照CCIR656标准规定的行编号方法,奇场的行号为第1至312.5行,偶场的行号为第312.5至625行,其中,奇场的第23.5至310行包含有效的视频信号,共287.5行。偶场的第336至622.5行包含有效的视频信号,共287.5行。所以一帧中有效的总行数为576。由最上面的半行,加上中间的574行,加上最下面的半行
本文标题:yuv-YUV61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1