多媒体技术学习笔记

多媒体技术这一章以前从来没有了解过,这次学习非常新奇,有音频、视频和压缩技术。

音频概念

人耳能听到的范围是20Hz-20kHZ之间,说话的范围是300HZ-3400HZ之间,乐器发声的频率和人耳听到的频率是一致的。声音要记录下来就必须采样,根据奎奈斯特定理,采样频率达到声音最大频率2倍,就能还原出原声波,采样精度就是记录数据的位数,精度越高,声音记录得最完整。

音频文件大小的计算:采样频率*采样位数*声道数/8;

1.1 音频文件的几种常见格式

WAV文件是经过数模转换直接得到的文件,没有经过压缩,所以文件很大;
MIDI文件是电子乐器与计算机连接的标准,文件容量很小;
APE文件,将WAV压缩成APE文件后,容量变成一半,但是还能还原成CD品质,但是MP3无法还原成CD品质;
MP3文件是MPEG-1标准制定音频标准,压缩比率高,是目前最流行的音乐格式。MP1用于数字录像机,比较大,音质也好;MP2用于VCD、CD-ROM中。

图像概念

光的三原色是黄、绿、蓝三种颜色,在印刷时的三原色是青、洋红、黄色三种颜色,光的三原色是发射光,而印刷色是反射光。图像的每个点就是一个像素,每一个像素要用若干个数来表示其亮度、色彩和属性。

2.1 RGB彩色空间

RGB是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色。当色彩深度为24位的时候,每8位代表一个色彩。

2.2 YUV彩色空间

YUV主要用于优化彩色视频信号的传输,使其向后相容老式黑白电视。

2.3 CMYK彩色空间

CMYK也称作印刷色彩模式(青色、洋红色、黄色、定位套版色),就是用来印刷的。RGB模式是一种发光的色彩模式,你在一间黑暗的房间内仍然可以看见屏幕上的内容;CMYK是一种依靠反光的色彩模式,它需要有外界光源,如果你在黑暗房间内是无法阅读印刷的材料的。

2.4 HSV彩色空间

使用色相、饱和度、色调来原示颜色的方法,通常用于艺术设计。

图片文件大小的计算:像素*位数/8或者像素*LOG2(色数)/8。

2.5 图像文件格式

BMP文件是位图,没有进行压缩,所在占地方比较大;
JPEG文件是一种效压缩算法产生的图像,占地大比较小;
GIP文件可以在一个文件里面存储多张图片,然后以一定的速度依次读出的图像,色彩深度有1到8位;
TIFF格式主要用于扫描仪设备。

视频

视频就是指电视、电影,有模拟视频和数字视频两种区别,模拟视频就是最原始的视频形式,没有经过压缩,因此容量相当大;数字视频则对视频进行了压缩。如果不进行压缩,一个电影可能几百G,一台电脑也存不了一部。

彩色电视信号,也就是制式有三种:NTSC制式,美国、加拿大等国家采用,每秒30帧,525条扫描线;PAL制式,德国、英国、中国等采用,每秒25帧,625条扫描线;SECAM制式,中东、法国等采用,每秒25帧,625条扫描线。

扫描时有隔行扫描逐行扫描两种区别,采用隔行扫描时可避免闪烁的现象。在这方面电脑与电视有区别,由于电脑是数字视频,采用了压缩技术,存储器足够,所以扫描次数能达到更高。

大小计算:每帧图大小*每秒帧数*时间+音频大小*时间。

多媒体压缩标准

动态图像每秒25帧,即25张图片,显然一个视频容量巨大,MPEG则是运动图像压缩的标准方法,它是针对相互连续的几帧相差甚微的事实来压缩的。MPEG先用JPEG对每一帧进行压缩,后每一帧只需保留两帧之间的差值,隔一定时间再将完整的帧放入,这样就能正常播放了。

  • JPEG 是一种有损压缩算法,使用的是离散余弦算法,用于RGB转YUV图像。
  • JPEG2000 有无损压缩和有损压缩两种,使用小波变换算法,主要用在医学图像应用。
  • MPEG-1 使用的也是离散余弦算法,主要用在VCD技术、MP3技术中。
  • MPEG-2 使用的是离散余弦算法,用于DVD、有线、卫星电视和AAC技术。
  • MPEG-4 用于网络应用、可视电话、无线通信和增强交互性的地方。
  • MPEG-7 不是标码标准,而是多媒体内容描述接口。
  • MPEG-21 融合不同协议,制定新的集成标准。

发表评论

电子邮件地址不会被公开。 必填项已用*标注