基于VB的流媒体解码与播放技术

2008-02-23 06:39:13来源:互联网 阅读 ()

新老客户大回馈,云服务器低至5折

一、 前言

  流媒体的定义很广泛,大多数时候指的是把连续的影像和声音信息经过压缩处理后放上网站服务器,让用户一边下载一边观看、收听,而不需要等整个压缩文件下载到自己机器就可以观看的视频/音频传输、压缩技术。流媒体也指代由这种技术支持的某种特定文件格式:压缩流式文件,它通过网络传输,并通过个人电脑软件进行解码。面对流媒体技术的迅猛发展,作为软件技术开发人员,关心的是将如何应对的问题。流媒体的处理,以其复杂性和技术性,一向受到工业界和技术界的关注。特别是随着互联网的普及,流媒体通过网络广泛应用在工业控制、现场监控、视频会议、大众娱乐等方面,选择一种合适的应用方案,可以达到事半功倍的目的。

  MCI是微软为Windows最初提出的多媒体编程接口,它管理媒体控制接口(MCI)设备上的多媒体文件的记录与回放。它被用来向诸如声卡、MIDI 序列发生器、CD-ROM 驱动器、视频CD播放器和视频磁带记录器及播放器等设备发出MCI命令,还支持 Windows (*.avi) 视频文件的回放。MCI编程实现起来并不困难,但是对于用户要求获取的某些有关压缩数据流的信息和希望实现的某些功能,比如图线尺寸、Copmression Rate、图形的缩放显示等,上叙控件所提供的为方便程序开发人员使用的高层接口已不适用,要想在此基础上实现对底层的一些操作,难度可想而知;另外随着多媒体技术的迅速发展,各种压缩算法在该领域的的应用,MCI技术越来越显的力不从心,最明显的是它不支持可变比特率的压缩算法,对于处理DVD等近年出现的多种新的媒体格式也已经显的无能为力,怎么办呢?为此我们介绍一种建立在DirectX技术上的方法来实现操作多媒体数据流。作为MCI的"接班人",微软适时推出了建立在DirectX(包含DirectDraw、DirectSound、Direct3D)之上的DirectShow技术,它是在DirectX之上的媒体层,支持来自本地或网络的各种视频、音频压缩格式的媒体文件的解码和回放,可以从设备上捕捉多媒体流,可以回放各种压缩算法处理的流媒体。这些格式包括:MPEG的音频和视频标准、音频和视频交互标准(AVI)、WAVE、MIDI和高级流格式ASF。

  DirectShow对媒体数据处理采用流媒体(Multimedia Stream)的方式,在应用中使用该方式可以大大的减少编程的复杂程度,同时又可以自动协商从数据源到应用的转换,流接口提供了统一的、可以预测的数据存取的控制方法,这样应用程序在播放媒体数据时不需要考虑它最初的来源和格式。

  上面说了那么多,还没有进入正题,其实在Windows\System下有一个Windows中自带的用于控制运动图像播放的动态链接库Quatrz.dll,它实现了对DirectShow的简单封装,或者说它是当今流行的DirectShow技术的前身,在该库中定义了IBasicAudio,IbasicVideo、IBasicVideo2,IMediaEvent 、IMediaEventEx、ImediaPosition、ImediaControl和IVideoWindow等类,程序开发人员可以利用它们方便地控制和操作各种格式的流媒体。例如,直接调用ImediaControl类的无参函数Run、Pause、Stop等就可以控制流媒体的播放进程;利用IMediaPosition类对具体播放细节进行定位操作等。对于流媒体的数据输出显示并不需要特别的控件,在VisualBasic编程中可以简单的选择一个窗体作为容器或一个PictureBox控件作为容器。为了使用该动态连接库,你需要作的仅仅是在生成一个项目后,点击VB开发环境的工程/引用菜单,在弹出的对话框中选择ActiveMovie Control type library就可以了。
二、VB开发流媒体的播放技术

  为了是说明如何在VB中利用ActiveMovie Control type library实现流媒体的播放,下面给出了一个名为VBDemo的项目实现代码,该程序可以以不同的速率来播放wav、avi、mepg等多种格式的多媒体文件,同时显示多媒体文件的长度、播放速率等信息。 在这个项目的窗体上定义一个FILE(名字为mnu_File)的主菜单,它包含OPEN(名字为mnu_FileOpen)和EXIT(名字为mnu_FileExit)子菜单,分别用于打开流媒体文件和退出应用程序;工具条tbControlBar上定义三个按钮,分别为实现流媒体的"播放"、"暂停"、"停止"功能的按钮;名为picVideoWindow的PictureBox控件用来作为播放流媒体视频数据的容器;slBanlance和slVolume两个Slider控件分别用来控制媒体流的声音大小和平衡度,它们的最大最小值分别为(-10000,0)和(-5000,5000);在界面的信息栏中,txtDuration和txtBox这两个TextBox控件分别用来显示正在播放的流媒体的时间长度和播放速率;关于播放速率,用户可以通过optplaybackR单选框来选择正常播放、两倍速率播放还是半速播放。程序编译后的界面如下(抱歉,使用考屏的方法无法将播放的图像一同考贝下来):



  程序的主要实现思路是在调用了Windows\System下动态链接库Quatrz.dll的基础上,定义一个全局的Object对象m_objMediaControl,令m_objMediaControl指向FilgraphManager的一个新实例,调用它的RenderFile函数装载需要播放的流媒体文件,然后使用Run等函数就可以实现各种播放功能了;为了将流媒体的语音效果准确的显示出来,需要再定义一个IbasicAudio音频对象m_objBasicAudio,用来提取流媒体的音频数据并控制语音的大小,IMediaPosition 对象m_objMediaPosition是用来为多媒体文件定位的。最后显示流媒体时需要打开一个播放Video的窗口,可以将picVideoWindow的句柄hWnd赋给的m_objVideoWindow的Owner属性 ,这样picVideoWindow就可以显示接收的多媒体数据流了。具体实现代码如下:

******************************************************************
为了处理多媒体流,定义以下全局变量.
*******************************************************************

Option Explicit
Private m_dblRate As Double '多媒体流播放的幀速率,也既是每秒播放的幀数;
Private m_bstrFileName As String '需要播放的流媒体文件名;
Private m_dblRunLength As Double '播放的流媒体的持续时间,单位为秒;

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:Viusal Basic程序员的.NET泛型编程

下一篇:用VB编程实现图像的熠熠生辉效果