特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

SDL_AudioSpec 解析以及使用说明

来源：互联网收集：自由互联发布时间：2023-09-07

前言 SDL_AudioSpec是包含音频输出格式的结构体，同时它也包含当音频设备需要更多数据时调用的回调函数。解析头文件说明 typedef struct SDL_AudioSpec{ int freq; /** DSP frequency -- samples per sec

前言

SDL_AudioSpec是包含音频输出格式的结构体，同时它也包含当音频设备需要更多数据时调用的回调函数。

解析

头文件说明

typedef struct SDL_AudioSpec
{
    int freq;                   /**< DSP frequency -- samples per second */
    SDL_AudioFormat format;     /**< Audio data format */
    Uint8 channels;             /**< Number of channels: 1 mono, 2 stereo */
    Uint8 silence;              /**< Audio buffer silence value (calculated) */
    Uint16 samples;             /**< Audio buffer size in sample FRAMES (total samples divided by channel count) */
    Uint16 padding;             /**< Necessary for some compile environments */
    Uint32 size;                /**< Audio buffer size in bytes (calculated) */
    SDL_AudioCallback callback; /**< Callback that feeds the audio device (NULL to use SDL_QueueAudio()). */
    void *userdata;             /**< Userdata passed to callback (ignored for NULL callbacks). */
} SDL_AudioSpec;

freq采样率

指定了每秒向音频设备发送的sample数。常用的值为：11025，22050，44100。值越高质量越好。

format音频数据格式

format 告诉SDL我们将要给的格式。在“S16SYS”中的S表示有符号的signed，16表示每个样本是16位长的，SYS表示大小头的顺序是与使用的系统相同的。这些格式是由avcodec_decode_audio2为我们给出来的输入音频的格式。

channels声音的通道数

1 单声道, 2 立体声;

silence 表示静音的值

因为声音采样是有符号的，所以0当然就是这个值

size 音频缓存区大小（字节数）

当我们想要更多声音的时候，我们想让SDL给出来的声音缓冲区的尺寸。一个比较合适的值在512到8192之间；ffplay使用1024

samples音频缓冲区中的采样个数（详细说明）

这个决定了回调len的长度，len=sampleschn位宽（单位是字节）

该值设置的不正确会导致出现哒哒哒的噪音，例如MP2音频格式设置的采样个数是1152，如果设置为1024，就会出现噪音

摘自WIKI

samples specifies a unit of audio data. When used with SDL_OpenAudioDevice() this refers to the size of the audio buffer in sample frames. A sample frame is a chunk of audio data of the size specified in format multiplied by the number of channels. When the SDL_AudioSpec is used with SDL_LoadWAV() samples is set to 4096. This field's value must be a power of two.

理解

samples指定了一帧音频数据包含的采样个数.相比于视频数据还需要分包，音频数据每一帧比较小，每秒钟采集的样本个数会分割成好几帧数据进行传输

实际上该值是每次读取的采样数量，多久产生一次回调

例如

// 音频参数设置SDL_AudioSpec
    spec.freq = 44100;          // 采样频率
    spec.format = AUDIO_S16SYS; // 采样点格式
    spec.channels = 2;          // 2通道
    spec.silence = 0;
    spec.samples = 1024;       // 23.2ms -> 46.4ms 每次读取的采样数量，多久产生一次回调
    spec.callback = fill_audio_pcm; // 回调函数
    spec.userdata = NULL;

疑问

audio buffer size in samples (power of 2); 详情参考“讨论”

析疑

实际上针对AAC,M4a采样个数设置为1024，针对MP2,MP3,WMA采样个数设置为1152，不一定是2的幂指数次方，该值最好由AVFrame->nb_samples参数赋值

例子

SDL_AudioSpec audioSpec;
audioSpec.freq = aCodecCtx->sample_rate;
audioSpec.format = AUDIO_S16SYS;
audioSpec.channels = aCodecCtx->channels;
audioSpec.silence = 0;
audioSpec.samples = AVFrame->nb_samples;
audioSpec.callback = audio_callback;
audioSpec.userdata = aCodecCtx;