Video Signal Process technology lists:








![]()





wav是一种无损的音频文件格式,WAV符合 PIFF(Resource Interchange File Format)规范。 所有的WAV都有一个文件头,这个文件头音频流的编码参数。 WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。 缺点:体积十分大!
PCM(Pulse Code Modulation—-脉码调制录音)。 所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录。 PCM信号是由“1”、“0”等符号构成的数字信号,而未经过任何编码和压缩处理。 与模拟信号比,它不易受传送系统的杂波及失真的影响。动态范围宽,可得到音质相当好的影响效果。
简单来说:wav是一种无损的音频文件格式,pcm是没有压缩的编码方式。
WAV可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中。 基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。
简单来说:pcm是无损wav文件中音频数据的一种编码方式,但wav还可以用其它方式编码。
在文件的前44字节放置标头(header),使播放器或编辑器能够简单掌握文件的基本信息,其内容以区块(chunk)为最小单位,每一区块长度为4字节。

// 将录音文件保存为wav格式,这需要手动填充wav的文件头信息
private RandomAccessFile fopen(String path) throws IOException {
File f = new File(path);
if (f.exists()) {
f.delete();
} else {
File parentDir = f.getParentFile();
if (!parentDir.exists()) {
parentDir.mkdirs();
}
}
RandomAccessFile file = new RandomAccessFile(f, "rw");
// 16K、16bit、单声道
/* RIFF header */
file.writeBytes("RIFF"); // riff id
file.writeInt(0); // riff chunk size *PLACEHOLDER*
file.writeBytes("WAVE"); // wave type
/* fmt chunk */
file.writeBytes("fmt "); // fmt id
file.writeInt(Integer.reverseBytes(16)); // fmt chunk size
file.writeShort(Short.reverseBytes((short) 1)); // format: 1(PCM)
file.writeShort(Short.reverseBytes((short) 1)); // channels: 1
file.writeInt(Integer.reverseBytes(16000)); // samples per second
file.writeInt(Integer.reverseBytes((int) (1 * 16000 * 16 / 8))); // BPSecond
file.writeShort(Short.reverseBytes((short) (1 * 16 / 8))); // BPSample
file.writeShort(Short.reverseBytes((short) (1 * 16))); // bPSample
/* data chunk */
file.writeBytes("data"); // data id
file.writeInt(0); // data chunk size *PLACEHOLDER*
Log.d(TAG, "wav path: " + path);
return file;
}
private void fwrite(RandomAccessFile file, byte[] data, int offset, int size) throws IOException {
file.write(data, offset, size);
Log.d(TAG, "fwrite: " + size);
}
private void fclose(RandomAccessFile file) throws IOException {
try {
file.seek(4); // riff chunk size
file.writeInt(Integer.reverseBytes((int) (file.length() - 8)));
file.seek(40); // data chunk size
file.writeInt(Integer.reverseBytes((int) (file.length() - 44)));
Log.d(TAG, "wav size: " + file.length());
} finally {
file.close();
}
}
# 将文件头去掉,数据转成int型即可
import numpy as np
def wav2pcm(wavfile, pcmfile, data_type=np.int16):
f = open(wavfile, "rb")
f.seek(0)
f.read(44)
data = np.fromfile(f, dtype= data_type)
data.tofile(pcmfile)
# 利用wave库,添加通道信息、采样位数、采样率等信息作为文件头,pcm数据直接写入即可
import wave
def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
pcmf = open(pcm_file, 'rb')
pcmdata = pcmf.read()
pcmf.close()
if bits % 8 != 0:
raise ValueError("bits % 8 must == 0. now bits:" + str(bits))
wavfile = wave.open(wav_file, 'wb')
wavfile.setnchannels(channels)
wavfile.setsampwidth(bits // 8)
wavfile.setframerate(sample_rate)
wavfile.writeframes(pcmdata)
wavfile.close()
AAC-LC 是一个音频编码标准,它是 Advanced Audio Coding (AAC) 的一个配置文件(Profile),全称为 AAC Low Complexity,意为 低复杂度AAC。
AAC 标准还有其他变体,它们在压缩效率、复杂度和延迟方面有所不同:
简单来说,AAC-LC 是目前最主流和兼容性最好的 AAC 格式,是高品质音频压缩的基石。
在音频系统中,进行采样率转换(SRC)的主要原因是为了确保不同来源的音频信号能够在统一的采样率下进行处理和输出。这一过程对于音频系统的兼容性、同步性和音质保持至关重要。 以下是对这一问题的详细分析:
统一采样率以实现兼容性 在音频系统中,不同设备或音频源可能使用不同的采样率。例如,CD音频通常使用44.1kHz的采样率,而某些设备可能使用48kHz的采样率。 如果这些音频信号直接混合或处理,可能会导致信号失真或无法正确播放。因此,通过采样率转换(SRC)将所有音频信号转换为统一的采样率(如48kHz),可以确保 所有音频信号在混合和处理过程中保持一致。
防止音调失真和保持同步 不同采样率的音频信号在混合时可能会导致音调失真或相位失真。通过采样率转换,可以确保所有音频信号在相同的采样率下进行处理,从而避免因采样率不一致导致的音质问题。此外,采样率转换还可以帮助系统保持同步,特别是在多设备或多音频源共存的环境中。
提高音频处理的灵活性和兼容性 在音频制作和播放过程中,不同设备和平台可能使用不同的采样率。例如,数字音频工作站(DAW)可能使用高采样率(如96kHz或192kHz)进行录制和编辑,但最终输出到CD或视频时可能需要转换为44.1kHz或48 kHz的采样率。采样率转换使得音频文件可以在不同设备和平台之间进行转换,从而提高音频处理的灵活性和兼容性。
减少混叠伪影和提高音质 在采样率转换过程中,适当的采样率转换算法可以减少混叠伪影和信号失真。例如,通过插值或降采样技术,可以保持音频信号的完整性,同时减少高频失真和噪声。高质量的采样率转换器(SRC)可以提供高保真度的音频输出,从而提高整体音质。
支持异步采样率转换 在某些情况下,音频系统可能需要在不同采样率之间进行异步转换。例如,异步采样率转换器(SRC)可以在不同采样率之间进行转换,而无需同步时钟信号,从而提高系统的灵活性和稳定性。这种异步转换方式可以减少抖动和时钟漂移的影响,从而提高音频信号的稳定性和可靠性。
硬件和软件实现的考虑 采样率转换可以在硬件或软件中实现。
硬件采样率转换器(SRC)通常具有更高的处理速度和更低的延迟,适合实时音频处理。
而软件采样率转换虽然灵活性高,但可能在实时处理中存在性能瓶颈。
因此,选择合适的采样率转换方法和算法对于音频系统的性能和音质至关重要。
在音频系统中,进行采样率转换(SRC)的主要目的是为了确保不同来源的音频信号能够在统一的采样率下进行处理和输出,从而提高音频系统的兼容性、同步性和音质。
通过采样率转换,可以避免因采样率不一致导致的音质问题,并提高音频处理的灵活性和兼容性。
因此,采样率转换在现代音频系统中具有重要的应用价值。
1.SRecord
pip install intelhex
pip install bincopy
BIN2MOT(), BINARY to Motorola S-Record file converter utility.(http://www.keil.com/download/docs/4.asp)
SRecordizer is a tool for viewing, editing, and error checking S19 format files.(http://srecordizer.codeplex.com/)
binex - a converter between Intel HEX and binary for Windows.(http://www.nlsw.nl/software/)
libgis, open source C library that converts Intel HEX, Motorola S-Record, Atmel Generic files.(https://github.com/vsergeev/libGIS)
kk_srec is a C library and program for reading the SREC format.(https://github.com/arkku/srec)
vscode使用c/c++插件,发现
解决办法: File->Preferences->Settings
搜索“intelli Sense Engine”。
如果C_CPP: Intelli Sense Engine的值是Disabled,则下拉选择default。
退出设置界面或vscode,重新打开。

visual studio code中,c/c++插件重启,提示 “Unable to resolve configuration with compilerPath “/usr/local/bin/gcc”. Using “cl.exe” instead.”,
解决办法:
在VSCode中按下 Ctrl+Shift+P,
输入并选择 C/C++: Edit Configurations (UI)
然后,检查并配置正确的compiler,windows下为cl.exe,linux下为gcc。