2025年解决的最后一个技术问题,是这样的。
某个客户发来一段声音文件,采样频率8000Hz,采样长度16bit,单声道mono,PCM格式,完全符合我们IPPBX对于IVR语音导航和彩铃音等语音格式的要求。这个声音文件在电脑和手机上都能正常播放。但是上传到IP-PBX程控交换机之后,播放出来是无声的。
解决办法
将该文件用waveedit打开,重新保存一次(无需更改格式)。
技术分析
本来解决问题就行了。但是客户也是专业人士,所以必须得给个交代呢。
轮到研发工程师出马了。
对比了一下两个文件(客户发的,重新保存的),发现重新保存之后的文件,比客户发来的声音文件,少了6618个字节。
那问题应该是出在文件头。
WAVE文件的文件头,通常以“RIFF”开头,然后是“WAVEfmt”,接着就是“data”出数据了。
观察客户给的WAV文件,中间加了一段AIGC的信息。大概是AIGC Label ContentProducer ProduceID ContentPropagator之类的,这个叫做数字水印。
“Label”:”1″,意思是这个语音文件属于人工智能内容生成合成的。
“ContentProducer”:”001191110………”,是服务提供者的编码或名称,用于标识内容的生产者。根据这个组织主体编码采用的统一社会信用代码,看得出来是一家北京的公司。
,”ProduceID”:”…..” 内容制作编号
“ReservedCode1″:””,预留字段1
“ContentPropagator”:”……”传播平台名称,编号或代码
“PropatorID”:”……”,内容传播编号
“ReservedCode1″:””,预留字段2
AIGC = {
"Label": "1",
"ContentProducer": "AXXXX",
"ProduceID": "BXXXX",
"ReservedCode1": "CXXX",
"ContentPropagator": "DXXX",
"PropagateID": "EXXX",
"ReservedCode2": "FXXXX"
}
随着AIGC内容的流行,这种格式上的兼容性问题可能也会越来越多呢。AIGC生成的音频文件,在上传到IPPBX之前,最好再用专业的声音编辑工具保存一下。


相关内容