torchaudio.info¶
- torchaudio.info(uri: Union[BinaryIO, str, PathLike], format: Optional[str] = None, buffer_size: int = 4096, backend: Optional[str] = None) AudioMetaData ¶
获取音频文件的信号信息。
注意
当输入类型为类文件对象时,此函数无法获取某些格式(例如
vorbis
)的正确长度(num_samples
)。在这种情况下,num_samples
的值为0
。- 参数:
uri (路径类对象 或 类文件对象) –
音频数据的来源。接受以下类型
path-like
:文件路径或 URL。file-like
:具有read(size: int) -> bytes
方法的对象,该方法返回长度最多为size
的字节字符串。
format (str 或 None, 可选) – 如果不为
None
,则解释为提示,它可能允许后端覆盖检测到的格式。(默认值:None
)buffer_size (int, 可选) – 处理类文件对象时使用的缓冲区大小(以字节为单位)。(默认值:
4096
)backend (str 或 None, 可选) –
要使用的 I/O 后端。如果为
None
,则函数根据输入和可用的后端选择后端。否则,必须是 ["ffmpeg"
、"sox"
、"soundfile"
] 之一,并且相应的后端可用。(默认值:None
)另请参阅
- 返回值:
AudioMetaData
- 使用
info
的教程 - 音频 I/O
支持结构¶
AudioMetaData¶
- class torchaudio.AudioMetaData[source]¶
torchaudio.info
函数的返回类型。- 变量:
sample_rate (int) – 采样率
num_frames (int) – 帧数
num_channels (int) – 通道数
bits_per_sample (int) – 每样本的比特数。对于有损格式或无法准确推断时,此值为 0。
encoding (str) –
音频编码 encoding 可以取的值如下:
PCM_S
:有符号整数线性 PCMPCM_U
:无符号整数线性 PCMPCM_F
:浮点线性 PCMFLAC
:Flac,免费无损音频编解码器ULAW
:Mu-lawALAW
:A-lawMP3
:MP3,MPEG-1 音频第 3 层VORBIS
:OGG VorbisAMR_WB
:自适应多速率宽带AMR_NB
:自适应多速率窄带OPUS
:OpusHTK
:单通道 16 位 PCMUNKNOWN
:以上皆非
- 使用
AudioMetaData
的教程 - 音频 I/O