1、安装下载相关库及软件
(1)安装pydub库
pip install pydub
(2)ffmpeg下载(ffmpeg是一款音视频解码工具)
下载地址:
ffmpeg下载链接: https://www.gyan.dev/ffmpeg/builds/
下载下图文件
解压后找到此文件夹
在环境变量中加入此地址,如下图所示
在Path中加入地址
在运行界面输入 ffmpeg -version 安装成功后会显示以下内容:
2 、pydub库的修改
寻找虚拟环境下的包地址
即 /envs/##/Lib/site-packages/pydub/utils.py文件
在此文件的第153行,手动添加该路径(即你安装ffmpeg的路径)
完事后记得重启!
运行以下代码
import torchimport pydubimport torch.nn as nn# 读取mp3文件audio = pydub.AudioSegment.from_mp3("./data/广陵散.mp3")# 将数字信号转换为二进制格式raw_data = audio.raw_data# 使用torch.Tensor()将数字信号转换为张量tensor_data = torch.Tensor(list(raw_data))# 打印张量形状print(tensor_data.shape)