本项目实现了一种为音频文件添加保护性噪声的系统,使其对AI训练模型不可学习,同时保持对人耳的高质量可听性。基于论文 "Unlearnable Examples: Making Personal Data Unexploitable" 的研究成果,我们将此技术扩展应用到音频领域。
本系统提供以下核心功能:
- 上传各种格式的音频文件(MP3、WAV、OGG、FLAC)
- 为音频添加特殊的保护性噪声
- 支持多种噪声类型:波噪声、误差最小化噪声或组合噪声
- 调整噪声振幅以平衡保护强度和音频质量
- 下载处理后的受保护音频文件
本项目包含两个主要部分:
- 前端界面:使用Next.js框架构建的响应式Web应用
- 处理后端:使用Python实现的音频处理算法
- Next.js
- React
- TypeScript
- Tailwind CSS
- Framer Motion(动画效果)
- Python
- PyTorch(用于不可学习模式生成)
- 音频处理库
- Node.js (v18+)
- Python 3.8+
- PyTorch
- 安装Python依赖
pip install -r requirements.txt- 安装前端依赖并运行
cd Front_end/测试demo
npm install
npm run dev- 访问应用 打开浏览器访问 http://localhost:3000
- 在主页面点击上传区域或拖放音频文件
- 选择噪声类型:
- 波噪声:添加人耳难以察觉的高频噪声
- 误差最小化噪声:添加针对AI训练过程的特定干扰噪声
- 组合噪声:同时使用两种噪声以获得最佳保护效果
- 调整噪声振幅滑块:
- 较低的值使噪声更难被人耳察觉
- 较高的值提供更强的保护,但可能影响音频质量
- 点击"上传音频"按钮开始处理
- 等待处理完成后,您可以:
- 播放受保护的音频文件
- 下载处理后的文件
- 选择处理另一个文件
本系统通过向音频添加不影响人类感知但能干扰深度学习模型的特殊噪声模式,使音频对AI训练"不可学习"。这种技术可以帮助保护用户的音频数据(如语音、音乐创作等)免受未经授权的AI训练。
Q: 处理后的音频质量会下降吗?
A: 在默认设置下,噪声被设计为几乎不被人耳察觉。您可以通过降低噪声振幅以进一步减小对音频质量的影响。
Q: 受保护的音频对所有AI模型都有效吗?
A: 当前实现主要针对常见的音频分类和识别模型。不同AI模型的抵抗效果可能有所不同。
Q: 我可以处理多长的音频文件?
A: 系统支持处理各种长度的音频文件,但处理时间会随文件大小增加。