在音频中存储数据_北京前沿科学技术研究院

研究人员开发出一种技术，可将数据嵌入音乐并传输至智能手机。由于这些数据人耳无法察觉，因此不会影响收听体验。该技术或将在酒店、博物馆和百货商店等领域催生有趣的应用。

为了存储数据，这两位博士生及其同事——硕士生加布里埃尔·瓦伊罗尔——对音乐进行了极细微的修改。与近年来其他科学家的尝试相比，研究人员称，他们的新方法能实现更高的数据传输速率，且对音乐无听觉上的影响。艾歇尔伯格说："我们的目标是确保不影响聆听体验。"

研究人员进行的测试表明，在理想条件下，他们的技术能以每秒高达400比特的速率传输数据，而普通听众无法察觉原始音乐与修改后版本之间的差异（另请参阅音频样本）。考虑到在实际条件下需要一定程度的冗余来保证传输质量，传输速率更可能约为每秒200比特——或大约25个字母。坦纳补充说："理论上，可以更快地传输数据。但传输速率越高，数据就越快会感知为干扰噪音，或者数据质量会受损。"

主音符隐藏信息

苏黎世联邦理工学院计算机工程与网络实验室的研究人员利用音乐作品中的主音符，在每个主音符上叠加两个音调略低和两个音调略高、且音量低于主音符的音符。他们还利用了最强音符的泛音（高一个或多个八度），同样在此处插入音调略低和略高的音符。正是所有这些附加的音符承载了数据。虽然智能手机可以通过内置麦克风接收和分析这些数据，但人耳却察觉不到这些附加音符。

艾歇尔伯格说："当我们听到一个响亮的音符时，我们不会注意到频率稍高或稍低的更安静的音符。这意味着我们可以利用音乐作品中响亮的主音符来隐藏声学数据传输。"因此，最适合这种数据传输的音乐是包含大量主音符的音乐——例如流行歌曲。安静的音乐则不太适合。

为了告诉智能手机中的解码算法需要在何处寻找数据，科学家们使用了人耳几乎无法察觉的极高音：他们用一段声学数据流替换了9.8-10 kHz频率范围内的音乐，该数据流携带的信息说明了在音乐其余频谱中的何时何处可以找到正在传输的数据。

从扬声器到麦克风

这项技术背后的传输原理，与汽车收音机中用于传输电台名称和正在播放的音乐细节的著名RDS系统有着根本的不同。坦纳解释说："在RDS中，数据是利用调频无线电波传输的。换句话说，数据是从调频发射器发送到收音设备。而我们所做的，是将数据嵌入音乐本身——实现从扬声器到麦克风的数据传输。"

参考文献

Eichelberger M, Tanner S, Voirol G, Wattenhofer R: Imperceptible Audio Communication. 第44届IEEE声学、语音与信号处理国际会议(ICASSP), 布莱顿, 2019年5月12-17日