1月16日,KAIST物理系郑夏雄教授领导的研究团队宣布,通过人工神经网络模型识别出音乐本能如何从人脑中自发产生而无需特殊学习的原理。
此前,许多研究人员试图识别不同文化中存在的音乐之间的相似性和差异,并试图理解这种普遍性的起源。2019年发表在《科学》杂志上的一篇论文揭示,所有民族志上不同的文化都产生音乐,并使用相似的节拍和曲调形式。神经科学家之前也发现,人脑的特定部分,即听觉皮层,负责处理音乐信息。
郑教授的团队使用人工神经网络模型证明,认知功能在处理自然接收的听觉信息时会自发形成音乐形式,而无需被教授音乐。研究团队利用Google提供的大规模声音数据集AudioSet,教导人工神经网络学习各种声音。有趣的是,研究团队发现网络模型中的某些神经元会选择性响应音乐。换句话说,他们观察到自发产生的神经元对其他声音(如动物、自然或机器的声音)反应最小,但对各种形式的音乐(包括器乐和声乐)显示出高水平响应。
人工神经网络模型中的神经元显示出与真实大脑听觉皮层相似的响应行为。例如,人工神经元对裁剪成短间隔并重新排列的音乐声音反应较弱。这表明自发产生的音乐选择性神经元编码音乐的时间结构。这种特性不仅限于特定音乐流派,而是在25种不同流派中出现,包括古典、流行、摇滚、爵士和电子音乐。
此外,抑制音乐选择性神经元的活动被发现大大降低对其他自然声音的认知准确性。也就是说,处理音乐信息的神经功能有助于处理其他声音,“音乐能力”可能是演化适应过程中形成的本能,以更好地处理自然声音。
指导研究的郑夏雄教授表示:“我们的研究结果意味着演化压力有助于在各种文化中形成处理音乐信息的普遍基础。”关于研究意义,他解释:“我们期待这个人工构建的具有类人音乐性的模型成为基础模型,用于AI音乐生成、音乐治疗和音乐认知研究等应用。”他补充了局限性:“然而,本研究未考虑学习音乐后的发展过程,必须注意这是针对早期发育中处理音乐信息基础的研究。”
这项研究由KAIST物理系第一作者金广秀博士(现任职:MIT脑与认知科学系)和金东谦博士(现任职:IBS)进行,发表在《自然通讯》上,标题为“深度神经网络中基本音乐探测器的自发涌现”。
这项研究得到了韩国国家研究基金会的支持。
Journal Reference:
Gwangsu Kim, Dong-Kyum Kim, Hawoong Jeong.Spontaneous emergence of rudimentary music detectors in deep neural networks.Nature Communications, 2024; 15 (1) DOI:10.1038/s41467-023-44516-0
2025-08-04
2025-08-04
2025-08-04
2025-08-04