韩国科学技术院(KAIST,校长李光炯)的电气电子工程学院李晟柱教授研究团队与卡内基梅隆大学(CMU)合作,开发了基于人工智能的音乐创作辅助系统 Amuse。该研究于4月26日至5月1日在日本横滨举行的全球顶级人机交互会议之一——ACM计算系统中的人为因素大会(CHI)上发布,并荣获最佳论文奖,该奖项仅授予所有投稿论文中的前1%。
李晟柱教授团队开发的Amuse系统是一种基于人工智能的系统,可将文本、图像和音频等多种形式的灵感转化为和声结构(和弦进行)以辅助作曲。
例如,如果用户输入“温暖夏日海滩的回忆”这样的短语、图像或声音片段,Amuse会自动生成并推荐与灵感相匹配的和弦进行。
与现有生成式人工智能不同,Amuse的差异化在于其尊重用户的创作流程,并通过允许灵活整合和修改AI建议的交互方式,自然地引导创作探索。
Amuse系统的核心技术是一种融合了两种途径的生成方法:大型语言模型根据用户的提示和灵感生成音乐代码,而另一个基于真实音乐数据训练的AI模型则通过拒绝采样过滤掉生硬或不自然的结果。
研究团队针对实际音乐家开展了用户研究,评估认为Amuse作为创意伙伴(或称为“共创型AI”)具有巨大潜力,该概念强调人与AI协作,而非由生成式AI简单拼凑歌曲。
李晟柱教授表示:“近期生成式AI技术引发了担忧,因其直接模仿受版权保护内容从而侵犯创作者版权,或无视创作者意图单向生成结果。鉴于此,研究团队关注这一趋势,着眼于创作者的实际需求,并致力于设计以创作者为中心的AI系统。”
他补充道:“Amuse是在保持创作者主动权的前提下探索与AI协作可能性的尝试,有望成为未来音乐创作工具和生成式AI系统发展中提出更友好创作者方向的起点。”
本研究在韩国国家研究基金会(NRF)获得政府(科学和信息通信技术部)资助的支持下完成。(项目编号:RS-2024-00337007)
2025-08-02
2025-08-02
2025-08-02
2025-08-02