韩国科学技术院(KAIST,校长李光炯)电气电子工程学系的Sung-Ju Lee教授研究团队与卡内基梅隆大学(CMU)合作,开发了基于人工智能的音乐创作支持系统Amuse。该研究于4月26日至5月1日在日本横滨举行的ACM计算系统人为因素会议(CHI)上发表,该会议是人机交互领域全球顶级会议之一,并荣获最佳论文奖,该奖项仅授予所有投稿论文的前1%。
Sung-Ju Lee教授研究团队开发的Amuse系统基于人工智能,可将文本、图像和音频等多种形式的灵感转化为和声结构(和弦进行)以支持作曲。
例如,若用户输入"温暖夏日沙滩的回忆"等短语、图像或声音片段,Amuse会自动生成并建议与该灵感相匹配的和弦进行。
与现有生成式AI不同,Amuse的差异化在于尊重用户的创作流程,并通过交互式方法(允许灵活整合和修改AI建议)自然地引导创意探索。
Amuse系统的核心技术是融合两种方法的生成方式:大型语言模型根据用户的提示和灵感创建音乐代码,而另一个基于真实音乐数据训练的AI模型则通过拒绝采样过滤生硬或不自然的结果。
研究团队针对实际音乐家开展了用户研究,评估认为Amuse作为创意伴侣(或称共同创作AI)具有巨大潜力——该概念强调人与AI协作,而非由生成式AI简单拼凑歌曲。
Sung-Ju Lee教授表示:"近期生成式AI技术引发担忧,因其直接模仿受版权保护内容从而侵犯创作者版权,或无视创作者意图单向生成结果。鉴于此,研究团队关注此趋势,重视创作者的实质需求,并聚焦于设计以创作者为核心的AI系统。"
他补充道:"Amuse是在保持创作者主导权的前提下探索与AI协作可能性的尝试,预计将成为未来音乐创作工具和生成式AI系统开发中,提出更友好创作者方向的起点。"
本研究在韩国国家研究基金会(NRF)政府资金(科学和信息通信技术部)支持下完成。(RS-2024-00337007)
2025-08-03
2025-08-03
2025-08-03
2025-08-03
2025-08-03