韩国科学技术院(KAIST,校长李光炯)由电气电子工程学院的Sung-Ju Lee教授领导的研究团队与卡内基梅隆大学(CMU)合作,开发了一套基于AI的音乐创作支持系统Amuse。该研究于4月26日至5月1日在日本横滨举行的ACM人机交互会议(CHI)上发表,该会议是人机交互领域全球顶级会议之一。研究荣获最佳论文奖,该奖项仅授予所有投稿中排名前1%的论文。
由Sung-Ju Lee教授团队开发的系统Amuse是一个基于AI的系统,可将文本、图像、音频等多种形式的灵感转化为和声结构(和弦进行)以支持作曲。
例如,如果用户输入类似“温暖夏日海滩的回忆”这样的短语、图像或声音片段,Amuse会自动生成并建议与该灵感相匹配的和弦进行。
与现有的生成式AI不同,Amuse的差异化优势在于它尊重用户的创作流程,并通过允许灵活整合和修改AI建议的交互式方法,自然地引导创意探索。
Amuse系统的核心技术是一种融合两种方法的生成技术:大型语言模型根据用户输入的提示和灵感创建音乐代码,而另一个基于真实音乐数据训练的AI模型则通过拒绝采样法筛选掉生硬或不自然的结果。
研究团队针对实际音乐家开展了用户研究,并评估认为Amuse作为创意伙伴或“共创意AI”(即人与AI协作的概念)具有巨大潜力,而非仅仅让生成式AI拼凑出一首歌曲。
Sung-Ju Lee教授表示:“近期生成式AI技术引发了担忧,因其直接模仿受版权保护的内容从而侵犯创作者版权,或无视创作者意图单向生成结果。鉴于此,研究团队注意到这一趋势,关注创作者的实际需求,并专注于设计以创作者为中心的AI系统。”
他进一步指出:“Amuse是在保持创作者主动权的前提下探索与AI协作可能性的尝试,预计将成为未来音乐创作工具和生成式AI系统开发中建议更友好创作者方向的起点。”
本研究由韩国国家研究基金会(National Research Foundation of Korea)在政府(科学与信息通信技术部)资助下支持开展。(项目编号:RS-2024-00337007)
Story Source:
Materialsprovided byThe Korea Advanced Institute of Science and Technology (KAIST).Note: Content may be edited for style and length.
2025-07-02
2025-07-02
2025-07-02
2025-07-02
2025-07-02