【通院大讲堂】于漪教授专题报告

发布时间:2025-02-25浏览次数:10

报告题目:音乐生成中的多模态人工智能

报告人:于漪 日本广岛大学

报告时间:2025年2月28日(星期五)  10:30-11:30

报告地点:三牌楼校区科研楼208室



报告摘要:

  音乐生成方法涵盖了统计模型、神经网络模型、预训练模型以及大型语言模型(LLMs)。多模态人工智能使我们能够探索歌词、旋律和舞蹈之间的潜在关系,从而丰富音乐生成的多样性和表现力。本报告将简要介绍多模态音乐生成的研究背景与挑战,并讨论多模态音乐内容生成任务及其重要性:在歌词条件下生成旋律、在旋律条件下生成歌词、在音乐条件下进行舞蹈风格迁移,以及在音乐和歌词条件下生成舞蹈。报告还将展示一些实验结果,说明在歌词提示、旋律片段或歌词与音乐组合的输入模态下,生成连贯且语义相关的音乐内容的有效性。通过结合人工智能技术,深入挖掘音乐、歌词和舞蹈的语义相关性,不仅增强了创作过程,还为音乐的艺术表达开辟了新的途径。


报告人简介:

  于漪,日本广岛大学先进理工科学研究科的副教授,曾任日本国立信息学研究所助理教授,新加坡国立大学计算机学院高级研究员。主要从事多媒体内容理解与人工智能的跨学科研究,尤其是多模态表示学习,生成建模以及多模态信息融合在多媒体和音乐中的应用。她曾担任2023年IEEE国际数据挖掘会议(ICDM)的教程联合主席,2022年ACM国际多媒体检索会议(ICMR)的博士生研讨会联合主席,2021年IEEE国际多媒体与博览会议(ICME)的特别会议联合主席,以及2020年IEEE多媒体大数据会议的技术程序联合主席。她还兼任《IEEE Transactions on Multimedia》的副编辑。