【通院大讲堂】于漪教授专题报告

发布时间：2025-02-25浏览次数：10

报告题目：音乐生成中的多模态人工智能

报告人：于漪　日本广岛大学

报告时间：2025年2月28日（星期五） 10：30-11：30

报告地点：三牌楼校区科研楼208室

报告摘要：

　　音乐生成方法涵盖了统计模型、神经网络模型、预训练模型以及大型语言模型（LLMs）。多模态人工智能使我们能够探索歌词、旋律和舞蹈之间的潜在关系，从而丰富音乐生成的多样性和表现力。本报告将简要介绍多模态音乐生成的研究背景与挑战，并讨论多模态音乐内容生成任务及其重要性：在歌词条件下生成旋律、在旋律条件下生成歌词、在音乐条件下进行舞蹈风格迁移，以及在音乐和歌词条件下生成舞蹈。报告还将展示一些实验结果，说明在歌词提示、旋律片段或歌词与音乐组合的输入模态下，生成连贯且语义相关的音乐内容的有效性。通过结合人工智能技术，深入挖掘音乐、歌词和舞蹈的语义相关性，不仅增强了创作过程，还为音乐的艺术表达开辟了新的途径。

报告人简介：

　　于漪，日本广岛大学先进理工科学研究科的副教授，曾任日本国立信息学研究所助理教授，新加坡国立大学计算机学院高级研究员。主要从事多媒体内容理解与人工智能的跨学科研究，尤其是多模态表示学习，生成建模以及多模态信息融合在多媒体和音乐中的应用。她曾担任2023年IEEE国际数据挖掘会议（ICDM）的教程联合主席，2022年ACM国际多媒体检索会议（ICMR）的博士生研讨会联合主席，2021年IEEE国际多媒体与博览会议（ICME）的特别会议联合主席，以及2020年IEEE多媒体大数据会议的技术程序联合主席。她还兼任《IEEE Transactions on Multimedia》的副编辑。

导航栏

【通院大讲堂】于漪教授专题报告