4月19日下午,英文学院徐勇副教授主讲博达沙龙第84期暨英文同文讲坛第54讲,以“Python语言语料获取及多模态语料库建设初探”为主题作专题讲座。讲座由语言学科团队承办,团队成员、英语系杜娟娟博士主持。语言学科团队及其他学院多位老师参加讲座。
徐勇首先介绍了如何利用Python从网上抓取材料,以及如何通过Python进行情感值的计算。他指出,情感值通常在0-1之间波动,数值越接近1,表示文本所表达的情感越为积极;反之,数值越接近0,则意味着情感越为消极。
随后,徐勇分享了如何使用Python语言辅助多模态语料库的建设。多模态语料库是指包含文字、静态图像、动态图像(如视频流)和音频流多种模态数据的多媒体资源库。徐勇详细阐述了多模态语料库语言学的研究方法,即根据研究目的,利用一定的工具,通过多模态语料库建设、切分与标注等加工,进行相关语料数据挖掘和分析统计,就相关问题进行实证研究,或者提出理论假设和理论建构的方法。他以切分电影视频为例,向听众演示了如何通过Python编程处理电影字幕,实现对相应视频或音频的精准剪切和编辑,并举例说明如何从多模态视角对语言教学进行调查研究。
徐勇的讲座反响热烈,在场听众纷纷表示,通过这场讲座,他们深刻认识到了学习Python语言的重要性,以及利用Python进行语料收集和分析的便利性。 这不仅为他们未来的研究工作提供了新的思路和方法,也激发了他们对语言学领域更深层次的探索兴趣。
此次讲座得到了听众的热情支持和高度评价。未来,学院将继续举办更多类似的学术活动,为广大师生提供更为广阔的学术视野和深度探讨的学习平台,推动语言学研究的不断进步。