导师简介
如果你想申请香港理工大学 计算机系博士,那今天这期文章解析可能对你有用!今天Mason学长为大家详细解析香港理工大学的Prof.Liu的研究领域和代表文章,同时,我们也推出了新的内容“科研想法&开题立意”,为同学们的科研规划提供一些参考,并且会对如何申请该导师提出实用的建议!方便大家进行套磁!后续我们也将陆续解析其他大学和专业的导师,欢迎大家关注!
导师现任香港理工大学计算机系副教授,同时也是香港理工大学跨学科研究院物联网研究中心(RIAIoT)成员。导师拥有哥伦比亚大学哲学硕士和哲学博士学位,是计算机视觉、机器学习和人工智能领域的杰出学者。
导师的研究领域广泛而深入,主要集中在计算机视觉、深度学习和图卷积网络等方向,特别专注于维度降低技术、图卷积网络、图像处理、人体姿态估计、动作识别以及将这些技术应用于医疗康复和自闭症研究等领域。导师的研究不仅具有理论价值,更强调将先进技术应用于解决实际问题,尤其是在医疗健康领域的应用。
研究领域
导师的主要教学和研究兴趣集中在以下领域:
- 维度降低技术(Dimensionality Reduction):开发高效的数据降维方法,用于处理高维数据并保留关键信息。
- 图卷积网络(Graph Convolutional Network):专注于图结构数据的深度学习方法,特别是在骨架数据处理和人体姿态估计方面的应用。
- 图像处理与重定向(Image Retargeting):研究图像处理技术,使图像能适应不同显示设备和环境。
- 多媒体数据分析(Multimedia Data):开发处理和分析各类多媒体数据的算法和技术。
- 隐写分析(Steganalysis):研究用于检测隐藏在媒体中的秘密信息的技术。
- 卷积神经网络(Convolutional Neural Network):应用于图像处理、计算机视觉和模式识别的深度学习方法。
- 社交媒体分析(Social Media):研究社交媒体数据的处理和分析方法。
- 医疗健康应用:将计算机视觉和机器学习技术应用于康复评估、自闭症研究等健康领域。
研究分析
1. "EGCN++: A New Fusion Strategy for Ensemble Learning in Skeleton-Based Rehabilitation Exercise Assessment"
2024年发表在IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)期刊上
该研究针对基于骨架数据的康复锻炼评估提出了一种新的融合策略。在现代康复医疗中,正确评估患者的锻炼质量对康复效果至关重要。传统方法主要依赖专业医护人员的主观判断,存在效率低下和标准不一致等问题。
研究中,作者提出了一种基于集成的图卷积网络(EGCN),该模型能够充分利用不同的骨架特征,并通过模型级融合策略提高评估准确性。实验结果表明,该方法在现有基于骨架的康复评估系统中取得了显著的性能提升,为物理治疗系统的自动化评估提供了新的解决方案。
2. "GLA-GCN: Global-local Adaptive Graph Convolutional Network for 3D Human Pose Estimation from Monocular Video"
发表于2023年
该研究专注于解决从二维姿态到三维姿态的提升问题。研究团队观察到,现有工作主要关注于提高估计姿态的性能,但在地面真值姿态数据测试时表现不佳。针对这一问题,研究提出了全局-局部自适应图卷积网络(GLA-GCN),该网络通过图表示全局建模时空结构,并通过单独连接的层回溯局部关节特征,实现三维人体姿态估计。
3. "MMNet: A Model-based Multimodal Network for Human Action Recognition in RGB-D Videos"
发表在IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)期刊
该研究针对RGB-D视频中的人体动作识别问题,提出了一种基于模型的多模态网络(MMNet)。随着深度传感器的普及,基于单一模态的方法(如基于骨架和基于RGB视频)已取得显著进步,但特定的模型级融合方法较少被研究。
MMNet通过模型化方法融合骨架和RGB模态,其目标是通过有效应用来自不同数据模态的互补信息,提高集成识别准确性。对于模型化融合方案,研究使用时空图卷积网络处理骨架模态,学习注意力权重,然后将这些权重传递到RGB模态的网络中。
4. "Noise-robust oversampling for imbalanced data classification"
在2023年发表
研究提出了一种用于解决不平衡数据分类问题的噪声鲁棒过采样算法(NROMM)。
在机器学习中,不平衡数据问题是指数据集中不同类别的样本数量差异很大,通常多数类样本远多于少数类样本,这会导致标准分类模型性能下降。过采样是解决这一问题的常用方法,但传统过采样方法可能会生成与多数类样本重叠的少数类样本,从而引入噪声。
针对这一问题,教授提出的NROMM算法首先采用先进的聚类算法来找到少数类和多数类的任意形状,以减少嘈杂样本生成的风险。然后,该算法开发了一种新颖的自适应嵌入方法来安全地生成样本,并实现了用于扩大类边界的安全边界。异构距离度量和自适应分解策略使该噪声鲁棒算法适用于混合类型和多类不平衡数据。
5. "Acoustic changes in speech prosody produced by children with autism after robot-assisted speech training"
该研究探索了机器人辅助言语训练对自闭症儿童言语韵律产生的声学变化。
自闭症谱系障碍(ASD)儿童常常表现出言语韵律异常,影响其社交沟通能力。传统言语训练面临治疗师资源有限和儿童参与度低等挑战。研究团队开发了一种机器人辅助言语训练系统,结合计算机视觉和语音处理技术,为自闭症儿童提供个性化的言语训练。
研究结果表明,经过机器人辅助训练后,自闭症儿童的言语韵律发生了积极变化,包括音高变化更自然、语速更适当、停顿更合理等。这些改善有助于提高他们的沟通效果和社交能力。
6. "Multi-systemic evaluation of biological and emotional responses to the Trier Social Stress Test: A meta-analysis and systematic review"
研究中教授参与了对特里尔社会压力测试(TSST)的生物和情绪反应的多系统评估研究。
TSST是一种广泛使用的实验室压力诱导方法,用于研究急性压力对人体生理和心理的影响。该研究通过荟萃分析和系统综述,全面评估了TSST诱导的生物和情绪反应。研究发现,TSST能可靠地激活人体多个生理系统,包括下丘脑-垂体-肾上腺轴(HPA轴)、自主神经系统(ANS)和免疫系统,同时引发显著的情绪变化。
项目分析
1. 认知计算实验室(Cognitive Computing Lab)
教授是香港理工大学认知计算实验室(Cognitive Computing Lab)的创始主任。该实验室以两个互补的研究方向为核心:一方面通过探索信息技术(如功能性磁共振成像fMRI)来发现人脑的奥秘;另一方面通过参考大脑结构和思维过程来研究新型计算模型和系统(如深度学习)。
该实验室不仅关注前沿科学研究,还致力于开发具有重要商业潜力的应用,如用于情绪健康的音乐治疗系统。实验室的研究领域跨越大脑建模、认知计算、图像/视频检索、计算机音乐、机器学习和模式识别等多个方向。
2. 基于EEG的情感计算研究项目
教授领导的基于脑电图(EEG)的情感计算研究项目,旨在解决EEG情感数据稀缺问题。该问题导致使用机器学习算法(尤其是深度学习模型)建立高精度、高稳定性的情感计算模型变得困难。
研究团队开发了一系列数据增强技术,通过生成合成EEG信号来扩充训练数据集,显著提高了深度学习模型在情感识别任务中的性能。团队还探索了多模态情感计算方法,结合EEG、面部表情、语音和生理信号等多种数据源,构建更全面、更稳健的情感识别系统。
3. 音乐治疗与情绪健康项目
作为认知计算实验室的核心项目之一,音乐治疗与情绪健康项目结合了计算机音乐、情感计算和健康信息学技术,开发了智能音乐治疗系统。该系统通过分析用户的生理信号、面部表情和行为模式,实时评估其情绪状态,并根据评估结果自动生成或推荐适合的音乐,以调节用户的情绪和改善心理健康。
项目团队开发了音乐情感特征提取算法,建立了音乐-情绪映射模型,并设计了个性化音乐推荐系统。研究结果表明,该系统能有效缓解压力、焦虑和抑郁等负面情绪,提升用户的情绪体验和生活质量。
研究想法
1. 跨模态图卷积网络用于多源医疗数据融合
研究背景:现代医疗系统产生了大量多模态数据(如影像、文本、生理信号等),如何有效融合这些异构数据源进行疾病诊断和预后预测是一个重要挑战。
创新点:
- 设计一种跨模态图卷积网络(Cross-modal GCN)框架,能够同时处理结构化和非结构化医疗数据。
- 开发自适应模态融合机制,根据不同疾病类型和数据特点动态调整各模态的权重。
- 引入医学知识图谱约束,将专家经验融入模型训练过程。
- 设计可解释性组件,使模型预测结果可追踪和理解。
2. 基于自适应图结构的人体动作理解与意图预测
研究背景:准确理解和预测人体动作意图对人机交互、辅助生活和康复训练等领域至关重要。现有方法主要关注动作识别,对动作背后的意图理解不足。
创新点:
- 提出自适应图结构学习框架,能根据不同动作场景动态调整人体骨架图的拓扑结构。
- 开发时空注意力机制,关注动作序列中的关键帧和关键关节。
- 设计多任务学习框架,同时进行动作识别、动作质量评估和意图预测。
- 引入上下文信息(如环境、物体交互)增强动作理解的准确性。
3. 面向混合现实环境的情感感知交互系统
研究背景:混合现实(MR)技术正迅速发展,但现有MR系统缺乏对用户情感状态的感知和适应能力,限制了用户体验和应用场景。
创新点:
- 开发多通道情感感知框架,结合EEG、面部表情、语音和生理信号等多种模态。
- 设计轻量级情感识别算法,适合在MR设备上实时运行。
- 创建情感自适应MR内容生成系统,根据用户情感状态动态调整视觉和听觉内容。
- 构建情感驱动的交互反馈机制,增强用户沉浸感和参与度。
4. 噪声鲁棒图卷积网络用于不平衡医疗数据分析
研究背景:医疗数据通常存在类别不平衡和噪声干扰问题,这严重影响机器学习模型的性能。如何在保持数据分布平衡的同时减少噪声影响是一个关键挑战。
创新点:
- 将教授的噪声鲁棒过采样方法与图卷积网络相结合,开发专门用于医疗数据分析的框架。
- 设计自适应边界扩展机制,在保持类边界清晰的同时增加少数类样本。
- 开发基于不确定性的样本生成策略,避免在高不确定性区域生成样本。
- 引入医学知识指导的特征学习,提高生成样本的质量和真实性。
申请建议
1. 学术背景准备
- 核心知识体系:扎实掌握计算机视觉、机器学习、深度学习和图神经网络的基础理论和前沿进展。特别关注图卷积网络(GCN)、骨架数据处理、多模态融合和不平衡数据处理等导师的核心研究方向。
- 技术栈建设:熟练掌握PyTorch或TensorFlow等深度学习框架,具备开发和训练复杂神经网络模型的能力。同时,掌握OpenCV、Scikit-learn等常用库,以及数据预处理、特征工程和模型评估的相关技术。
- 研究经验积累:尽可能参与相关研究项目,特别是与计算机视觉、动作识别、医疗数据分析相关的项目。完成至少一项独立研究,形成可展示的研究成果(论文、开源代码等)。
- 跨学科知识扩展:考虑到导师研究的跨学科特性,适当学习医学、认知科学、生物信息学等相关领域知识,为将来的交叉研究打下基础。
2. 研究能力展示
- 有针对性的研究项目:设计并实施与导师研究方向高度相关的小型研究项目,如基于GCN的人体姿态估计、多模态医疗数据融合、基于骨架数据的动作分析等。
- 代码实现能力:在GitHub上创建个人项目,实现导师论文中的核心算法或模型,或者对其进行改进和扩展。例如,可以复现GLA-GCN、MMNet或NROMM算法,并在新数据集上验证其性能。
- 问题解决能力:参与Kaggle或其他数据科学竞赛,特别是与计算机视觉、医疗数据分析相关的竞赛,积累解决实际问题的经验。
3. 申请材料准备
- 研究计划:根据导师的研究方向和兴趣,设计一份详细的研究计划。计划应包括研究背景、问题定义、创新点、方法学、预期成果和时间规划。研究计划要展示出对导师研究的深入理解和延续,同时提出有创意的新方向。
- 推荐信:选择熟悉你研究能力和潜力的教授或研究人员撰写推荐信。如果有与导师研究方向相关的研究经历,请推荐人特别强调这些经历。
- 作品集:准备一份包含代码、论文、项目报告等的作品集,以具体展示你的技术能力和研究潜力。特别强调与导师研究相关的项目和成果。
4. 差异化竞争策略
- 技术专长定位:根据导师研究团队的现有构成,找到你可以补充的技术专长。例如,如果团队缺乏强大的数学背景或某种特定算法的专业知识,可以重点发展和突出这方面的能力。
- 创新思维展示:在研究计划中提出创新性强、有潜在影响力但又切实可行的研究想法。避免简单复制导师已有工作,而是展示如何基于其工作开拓新方向。
- 跨学科视角:如果你有其他学科背景(如医学、生物学、心理学等),可以展示如何将这些知识与导师的计算机科学研究结合,创造独特价值。
- 实际应用导向:强调你对研究实际应用的关注,提出如何将导师的理论研究转化为有实际价值的应用或产品。
博士背景
Aurelia ,美国TOP10院校计算机科学与认知科学双博士生,研究聚焦算法博弈论不确定性及其在人工智能中的应用。她的跨学科研究融合了计算机科学、语言学和心理学知识,在国际顶级期刊《Journal of Artificial Intelligence Research》和《Cognitive Science》上发表多篇论文。Aurelia 荣获ACM SIGAI博士论文奖,擅长相关方向的PhD申请指导。