内部

CS3TM20 -文本挖掘和自然语言处理

cs3tm20 -文本挖掘和自然语言处理

模块供应商: Computer Science
学分数: 10 [5 ECTS credits]
水平:6
教学用语: 春天 term module
先决条件:
模块化的必备条件:
相关内容:
模块被排除在外:
目前从: 2021/2

模块召集人: 夏红教授
电子邮件: x.hong@reading.ac.uk

模块类型:

概述模块描述:

本模块介绍了文本挖掘和自然语言处理(NLP)的理论和实践。


目的:

本模块的目的是介绍文本挖掘和自然语言处理领域。 该模块的重点放在从词汇、语法和语义方面处理文本数据的理论和实践上。 



该模块还鼓励学生发展一套专业技能,如解决问题、创造力、技术报告写作、组织和时间管理、自我反思、软件设计和开发; 最终用户意识,行动计划和决策,商业意识,对已发表文献的批判性分析和多样性的价值。


可评估的学习成果:

在本模块结束时,学生应该能够




  • 理解和应用文本挖掘和自然语言处理的基本原理;

  • 应用方法和算法来处理不同类型的文本数据;

  • 通过使用准确性和效率指标对方法和算法的性能进行实证评估;

  • Apply analytical and programming skills through using the existing NLP methods and tool s such as NLTK and scikit-learn (python)


额外的结果:

本模块将提供文本挖掘和自然语言处理及其子领域的概述,并将介绍和解释其关键技术,包括其适用性和局限性。 涵盖的主题包括:




  • 正则表达式,文本规范化, 

  • N-gram和语言模型,词性标注

  • 词汇语义,词义和WordNet

  • 语法和语义分析

  • Text classification, sentiment analysis

  • 信息提取包括名称实体识别和关系提取

  • Advanced topics:  Machine learning for NLP, Word embedding, Hidden Markov model and Viterbi algorithm


大纲内容:

教学方法简述:

课程材料将通过讲座和实践来介绍。 讲座材料将应用于实验实践环节。 实验工作将通过采用概念和故事板以及评估计划,为学生提供开发高保真原型的支持。  


联系时间:
  秋天 春天 夏天
讲座 16
实践课程和工作坊 4
引导自主学习:      
    更广泛的阅读(独立) 5
    更广泛的阅读(指导) 5
    考试修订/准备 20
    课前准备 3
    准备实践报告 5
    完成形成性评估任务 30
    修订和准备 10
    反射 2
       
按学期划分的总学时 0 0
       
模块总学时 100

总结性考核方法:
方法 百分比
笔试 50
设置运动 50

总结性评核-考试:

5月/ 6月一次1.5小时的试卷


总结性评估-课程作业和课堂测试:

一个单独的任务。


形成性评价方法:

学生将在辅导课上获得对课程准备的形成性反馈。


逾期提交的处罚:

支助中心将对逾期提交的工作实行下列处罚:

  • 在原定截止日期(或任何正式同意的延期截止日期)之后提交的作业:截止日期后的每个工作日(或其中的一部分)将从该作业的总分数中扣除10%的分数,最多可达五个工作日;
  • 如果作品在原始截止日期(或任何正式同意的截止日期延长)后超过五个工作日提交:将记录零分。
The University policy statement on penalties for late submission can be found at: /web/FILES/qualitysupport/penaltiesforlatesubmission.pdf
You are strongly advised to ensure that coursework is submitted by the relevant deadline. 您应该注意,建议在未完成状态下提交作业,而不是没有提交任何作业。

通过考试的评估要求:

总体得分为40%。


重新安排:

8月/ 9月一次2小时的考试。 请注意,补考模块的分数将以以下两项中较高者为准:(a)本次补考的分数;(b)本次补考的分数与之前课程作业的分数的平均值,根据第一次尝试(50%考试分数,50%课程作业分数)进行加权。 


额外费用(适用时指定):

1) Required text books:  None

2) Specialist equipment or materials:  None

3) Specialist clothing, footwear or headgear:  None

4) Printing and binding:  None

5) Computers and devices with a particular specification:  None

6) Travel, accommodation and subsistence:  None


最后更新: 9月21日

本模块描述中包含的信息不构成学生合同的任何部分。

现在要做的事情