cs3tm20 -文本挖掘和自然语言处理
模块供应商: Computer Science
学分数: 10 [5 ECTS credits]
水平:6
教学用语: 春天 term module
先决条件:
模块化的必备条件:
相关内容:
模块被排除在外:
目前从: 2021/2
模块召集人: 夏红教授
电子邮件: x.hong@reading.ac.uk
模块类型:
概述模块描述:
本模块介绍了文本挖掘和自然语言处理(NLP)的理论和实践。
目的:
本模块的目的是介绍文本挖掘和自然语言处理领域。 该模块的重点放在从词汇、语法和语义方面处理文本数据的理论和实践上。
该模块还鼓励学生发展一套专业技能,如解决问题、创造力、技术报告写作、组织和时间管理、自我反思、软件设计和开发; 最终用户意识,行动计划和决策,商业意识,对已发表文献的批判性分析和多样性的价值。
可评估的学习成果:
在本模块结束时,学生应该能够
- 理解和应用文本挖掘和自然语言处理的基本原理;
- 应用方法和算法来处理不同类型的文本数据;
- 通过使用准确性和效率指标对方法和算法的性能进行实证评估;
- Apply analytical and programming skills through using the existing NLP methods and tool s such as NLTK and scikit-learn (python)
额外的结果:
本模块将提供文本挖掘和自然语言处理及其子领域的概述,并将介绍和解释其关键技术,包括其适用性和局限性。 涵盖的主题包括:
- 正则表达式,文本规范化,
- N-gram和语言模型,词性标注
- 词汇语义,词义和WordNet
- 语法和语义分析
- Text classification, sentiment analysis
- 信息提取包括名称实体识别和关系提取
- Advanced topics: Machine learning for NLP, Word embedding, Hidden Markov model and Viterbi algorithm
大纲内容:
教学方法简述:
课程材料将通过讲座和实践来介绍。 讲座材料将应用于实验实践环节。 实验工作将通过采用概念和故事板以及评估计划,为学生提供开发高保真原型的支持。
秋天 | 春天 | 夏天 | |
讲座 | 16 | ||
实践课程和工作坊 | 4 | ||
引导自主学习: | |||
更广泛的阅读(独立) | 5 | ||
更广泛的阅读(指导) | 5 | ||
考试修订/准备 | 20 | ||
课前准备 | 3 | ||
准备实践报告 | 5 | ||
完成形成性评估任务 | 30 | ||
修订和准备 | 10 | ||
反射 | 2 | ||
按学期划分的总学时 | 0 | 0 | |
模块总学时 | 100 |
方法 | 百分比 |
笔试 | 50 |
设置运动 | 50 |
总结性评核-考试:
5月/ 6月一次1.5小时的试卷
总结性评估-课程作业和课堂测试:
一个单独的任务。
形成性评价方法:
学生将在辅导课上获得对课程准备的形成性反馈。
逾期提交的处罚:
支助中心将对逾期提交的工作实行下列处罚:
- 在原定截止日期(或任何正式同意的延期截止日期)之后提交的作业:截止日期后的每个工作日(或其中的一部分)将从该作业的总分数中扣除10%的分数,最多可达五个工作日;
- 如果作品在原始截止日期(或任何正式同意的截止日期延长)后超过五个工作日提交:将记录零分。
You are strongly advised to ensure that coursework is submitted by the relevant deadline. 您应该注意,建议在未完成状态下提交作业,而不是没有提交任何作业。
通过考试的评估要求:
总体得分为40%。
重新安排:
8月/ 9月一次2小时的考试。 请注意,补考模块的分数将以以下两项中较高者为准:(a)本次补考的分数;(b)本次补考的分数与之前课程作业的分数的平均值,根据第一次尝试(50%考试分数,50%课程作业分数)进行加权。
额外费用(适用时指定):
1) Required text books: None
2) Specialist equipment or materials: None
3) Specialist clothing, footwear or headgear: None
4) Printing and binding: None
5) Computers and devices with a particular specification: None
6) Travel, accommodation and subsistence: None
最后更新: 9月21日
本模块描述中包含的信息不构成学生合同的任何部分。