内部

CSMDM21 -数据分析和挖掘

csmdm21 -数据分析和挖掘

模块供应商: School of Mathematical, Physical and Computational Sciences
学分数: 20 [10 ECTS credits]
水平:7
教学用语: 秋天 term module
先决条件:
模块化的必备条件:
相关内容:
模块被排除在外:
目前从: 2021/2

模块召集人: 林嘉雯博士
电子邮件: carmen.lam@reading.ac.uk

模块类型:

概述模块描述:

本模块涵盖数据分析和数据挖掘。


目的:

自动化数据收集工具和成熟的数据库技术导致大量数据存储在数据库、数据仓库和其他信息存储库中。 自动化数据分析和挖掘技术正在成为任何信息系统的重要组成部分。 在知识发现过程中,需要对大数据集进行清理、预处理、选择、合并等,最后进行处理,自动提取感兴趣的知识,如描述性和预测性模型。 这些技术涵盖了统计学、机器学习和信息科学。



本模块侧重于知识发现过程的设计、管理和部署的概念、方法、算法和工具。 特别是,数据分析(R)和工作流管理(KNIME)的工具将被用于几个测试用例的实践活动。 学生将学习通用的数据挖掘原理和技术,并将其应用于不同的应用领域。



该模块还鼓励学生培养一套专业技能,如解决问题、对已发表文献进行批判性分析、创造力、为技术和非技术受众撰写技术报告、专业沟通(电子邮件; 字母; 会议纪要等),自我反思和有效使用商业软件。


可评估的学习成果:

学生应该能够




  • 理解一般的数据挖掘概念、原理和算法; 了解一般的知识发现过程。

  • 使用数据挖掘方法应用各种算法和工具进行描述性和预测性分析;

  • 使用最先进的开源软件设计并执行针对特定数据挖掘问题的知识发现流程; 

  • apply the da ta mining tools in different applicative domains.


额外的结果:

学生将熟悉数据挖掘技术在不同领域的潜在应用。 他们还将学习如何进行算法性能评估的实验测试。


大纲内容:


  • 知识发现过程概论

  • 数据选择、预处理和清洗;

  • 数据挖掘算法(分类、聚类等);

  • 工作流管理系统(KNIME);

  • 统计计算的R项目。


教学方法简述:

该模块包括讲座(20小时)、实践课程(10小时)和一门主要课程。 讲座介绍数据分析和挖掘的基本概念、算法和工具。 在实践课程中,数据分析和工作流管理工具将被用于几个测试用例的实践活动。 期末专题允许学生将概念应用到实际案例中。



建议文本:



Introduct ion to Data Mining Pang-Ning Tan, Michael Steinbach, Vipin Kumar Addison-Wesley ISBN-10: 0321420527, ISBN 13:9780321420527



数据挖掘:实用机器学习工具和技术(第二版)Ian H Witten, Eibe Frank Morgan Kaufmann ISBN 0-12- 088407-0



数据挖掘,概念与技术,第二版韩佳伟,Micheline Kamber Morgan Kaufmann出版社,2006年3月ISBN 978-1-55860-901-3 ISBN 10:1-55860-901-6


联系时间:
  秋天 春天 夏天
讲座 20
实践课程和工作坊 10
引导自主学习:      
    更广泛的阅读(独立) 20
    更广泛的阅读(指导) 20
    课前准备 30
    准备教程 20
    准备实践报告 30
    开展NBA投注[手机]俱乐部研究项目 20
    论文准备 20
    反射 10
       
按学期划分的总学时 200 0 0
       
模块总学时 200

总结性考核方法:
方法 百分比
书面作业,包括论文 100

总结性评核-考试:

总结性评估-课程作业和课堂测试:

一个单独的期末项目。


形成性评价方法:

逾期提交的处罚:

下列资料适用于修读nba投注式课程的学生,但修读nba投注弹性课程的学生除外。 Penalties for late submission, and the associated procedures, which apply to Postgraduate Flexible programmes are specified in the policy 􀀓Penalties for late submission for Postgraduate Flexible programmes􀀔, which can be found here: /web/files/qualitysupport/penaltiesforlatesubmissionPGflexible.pdf
The Support Centres will apply the following penalties for work submitted late:

  • 在原定截止日期(或任何正式同意的延期截止日期)之后提交的作业:截止日期后的每个工作日(或其中的一部分)将从该作业的总分数中扣除10%的分数,最多可达五个工作日;
  • 如果作品在原始截止日期(或任何正式同意的截止日期延长)后超过五个工作日提交:将记录零分。
The University policy statement on penalties for late submission can be found at: /web/FILES/qualitysupport/penaltiesforlatesubmission.pdf
You are strongly advised to ensure that coursework is submitted by the relevant deadline. 您应该注意,建议在未完成状态下提交作业,而不是没有提交任何作业。

通过考试的评估要求:

50%的整体模块标记。


重新安排:

 一份3小时的试卷。


额外费用(适用时指定):

1) Required text books:  None

2) Specialist equipment or materials:  None

3) Specialist clothing, footwear or headgear:  None

4) Printing and binding:  None

5) Computers and devices with a particular specification:  None

6) Travel, accommodation and subsistence:  None


最后更新: 7月30日

本模块描述中包含的信息不构成学生合同的任何部分。

现在要做的事情