统计数据科学和机器学习
模块供应商: Mathematics and Statistics
学分数: 10 [5 ECTS credits]
水平:6
教学用语: 春天 term module
先决条件: MA1MSP Mathematical and Statistical Programming and ST1PS Probability and Statistics or MA1MPRNU Mathematical Programming and ST1PSNU Probability and Statistics
模块化的必备条件:
相关内容:
模块被排除在外:
目前从: 2021/2
模块召集人: Fazil Baksh博士
电子邮件: m.f.baksh@reading.ac.uk
模块类型:
概述模块描述:
数据科学、机器学习和人工智能的话题最近已经成为公众意识的一部分,部分原因是它们在工业上的成功应用(尤其是在大型科技公司)。 这些领域中使用的许多最成功的技术都是以统计技术为基础的。 本模块首先介绍一些基础技术,并展示如何将它们应用于数据科学和机器学习中的问题。
目的:
本模块旨在让学生对统计机器学习中使用的各种方法有一个扎实的理解,并能够实现和使用其中的一些方法。 它还旨在将学生与该领域正在进行的NBA投注[手机]俱乐部研究联系起来。
可评估的学习成果:
在本单元结束时,学生将能够:
- 使用和解释数据科学和机器学习的基础统计方法;
- 制作软件实现模块中所教的方法;
- 使用统计学习工具来构建和评估监督学习的算法。
额外的结果:
学生还将获得阅读科学文献和了解当前NBA投注[手机]俱乐部研究的经验。
大纲内容:
该模块将首先介绍数据科学、机器学习和人工智能,然后描述支撑这些主题的统计方法的思想。 The module focuses on Machine Learning, covering the topics of regression and classification, including: linear and logistic regression; 线性和二次判别分析; 重采样方法; 模型选择和正则化; 岭回归; 拉索; 降维方法; prin cipal components regression; 偏最小二乘; 高维问题; 回归样条函数; 广义加性模型; 基于树的方法; 装袋; 叠加; 随机森林; 提高; 神经网络与深度学习; 支持向量机。
教学方法简述:
The core material will be delivered in 16 lectures. These will be supported by material from the book "An Introduction to Statistical Learning with Applications in R" that is freely available online along with research articles, and blog posts. 这一系列资源将用于让学生了解在工业界或学术界工作的数据科学家学习其学科的方式。 This will provide students who are interested in the area a path to explore the subj ect more widely, whilst being supported by being provided with an easy-to-follow path through the material.
There will be 4 practical PC lab sessions spread in between the lectures. 每堂课都会让学生有机会学习将讲座中涵盖的概念编码。
会有一个作业,在课程开始时发,最后交上来。 The assignment will consist of problems that one will need to use software imp lementations of the algorithms in the module in order to solve. PC labs will cover problems that are very close to those given in the assignment, in order to motivate students to attend the PC labs, and engage with the module as it progresses.
如有需要,将提供编程方面的额外支持。
秋天 | 春天 | 夏天 | |
讲座 | 16 | ||
实践课程和工作坊 | 4 | ||
引导自主学习: | 80 | ||
按学期划分的总学时 | 0 | 0 | |
模块总学时 | 100 |
方法 | 百分比 |
笔试 | 70 |
设置运动 | 30 |
总结性评核-考试:
一场考试,2小时
总结性评估-课程作业和课堂测试:
一份作业,问题与实践课程内容相关。
形成性评价方法:
实习期间的反馈。
逾期提交的处罚:
支助中心将对逾期提交的工作实行下列处罚:
- 在原定截止日期(或任何正式同意的延期截止日期)之后提交的作业:截止日期后的每个工作日(或其中的一部分)将从该作业的总分数中扣除10%的分数,最多可达五个工作日;
- 如果作品在原始截止日期(或任何正式同意的截止日期延长)后超过五个工作日提交:将记录零分。
You are strongly advised to ensure that coursework is submitted by the relevant deadline. 您应该注意,建议在未完成状态下提交作业,而不是没有提交任何作业。
通过考试的评估要求:
总体得分为40%。
重新安排:
8月/ 9月的考试时长为2小时,补考模块分数为考试分数(100%考试分数)和考试分数加上以前的课程分数(70%考试分数,30%课程分数)中较高者。
额外费用(适用时指定):
1) Required text books: None
2) Specialist equipment or materials: None
3) Specialist clothing, footwear or headgear: None
4) Printing and binding: None
5) Computers and devices with a particular specification: None
6) Travel, accommodation and subsistence: None
最后更新: 2021年6月28日
本模块描述中包含的信息不构成学生合同的任何部分。