《大数据分析导论》(第2版)
课程教学大纲
课程名称:大数据分析导论(第2版)
英文名称:Introduction of Big Data Analytics (Second Edition) 学分数:2
建议学时数:课内32学时,实践16学时 课程性质:通识基础课
教学目的:通过本课程的学习,让学生对大数据技术相关基础知识、基本应用路线和实用工具进行深入学习和了解,为后续的其他信息科学技术及大数据应用等专业课程的学习打下基础。
基本内容简介:以大数据分析技术及其应用路线为核心,系统地介绍了信息技术与大数据分析基础、大数据分析工具、信息网络技术与数据获取、文本和表格数据处理、数据分析、大数据分析实战等内容。本书通过一系列实例分析,深入浅出地向读者介绍了AI studio云计算平台、Python程序设计语言、Word 2016、Excel 2016和PowerPoint 2016等工具和软件的使用方法及其在大数据分析技术中的应用。
基本要求:学生通过课程学习,应对信息技术及计算基础知识、大数据技术基础知识、Internet、网络爬虫、数据处理与数据分析等内容有一个较为全面的认识和理解,并能基于AI studio平台,熟练掌握利用Python程序设计语言和Office 2016软件完成简单的数据获取、数据处理、数据分析和数据展示等大数据分析技术应用方法。
授课方式:教师课堂授课,同时由于课程内涵盖大量实际操作内容,应配合进行上机实践操作教学。
第1章 信息技术与大数据分析基础 1.1 信息社会与计算机 1.2 计算机基础知识 1.3 大数据基础知识 1.4 大数据分析理论方法 1.5 大数据分析应用前沿 学时分配:教学3学时
教学内容:介绍信息技术与大数据分析的基础内容,包括信息编码、大数据基础知识和大数据分析理论方法等,让读者建立信息科学与相关技术的基础概念,并对大数据分析的基本思路、对象、平台和模型有一个初步的认识
教学重点:1.2.1 信息编码、1.4.2 大数据分析的主要步骤、1.4.3 大数据分析的
数据对象、1.4.4 大数据分析的主要模型
第2章 大数据分析工具 2.1 大数据分析工具简介 2.2 百度AI Studio平台介绍 2.3 Python基础
2.4 变量及数据的使用
2.5 Python 程序的输入输出 2.6 Python 程序的控制结构 2.7 函数和模块
2.8 大数据文本分析
学时分配:教学6学时,实践4学时
教学内容:介绍大数据分析的主要工具,包括AI Studio平台介绍、Python语言的基础知识等,让读者了解大数据分析的实现工具、平台和方法有初步的认识 教学重点:2.2 百度AI Studio平台介绍、2.4 变量及数据的使用、2.5 Python程序的输入/输出、2.6 Python程序的控制结构、2.7 函数和模块、2.8 大数据文本分析
第3章 信息网络技术与网络数据获取 3.1 信息网络概述 3.2 信息网络技术
3.3 大数据时代下的信息网络 3.4 网络爬虫基础
3.5 网络爬虫关键技术
学时分配:教学5学时,实践2学时
教学内容:介绍大数据技术中的数据获取方法,包括信息网络的基础知识和网络爬虫工具的相关内容,让读者掌握获取大数据分析所需的原始数据集的方法 教学重点:3.2.2信息网络技术体系、3.4.3 网络爬虫requests库、3.5 网络爬虫关键技术
第4章 文本数据处理 4.1 办公软件概述
4.2 基于Word的文字编辑处理 4.3 制作演示文稿发布信息
学时分配:教学5学时,实践4学时
教学内容:介绍大数据技术中的文本数据处理与展示方法,包括利用Word 2016实现文字数据的编辑、排版、图文混排等内容,同时让读者掌握利用PowerPoint 2016制作演示文稿的方法,实现对数据分析和处理结果的展示和发布
教学重点:4.2.3 文档排版、4.2.5 高级排版技巧、4.3.2幻灯片布局和内容编辑
第5章 表格数据处理 5.1 Excel基础 5.2 Excel数据运算
5.3 Excel数据处理工具 5.4 科学制图
学时分配:教学5学时,实践4学时 教学内容:介绍大数据技术中的表格数据处理方法,包括利用Excel 2016构建工作表存储和管理结构化的数据,利用公式和函数完成各类数据计算,利用Excel各类数据处理工具完成数据排序、筛选、分类汇总、图表制作等操作
教学重点:5.2.1 Excel公式的基本使用、5.2.3 常用函数的应用、5.3 Excel数据处理工具
第6章 数据分析 6.1 数据分析基础 6.2 描述性统计分析 6.3 投资决策分析
6.4 时间序列预测分析 6.5 相关与回归分析
学时分配:教学4学时,实践2学时
教学内容:介绍大数据分析相关理论与方法,包括数据分析基础、描述性统计分析、投资决策分析、时间序列分析和相关回归分析等,引导读者利用Excel 2016工具进行简单的大数据分析,从海量数据集中挖掘和提取关键决策信息,完成大数据分析的应用和实践
教学重点:6.2.4 数据交叉透视分析、6.4 时间序列预测分析、6.5.1 相关分析、6.5.2 一元线性回归分析
第7章 大数据分析实战
7.1 大数据分析实战案例一:中南印象新闻文本分析 7.2 大数据分析实战案例二:楚天科技股票数据分析 学时分配:教学4学时
教学内容:通过两个大数据分析综合案例将前6章相关理论知识、方法和工具进行串联,引导读者完成包括数据获取、数据预处理、数据分析、结果展示在内的大数据分析实战任务。
教学重点:7.1.3 词频统计与词云绘制、7.1.4 基于 Excel 数据透视表的词频统计、7.2.5 股票交易数据时间序列预测分析、7.2.6 股票交易数据回归预测分析
《大数据分析导论》(第2版)教学进度表(参考)
章节 第1章 信息技术与大数据分析基础 第2章 大数据分析工具(python) 第3章 信息网络技术与网络数据获取 第4章 文本数据处理 第5章 表格数据处理 第6章 数据分析 第7章 大数据分析实战 教学课时(32) 3-4课时 6-8课时 4-5课时 4-5课时 4-5课时 2-4课时 0-2课时 实践课时(16) 6课时(37.5%) 2课时(12.5%) 4课时(25%) 4课时(25%)
共32课时课堂教学(每周3学时,共11周),16课时实践教学(第3周起每周2学时,共8周),*号为重点内容。 周次 教学内容 1.1 信息社会与计算机 1.1.1 信息与信息处理 1.1.2 计算机的起源与发展 1.1.3 计算思维 1.2 计算机基础知识 1.2.1 信息编码 * 1.2.2 计算机系统组成 1.2.3 操作系统和文件管理 1.3 大数据基础知识 1.3.1 大数据的产生和概念 1.3.2 大数据发展现状 1.4 大数据分析理论方法 * 1.4.1 大数据分析的基本理念 1.4.2 大数据分析的主要步骤* 1.4.2 大数据分析的数据对象 * 1.4.3 大数据分析的主要模型 * 1.4.4 大数据分析的应用平台 第二章 大数据分析工具 2.1 大数据分析工具简介 2.2 百度AI Studio平台介绍 2.2.1 运行一个简单的项目 2.2.2 GPU算力 2.3 Python基础 2.3.1 Python的特点和发展 2.3.2 搭建Python编程环境 实践内容 1 2 3 1、AI Studio 平台入门操作 2、python基础实验 周次 教学内容 2.3.3 运行简单的Python程序 2.3.4 Python程序的语法结构 2.4 变量及数据的使用 2.4.1 变量的使用 2.4.2 字符及字符串变量的使用 * 2.4.3 数字及数字变量的使用 * 2.4.4 逻辑值及逻辑值变量的使用 2.4.5 列表及其操作 * 2.4.6 字典 * 2.5 Python 程序的输入输出* 2.5.1 Python 程序的输入* 2.5.2 Python 程序的输出* 2.6 Python 程序的控制结构* 2.6.1 分支结构* 2.6.2 循环结构* 2.7 函数和模块* 2.7.1 函数* 2.7.2 模块* 2.7.3 第三方库* 2.8 大数据文本分析* 2.8.1 词频统计* 2.8.2 词云分析* 第三章 信息网络技术与网络数据获取 3.1 信息网络概述 3.1.1 网络的结构 3.1.2 信息网络的起源 3.1.3 信息网络的定义 3.2 信息网络技术 3.2.1信息网络技术概述 3.2.2信息网络技术体系 * 3.2.3信息网络组成结构 3.2.4信息网络运行机制 3.4 网络爬虫基础 3.4.1 网络爬虫的概念与分类 3.4.2 HTML语言简介 3.4.3 网络爬虫requests库 * 3.4.4 网络爬虫需要遵守的协议 实践内容 4 1、python基础实验 5 1、python进阶实验 6 1、python爬虫实验 周次 教学内容 3.5 网络爬虫关键技术 * 3.5.1 基于正则表达式的数据获取 * 3.5.2 基于Xpath的数据获取 * 3.5.3 数据组织与导出 * 第四章 文本数据处理 4.1 办公软件概述 4.2 基于Word的文本数据处理 4.2.1 从创建文档开始 4.2.2 文本编辑 * 4.2.3 文档排版 4.2.4 图文混排 * 4.2.5 高级排版技巧 * 4.3 基于Power Point的多媒体信息展示 4.3.1创建并保存演示文稿 4.3.2幻灯片布局和内容编辑 * 4.3.3视觉美化的渠道 4.3.4演示文稿的放映和输出 * 5.1 Excel基础 5.1.1 Excel基本术语 5.1.2 Excel的基本操作 5.1.3 在工作表中输入和导入数据 5.1.4 格式化工作表 5.2 Excel数据运算 * 5.2.1 Excel公式的基本使用 * 5.2.2 Excel函数的基本使用 * 5.2.3 常用函数的应用 * 5.3 Excel数据处理工具 5.3.1 数据清单 5.3.2 数据排序 5.3.3 数据筛选 5.3.4 分类汇总 * 5.3.5 合并计算 * 5.4科学制图 5.4.1 图表的类型与组成 5.4.2 图表的创建与编辑 5.4.3 常用图表的应用 * 第六章 数据分析 实践内容 7 Office 2016 综合实验 8 Office 2016 综合实验 9 Office 2016 综合实验 10 Office 2016 综合实验 周次 教学内容 6.1 数据分析基础 6.1.1 数据分析的概念 6.1.2 数据分析的类别 6.2 描述性统计分析 6.2.1 数据频数分析 6.2.2 数据集中度分析 6.2.3 数据离散度分析 6.2.4 数据交叉透视分析 * 6.3 投资决策分析 6.3.1 定额投资分析 6.3.2 贷款等额还款分析 6.3.3 企业投资决策分析 6.4 时间序列预测分析 * 6.4.1 移动平均预测分析 * 6.4.2 指数平滑预测分析 * 6.4.3 线性趋势预测分析 * 6.4.4 非线性趋势预测分析 * 6.5 相关分析与回归分析 * 6.5.1 相关分析 * 6.5.2 一元线性回归分析 * 6.5.3 多元线性回归分析 * 6.5.4 非线性回归分析 * 第七章 大数据分析实战 课程内容总结与答疑 实践内容 11 Office 2016 综合实验