考试题型:
一、填空题(1分*10)
二、程序代码填空(1分*20)
三、读程序写结果(10分*4)
四、程序设计(10分*1)
五、问答题(20分*1)
考试范围:
第一章:1.1、1.2
第二章、第三章全部(包括实训)
第四章:4.1~4.4
第五章:全部
第六章:6.2
第十一章:11.1、11.3、11.4
考试注意事项:
代码填空注意语法格式及上下文
写运行结果注意输出的数据格式(列表、数组、元组、Series等的格式)、是否有引号、是否换行等
程序设计题包括import的库名要写正确
问答题少于50字不计分、乱答不计分
数据分析的概念
数据分析看成是—种筛选的方法,就是在处理大量的数据的时候,将需要的数据精选出来,提取出有用信息,最后形成结论,这样可以方便对数据进行更加详细的研究和概括。
数据挖掘则是指从大量的、不完全的、有噪声的实际应用数据中,通过聚类、分类、回归和关联规则等技术,挖掘潜在价值的过程。
狭义的数据分析是指根据分析目的,采用对比分析、分组分析、交叉分析、回归分析等方法处理数据并得到一个特征统计量结果的过程。
广义的数据分析是针对搜集来的数据运用基础探索、统计分析、深层挖掘等方法。
也就是说广义的数据分析除了狭义的数据分析之外,还包括数据挖掘的部分。
数据可视化
数据可视化就是以图形化方式表示数据,让决策者可以通过图形直观看到数据分析结果。
数据可视化包括数据处理、视觉编码和可视化生成。数据处理聚焦于数据的采集、清理、预处理、分析和挖掘;视觉编码聚焦于对光学图像进行接收、提取信息、加工变化、模式识别及存储显示。可视化生成则聚焦于将数据转化成图形并交互处理。