近几年来,随着计算机数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术开始被应用,如数据仓库、专家系统、知识管理系统等,由此产生了大数据概念的雏形。紧接着随着Web2.0应用开始迅猛发展,非结构化数据大量产生,传统处理方法难以应对,从而带动了大数据技术的快速突破,也使得大数据解决方案逐渐走向成熟,形成了并行计算与分布式系统两大核心技术,谷歌的GFS和MapReduce等大数据技术受到追捧,Hadoop平台开始大行其道。
为了紧跟当今大数据技术发展的浪潮,我们学校也对大数据也予以了高度的关注。就在今年夏季,由教育部学校规划建设发展中心联合曙光信息产业股份有限公司启动数据中国“百校工程”项目里,便邀请了我们学校参加,并在七月中旬展开了第一期的数据中国“百校工程”试点培训。
在参加培训期间,共分为两个学习阶段,第一个阶段是先学习了解大数据的核心理论基础,包括大数据行业开发知识,Linux Shell编程,Hadoop基本操作使用,MapReduce 基本程序的框架和执行等内容;第二阶段学习的则是曙光Infinity9000平台与大数据项目的实际操作、Mining大数据挖掘平台以及Insight平台的操作实战。
最后,为让广大教职工更好的了解熟悉大数据的概念和发展前景,把此次培训学习上传,供大家下载认识学习。
01_大数据行业开发知识.pptx
02_Linux系统基础.pptx
03_Shell编程基础.pptx
04_ MapReduce 原理与实践.pptx
05_HDFS原理与实践.pptx
06_Yarn 原理与实践.pptx
07_Xdata基本介绍.pptx
08_Hadoop Streaming原理.pptx
09_分布式数据库与数据仓库 非结构化数据与列式数据库.pptx
10_ HBase 原理与实践.pptx
11_Hive 原理与实践.pptx
12_Spark 原理与实践.pptx
13_Scala语言介绍.pptx
I9000用户手册.pdf
Insight3.0大数据智能分析平台.pdf
Mining大数据挖掘平台.pdf