【Hive】DDL语句详解一-知无不言
学会了Hive的一些操作,发现Hive建过表,后续的数据并不是向MySQL是通过自己手写进行插入的,而是将TXT文件解析成为数据表的操作。其实是HDFS将文件映射成Hive表,然后然后通过写类SQL的语句来操作该文件,底层会被解析成为MR程序。
Hive的本质把HDFS文件映射成一张Hive表, 然后通过写类SQL的语句来操作它(HDFS文件), 底层会被解析成MR程序, 交由Yarn来调度执行.
DDL(Data Define Language)是什么?
见名知意,数据定义语言==Data Define Language。
对数据库的操作:包含创建(Create)数据库,数据表、修改数据库 (Alter table)
对数据表的操作:内部表(Managed Table)及外部表(External),分区表(Partition)和分桶表
数据库Operation1234567create database if not exists 数据库名; -- 创建数据库show databases; -- 查看系统中所有数据库use 数据库名; -- 切换数据库 ...
【Python查漏补缺(一)】闭包和装饰器
闭包的构成条件:
在函数嵌套(函数里面再定义函数)的前提下
内部函数使用了外部函数的变量(还包括外部函数的参数)
外部函数返回了内部函数
简单闭包12345678910111213def fun_out(num1): # 定义外部函数 def fun_inner(num2): # 内部函数使用了外部函数的变量 result = num2 + num1 print("结果是: ", result) # 外部函数返回了内部函数,这里返回的内部函数就是闭包 return fun_inner f = fun_out(1) # 创建闭包实例f(2)f(3)
当返回的内部函数使用了外部函数的变量就形成了闭包
闭包可以对外部函数的变量进行保存
闭包的作用*闭包的作用: 闭包不仅可以保存外部函数的变量还可以提高代码的可重用性(不需要再手动定义额外的功能函数*
12345678910111213def config_name(name): # 定义外部函数 # 内部函数使用了外部函数的变量 ...
MySQL刷题本1(Northwind)
微软NorthWind
本文章的练习题来自Microsoft的Northwind项目,是一个开源的数据库练习项目。
经过一个上午的练习,一口气将34道练习题做完了。
对于这个练习题,我的评价是难度不大,很适合上手,另外一个45道题的刷题本可就比这难多了!
数据准备数据源是从Git上下载的, 微软的北风项目的源数据Northwind数据库在我的博客园MySQL刷题12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114 ...
HDFS及上手Hive
HDFS的常见shell命令Summary(总结)第一点:书写HDFS的shell命令大致就是在shell的基础上在开头添加Hadoop fs 或者hdfs dfs这种,并且在命令起始添加 - 。
第二点:基础命令中只有put,get命令,还有appendToFile命令是Linux路径和HDFS路径进行交互的。
12345678910111213141516171819202122232425262728293031323334353637383940# HDFS的Shell命令指的是, 在CRT 或者 Tabby等工具中, 写Shell命令, 操作HDFS文件系统.# 格式, 如下两种方式, 除了通用性以外, 其它没区别. hadoop fs -命令名 [选项] [参数] # 更通用, 可以操作多种文件系统.hdfs dfs -命令名 [选项] [参数] # 只能操作HDFS文件系统.# ls命令, 查看指定目录的(子级)信息的hadoop fs -ls / # 只能查看单级hdfs dsf -ls / # 只能查看单级hadoop fs -lsr / # 查看目录的信息 ...
初识Hadoop集群
学校之前学习过Hadoop,只是记得当时老师搭建Hadoop环境就用了很久的时间,不过实话说,集群搭建的话真的很耗时间。而且搭建这个集群是比较重要的一步操作,因为数仓的底层用的就是Hadoop。
后面会有具体搭建Hadoop集群的步骤,这里就不再啰嗦了。
Apache Hadoop是什么!
hadoop 广义上来说 hadoop整个生态,狭义来说,大数据软件
hadoop 软件分为三个组件(见名知意)
HDFS(Hadoop Distributed File System): 分布式存储系统
MapReduce: 分布式计算引擎
Yarn: 分布式资源调度平台
什么是分布式:
打个比方,做一道菜需要有切菜(多个人),洗菜(多个人),买菜(多个人),这个过程中切,洗,买就构成了分布式。而在切菜中多个人就算一个集群,集群中的人做相同的事情。
大数据的三驾马车2003, 谷歌发表GFS, 道格·卡丁(Doug Cutting)开源, 叫: HDFS(Hadoop Distributed File System)2004, 谷歌发表MapReduce, 道格·卡丁(D ...
Linux进阶(Shell编程)
Summary:总结
echo输出的三种情况:(这几种情况固然很难区分,那么就每种情况记忆1个好了!标红的是)
和输出变量相关:(name=zhangsan) (大-括号)
echo $name ==>输出name变量的值
echo ${name}123 ==> 输出zhangsan123 (细节:如果只有变量名,大括号可以不写)
和数学运算相关(中-括号)
echo $((5+5)) ==>输出10
echo $[5+5]
echo `expr 5+5’
和执行Linux命令相关(小-括号)
echo `linux命令` ==> echo `pwd`
echo (Linux命令) ==> echo (ll -h)
开始前的准备修改Linux中默认制表符
linux中默认制表符即Tab键为8个空格,在shell编程中略有不便
12vim /etc/vim/vimrc # 编辑系 ...
MySQL综合练习
数据准备数据表介绍123456789101112131415--1.学生表Student(SId,Sname,Sage,Ssex)--SId 学生编号,Sname 学生姓名,Sage 出生年月,Ssex 学生性别 --2.课程表Course(CId,Cname,TId)--CId 课程编号,Cname 课程名称,TId 教师编号 --3.教师表Teacher(TId,Tname)--TId 教师编号,Tname 教师姓名 --4.成绩表SC(SId,CId,score)--SId 学生编号,CId 课程编号,score 分数
数据表创建1234567891011121314151617181920212223242526272829303132333435363738394041424344-- 学生表 Studentcreate table Student(SId varchar(10),Sname varchar(10),Sage datetime,Ssex varchar(10));insert into Student values('01' , ...
Kettle食用教程
我的博客园:https://www.cnblogs.com/liam-sliversucks/p/17389584.html
Kettle使用教程Kettle是什么
kettle原本是水壶的意思,是可以将一种类型的数据转换为另一种类型的数据,还可以对同种类型的数据进行筛选,分表操作。
对于企业或行业应用来说,经常会遇到各种数据的处理,转换,迁移,掌握一种ETL工具的使用,必不可少,这篇文章介绍的ETL工具是Kettle,现在已经更名为PDI。
可能我对于Kettle的了解还不是很深刻,但是先做好总结,为后续的ETL ==> 数据抽取(extract)、转换(transform)、加载(load)打好基础。
Kettle有什么用?ketlle可以在多种数据源之间进行快速转换。
kettle开发步骤:
新建转换
构建Kettle的数据流图
配置数据流图中的各个组件
保存并启动执行
Kettle的数据转换Txt数据转换ExcelExcel数据转换mysql数据MySQL数据表间转换插入-更新组件switch-case组件定时定次执行SQL脚本设 ...
集群配置前置VMware+Centos
本站由于部署在Github上,故很少上传图床。
为方便浏览,将一些带有图片的心得全部放在博客园
VMware for Mac出现版本过低问题
解决办法:在虚拟机解压文件夹中找到Windows 7 x64.vmx(比如node1.vmx都行)并用Notepad++打开,编辑ddb.virtualHWVersion = "18"将18改为14就解决了。这里我的Mac OS版本有点老了,新版的可以弄高点,免得出现一些莫名其妙的错误。
VMware安装VMware安装步骤for Windows
傻瓜式安装, 下一步下一步即可,再不会直接百度
细节: 优先装VM16, 其次VM15(如果开机蓝屏, 换版本即可), 本质没太大区别
验证成功去你的windows网络连接中, 能看到 VMNet1 和 VMNet8两个网卡即可
Vmware for Mac安装直接下一步就行,很人性化的,但是需要制定镜像。
注意这里的镜像是纯净版。
在VMware中安装虚拟机使用Linux时–两个常见问题
问题1: 装Linux系统的时候, IP忘记改了, 或者改错了怎么办?
123456 ...
前端编程基础JavaScript
JavaScript基础JavaScript是什么
JavaScript是运行在浏览器端的脚本语言,它的作用就是负责网页和用户的交互效果。
JavaScript首先看到这个名字就知道跟Java肯定脱不开关系,这两种语言很像。JavaScript直译过来就是java脚本的意思,而语法上,JavaScript在定义变量时只用var。下面就看看这两种语言的具体差别吧!
JavaScript的引入方式具体有:行内式,内嵌式,外链式三种方式。
123456<!--js引入方式,行内式(主要用于事件)--><input type="button" name="" onclick="alert('ok!')"><!--js引入方式:内嵌式--><script type="text/javascript">alert("ok !")</script><!--js引入方式:外链式--><script t ...