使用Hive进行数据统计的流程

使用Hive进行数据统计的流程

1. 准备好结构化数据并将其存放在文件/文件夹中 2. 将保存结构化数据的文件或文件夹上传到HDFS 3. 创建原始数据库表,从HDFS上导入数...
Hive中数据表相关操作

Hive中数据表相关操作

# 查看数据库 show databases; # 创建一个名为test的数据库, # 并将其保存在...
Hive简介及其在CentOS7上的安装

Hive简介及其在CentOS7上的安装

一、Hive简介 1. Hive是一个基于Hadoop的开源数据仓库工具,用于存储和处理海量结构化数据 2. 数据存储于&nb...
CentOS7下单机安装Hadoop(伪分布式)

CentOS7下单机安装Hadoop(伪分布式)

1. 新建hadoop用户 # 新建hadoop用户 adduser hadoop # 为hadoop用户初始化密码 passw...
MapReduce介绍

MapReduce介绍

Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。...
HDFS简介

HDFS简介

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。 一、特点...
使用Node创建一个基于TCP的聊天服务器

使用Node创建一个基于TCP的聊天服务器

/* * @file: tcp-server.js * @brief: 创建一个基于 TCP的聊天服务器 * @author: feihu1...
使用Node实现简单的静态资源服务器

使用Node实现简单的静态资源服务器

/* * @file: http.js * @brief: 使用Node实现简单的静态资源服务器 * @author: feihu1996.c...
Ruby循环之times方法

Ruby循环之times方法

# encoding: UTF-8 =begin @file: times.rb @brief: Ruby循环之times方法...
Ruby对象的同一性

Ruby对象的同一性

# encoding: UTF-8 =begin @file: object_id.rb @brief: Ruby对象的同一性...

User Login