您现在的位置是:首页 > 数据库 > 大数据
  • 大数据学习第(5)话-Hive常用操作

    环境介绍:

    yuyong2019-03-04大数据

  • 大数据学习第(4)话-Hive的安装

    hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。——摘自百度百科

    yuyong2019-02-26大数据

  • 大数据学习第(3)话-hdfs常用操作

    环境介绍:操作系统:CentOS7 x64 *4(1台namenode,3台datanode)Hadoop版本:3.1.2Java版本:1.8.0 x64常用命令:执行“hdfs dfs”或者“hadoop fs”便可以弹出如下命令提示[root@nnode1

    yuyong2019-02-26大数据

  • 大数据学习第(2)话-Hadoop完全分布式

    上一篇学习了Hadoop的安装以及本地模式、伪分布模式的配置,并在伪分布模式下运行了wordcount的示例,接下来将学习Hadoop完全分布式的配置,本篇教程共采用四台虚拟机,其中三台虚拟机是通过上一篇的伪分布的虚拟机完全克隆而来...

    yuyong2019-02-25大数据

  • 大数据学习第(1)话-安装Hadoop

    大数据学习第(1)话-安装Hadoop;
    大数据的解决了两个问题,一个是存储(分布式存储),另一个是计算(分布式计算);
    Hadoop就是Apache基金会所开发的分布式系统基础架构。
    Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。

    yuyong2019-01-31大数据