导航菜单

分布式存储与计算

HDFS分布式文件系统

hdfs dfs -ls /data
hdfs dfs -put local.txt /data/

Hive数据仓库

CREATE TABLE users(id INT, name STRING);
SELECT * FROM users;

HBase NoSQL数据库

create 'user', 'info'
put 'user', '1001', 'info:name', 'Tom'

分布式计算原理

  • • MapReduce:分而治之,批量处理
  • • Spark/Flink:内存计算与流式处理