Hive là gì
HIVE là gì?

Hive là hạ tầng kho dữ liệu đến Hadoop. Nhiệm vụ đó là cung ứng sự tổng thích hợp tài liệu, truy vấn với so với. Nó cung ứng so sánh những tập dữ liệu lớn được lưu giữ vào HDFS của Hadoop tương tự như trên Amazon S3. Điểm tốt của HIVE là cung cấp truy hỏi xuất giống SQL mang lại tài liệu tất cả cấu tạo, biết đến cùng với thương hiệu HiveSquốc lộ (hoặc HQL) cũng giống như đối chiếu big data với MapReduce. Hive ko được xây dựng để hồi đáp nhanh khô những câu tầm nã vấn tuy thế nó được tạo cho những áp dụng khai quật tài liệu (data mining). Các áp dụng khai quật tài liệu có thể mất nhiều phút đến những giờ đồng hồ để đối chiếu dữ liệu và HIVE được sử dụng đa số.
Bạn đang xem: Hive là gì
Cách tổ chức của HIVE
Dữ liệu được tổ chức triển khai thành 3 định hình trong HIVE.
Tables: Chúng cực kỳ tựa như như bảng (tables) trong RDBMS cùng chứa các dòng (rows). Hive chỉ được xếp lớp bên trên HDFS, vì vậy tables được ánh xạ trực tiếp vào các thỏng mục của hệ thống tập tin. Nó cũng hỗ trợ những tables được lưu trên những hệ thống tập tin khác.
Xem thêm: Thẻ Amex Là Gì - Các Thông Tin Mà Bạn Cần Nắm
Buckets: Trong Hive sầu, dữ liệu có thể được chia thành những buckets. Buckets được tàng trữ nhỏng các tập tin trong partition vào hệ thống tập tin.
Hive cũng có thể có metastore nhằm lưu giữ tất cả metadata. Nó là DataBase quan hệ giới tính chứa lên tiếng khác nhau tương quan mang lại Hive Schema (column types, owners, key-value data, statistics,…). Chúng ta có thể dùng MySquốc lộ cho vấn đề này.


HiveSQL (HQL) là gì?
Tạo và thống trị tables với partitions.Hỗ trợ các tân oán tử Relational, Arithmetic cùng Logical khác nhau.Evaluate functionsTải về văn bản 1 table tự tlỗi mục toàn thể hoặc tác dụng của câu truy hỏi vấn mang đến thỏng mục HDFS.Đây là ví dụ truy tìm vấn HQL:
SELECT upper(name), salesprice FROM sales; SELECT category, count(1) FROM products GROUPhường. BY category;
Chuyên mục: Công nghệ tài chính