Đỉnh NGUYỄN

life's a journey not a destination

Big Data #13 – Các loại CSDL hỗ trợ Big Data – Key-Value Pairs Databases và Document Databases

Leave a comment


Các CSDL Key Value Pair

Các CSDL Key Value Pair cũng được biết như các CSDL KVP. Một key là 1 tên trường và thuộc tính, 1 định danh. Nội dung của trường là giá trị của nó, dữ liệu được định danh và lưu trữ.

Chúng là cài đặt đơn giản của khái niệm CSDL NoSQL. Chúng không có schema vì thế rất linh động. Các điểm bất lợi của các CSDL Key Value Pair (KVP) là chúng không theo các thuộc tính ACID (Atomicity, Consistency, Isolation, Durability). Ngoài ra, nó sẽ yêu cầu kiến trúc dữ liệu để lập kế hoạch cho vị trí dữ liệu, replication cũng như tính sẵn sàng cao. Trong CSDL KVP, dữ liệu được lưu dạng chuỗi.

Key

Value

Name

Pinal Dave

Color

Blue

Twitter

@pinaldave

Name

Nupur Dave

Movie

The Hero

Một số người mới dùng CSDL KVP khó quản lý toàn bộ CSDL. Không có schema cụ thể hoặc các quy tắc liên quan đến CSDL. Lựa chọn đúng CSDL KVP với các công cụ để quản lý dữ liệu và cung cấp kiểm soát tốt các khía cạnh kinh doanh khác nhau.

Riak

Riak là 1 trong những CSDL KVP phổ biến nhất. Nó cung cấp khả năng mở rộng (scalability) và hiệu suất (performance) cho CSDL dung lượng lớn (volume) và tốc độ (velocity). Ngoài ra, nó cài đặt cơ chế thu thập key và values giúp xây dựng hệ thống quản lý được.

CSDL KVP là lựa chọn tốt cho social media, communities, caching layer cho kết nối đến các CSDL khác. Nói đơn giản, khi chúng ta yêu cầu tính linh hoạt của lưu trữ dữ liệu giúp khả năng mở rộng – CSDL KVP là lựa chọn tốt.

Document Database

Có hai loại document database khác nhau. 1) Full document content (web pages, word docs,…) và 2) Storing document components for storage. Loại thứ 2 của document database chúng ta đang nói ở đây. Chúng dùng Javascript Object Notation (JSON) và Binary JSON làm cấu trúc của document. JSON là ngôn ngữ rất dễ hiểu và nó rất dễ viết cho các ứng dụng. Có 2 cấu trúc JSON chính được dùng cho Document Database – 1) Name Value Pairs và 2) Ordered List.

MongoDB và CouchDB là 2 trong Open Source NonRelational Document Database phổ biến nhất.

MongoDB

CSDL MongoDB được gọi collections. Mỗi collection được xây dựng bởi documents và mỗi document được soạn ra bởi fields. MongoDB collections có thể được tạo chỉ mục để tối ưu hóa hiệu suất. MongoDB ecosystem sẵn sàng cao, hỗ trợ truy vấn cũng như MapReduce. Nó thường được dùng trong hệ thống quản lý nội dung khối lượng (volume) lớn.

CouchDB

CSDL CouchDB được soạn ra bởi documents mà chứa fieldsattachments (được biết như description). Nó hỗ trợ các thuộc tính ACID. Các điểm thu hút chính của CouchDB là nó sẽ tiếp tục vận hành thậm chí kết nối mạng chập chờn. Do tính chất này, CouchDB thích hợp lưu trữ dữ liệu cục bộ.

Document Database là sự lựa chọn tốt khi người dùng tạo các báo cáo động từ các yếu tố thay đổi rất thường xuyên. Một ví dụ tốt của dùng document là phân tích theo thời gian thực trong mạng xã hội hoặc hệ thống quản lý nội dung.

(Theo http://blog.SQLAuthority.com)

Advertisements

Author: dinhnn

Senior software developer, a technical leader. You can be reached at via email to dinhnguyenngoc@gmail.com, via my blog at dinhnguyenngoc.wordpress.com, and on Twitter @dinhnguyenngoc.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s