Đỉnh NGUYỄN

life's a journey not a destination


Bạn nghĩ gì về bài viết này?

Big Data #11 – Vai trò của điện toán đám mây trong Big Data


Cloud là gì?

Cloud là từ thông dụng nhất trong vài năm trở lại đây. Mọi người đều biết về cloud, nhưng trong bài nay chúng ta sẽ thảo luận cloud trong ngữ cảnh big data. Cloud computing là 1 phương pháp cung cấp các tài nguyên máy tính được chia sẽ cho các ứng dụng yêu cầu tài nguyên linh động.  Các tài nguyên này gồm ứng dụng, tính toán, lưu trữ, mạng, phát triển, và các nền tảng triển khai khác. Nền tảng của cloud computing là nó chia sẽ tài nguyên và phân phối đến người dùng cuối như 1 dịch vụ.

Các ví dụ của cloud computing và big data là Google và Amazon.com. Cả hai đều cung cấp big data với sự trợ giúp của cloud.

Có 2 mô hình triển khai cloud khác nhau: 1) Public Cloud và 2) Private Cloud.

Public Cloud

Public Cloud là hạ tầệu ng cloud được xây dựng bởi các nhà cung cấp thương mại (Amazon, Rackspace,…) tạo 1 trung tâm dữ liệu khả năng mở rộng cao giúp ẩn đi các hạ tầng phức tạp với khách hàng và cung cấp các dịch vụ khác nhau.

Private Cloud

Private Cloud là hạ tầng cloud được xây dựng bởi 1 tổ chức, tự họ quản lý khả năng mở rộng của trung tâm dữ liệu nội bộ.

Đây là sự so sánh nhanh giữa Public Cloud và Private Cloud từ Wikipedia:

Public Cloud

Private Cloud

Initial cost

Typically zero

Typically high

Running cost

Unpredictable

Unpredictable

Customization

Impossible

Possible

Privacy

No (Host has access to the data

Yes

Single sign-on

Impossible

Possible

Scaling up

Easy while within defined limits

Laborious but no limits

Hybrid Cloud

Hybrid Cloud là hạ tầng cloud được xây dựng với thành phần gồm 2 hoặc nhiều hơn các clouds như public và private cloud. Hybrid cloud mang đến điều tốt nhất của nhiều mô hình triển khai cloud.

Cloud và big data – Các đặc tính phổ biến

Có nhiều đặc tính của Cloud Architecture và Cloud Computing mà cũng là bản cất quan trọng cho big data.

Danh sách các đặc tính của cloud computing mà quan trọng trong big data:

  • Scalability
  • Elasticity
  • Ad-hoc Resource Pooling
  • Low Cost to Setup Infastructure
  • Pay on Use or Pay as you Go
  • Highly Availability

Các nhà cung cấp dẫn đầu về cloud cho big data

Amazon

Amazon được cho là nhà cung cấp Infrastructure as a Service (IaaS) phổ biến nhất. Lịch sử của việc này bắt đầu khá thú vị. Họ bắt đầu với 1 đống hạ tầng hỗ trợ kinh doan của riêng họ. Dần dần họ thầy nguồn lực của mình không được tận dụng trong hầu hết thời gian. Họ quyết định tối đa hóa nguồn tài nguyên đang có và vì thế họ đưa ra dịch vụ Amazon Elastic Compute Cloud (Amazon EC2) năm 2006. Sản phẩm của họ đã phát triển rất nhiều trong thời gian gần đây và bây giờ nó đã trở thành một trong những ngành kinh doanh chính bên cạnh bán lẽ.

Amazon cũng cung cấp dịch vụ big data trong Amazon Web Services.

Đây là danh sách các dịch vụ trong Amazon Web Services:

  • Amazon Elastic MapReduce – xử lý khối lượng dữ liệu rất lớn.
  • Amazon DynammoDB – dịch vụ CSDL NoSQL.
  • Amazon Simple Storage Services (S3) – dịch vụ lưu trữ dữ liệu trực tuyến
  • Amazon High Performance Computing – cung cấp cụm tính toán hiệu suất cao
  • Amazon RedShift – dịch vụ kho dữ liệu khả năng mở rộng hàng petabyte

Google

Mặc dù Google được biết đến với Search Engine, chung ta cũng biết hãng có thể cung cấp nhiều hơn thế.

  • Google Compute Engine – cung cấp tính toán bảo mật, linh động từ trung tâm dữ liệu sử dụng hiệu quả năng lượng.
  • Google Big Query – cho phép các truy vấn giống SQL chạy với bộ dữ liệu rất lớn.
  • Google Prediction API – công cụ máy học dựa trên cloud

Các nhà cung cấp khác

Bên cạnh Amazon và Google, chúng ta cũng có nhiều nhà cung cấp khác về big data. Microsoft cũng tham gia big data với Microsoft Azure. Ngoài ra, Rackspace và NASA cùng nhau bắt đầu OpenStack. Mục tiêu của OpenStack là cung cấp cloud dễ mở rộng có thể chạy trên bất kỳ phần cứng nào.

Điều cần theo dõi

Các giải pháp dựa trên cloud cung cấp 1 tích hợp tuyệt với với câu chuyện big data cũng như rất kinh tế để thực hiện. Tuy nhiên, có một số thứ nên xem xét khi triển khai big data trên các giải pháp cloud.

  • Data Integrity
  • Initial Cost
  • Recurring Cost
  • Performance
  • Data Access Security
  • Location
  • Compliance

Mỗi công ty đều có hướng tiếp cận big data khác nhau và có các quy tắc và luật lệ khác nhau. Dựa trên các nhân tố khác nhau, có thể cài đặt giải pháp big data tùy biến của riêng họ trên 1 cloud.

(Theo http://blog.SQLAuthority.com)

Advertisements


%(count) bình luận

Giới thiệu tổng quan về điện toán đám mây


Giới thiệu chung

Điện toán đám mây (Cloud computing), còn gọi là điện toán máy chủ ảo, là mô hình tính toán sử dụng các công nghệ máy tính và phát triển dựa vào mạng Internet.

Thuật ngữ "cloud computing" ra đời giữa năm 2007 không phải để nói về một trào lưu mới, mà để khái quát lại các hướng phát triển của cơ sở hạ tầng CNTT vốn đã và đang diễn ra từ những năm qua. Quan niệm này có thể được diễn giải một cách đơn giản: các nguồn tính toán khổng lồ như các phần cứng (máy chủ ), phần mềm, và các dịch vụ (chương trình ứng dụng), … sẽ nằm tại các máy chủ ảo (đám mây) trên Internet thay vì trong máy tính gia đình và văn phòng (trên mặt đất) để mọi người kết nối và sử dụng mỗi khi họ cần.

Nói cách khác, ở mô hình tính toán này, mọi khả năng liên quan đến công nghệ thông tin đều được cung cấp dưới dạng các "dịch vụ", cho phép người sử dụng truy cập các dịch vụ công nghệ thông tin từ một nhà cung cấp nào đó "trong đám mây" mà không cần phải biết về công nghệ đó, cũng như không cần quan tâm đến các cơ sở hạ tầng phục vụ công nghệ đó.

Theo tổ chức Xã hội máy tính IEEE, “Điện toán đám mây là hình mẫu trong đó thông tin được lưu trữ thường trực tại các máy chủ trên Internet và chỉ được được lưu trữ tạm thời ở các máy khách, bao gồm máy tính cá nhân, trung tâm giải trí, máy tính trong doanh nghiệp, các phương tiện máy tính cầm tay, …".

image

Điện toán đám mây xuất hiện bắt nguồn từ ứng dụng điện toán lưới (grid computing) trong thập niên 1980, tiếp theo là điện toán theo nhu cầu (utility computing) và phần mềm dịch vụ (SaaS).

Các thành phần của điện toán đám mây

Điện toán đám mây có thể chuyển đổi các chương trình ứng dụng diện rộng theo kiến trúc và phân phối các dịch vụ.

image

– Cơ sở hạ tầng (Infrastructure)

– Lưu trữ đám mây (Cloud Storage)

– Nền tảng đám mây (Cloud Platform)

– Ứng dụng (Application)

– Dịch vụ (Services)

– Khách hàng (Client)

Các tầng kiến trúc của điện toán đám mây

Điện toán đám mây cung cấp các dịch vụ ở tất cả các tầng, từ phần cứng tới các phần mềm.

Kiến trúc do Sun đề xuất đầu tiên gồm 6 tầng:

– Các máy chủ thực (Physical Servers)

– Các máy chủ ảo (Virtual Servers)

– Hệ điều hành (Operating System)

– Phần mềm trung gian (Middleware)

– Các chương trình ứng dụng (Applications)

– Các dịch vụ (Servers)

Kiến trúc trong các tài liệu của Microsoft chia thành rất nhiều tầng như sau:

image

Các dịch vụ có thể chia thành 3 lớp chính: Phần mềm dịch vụ (software as a service), nền dịch vụ (platform as a service), và cơ sở hạ tầng dịch vụ (infrastructure as a service). Các lớp này có thể tập hợp thành các tầng kiến trúc khác nhau, có thể chồng chéo, gối nhau.

Mô hình dịch vụ trong điện toán đám mây

image

image

Phần mềm hoạt động như dịch vụ (SaaS – Software as a Service)

Phần mềm hoạt động hướng dịch vụ hoặc gọi tắt là Phần mềm dịch vụ, là mô hình triển khai phần mềm, một nhánh của điện toán đám mây, theo đó các nhà cung cấp phần mềm như là các dịch vụ theo yêu cầu cho khách hàng. Theo định nghĩa của hãng nghiên cứu toàn cầu IDC là: "phần mềm hoạt động trên web, được quản lý bởi nhà cung cấp và cho phép người sử dụng truy cập từ xa".

image

Nền tảng hướng một dịch vụ (PaaS – Platform as a Service)

Đây cũng là một biến thể của SaaS nhưng mô hình này là một nhánh của điê ̣n toán đám mây (cloud computing), mang đến môi trường phát triển như một dịch vụ: người sử dụng xây dựng ứng dụng chạy trên cơ sở hạ tầng của nhà cung cấp và phân phối tới người sử dụng thông qua máy chủ của nhà cung cấp đó . Người sử dụng sẽ không hoàn toàn được tự do vì bị ràng buộc về mă ̣t thiết kế và công nghệ . Một số ví dụ điển hình về PaaS là Force.com của Salesforce.com, Google App Engine, Yahoo Pipes …

image

Hạ tầng hướng dịch vụ (Iaas – Infrastructure as a Service)

Infrastructure as a service (IaaS) Là tầng thấp nhất của ĐTĐM, nơi tập hợp các tài sản vật lý như các phần cứng máy chủ, hệ thống lưu trữ và các thiết bị mạng, được chia sẽ và cung cấp dưới dạng dịch vụ IaaS cho các tổ chức hay doanh nghiệp khác nhau. Cũng giống như dịch vụ PaaS, ảo hóa là công nghệ được sử dụng rộng rãi để tạo ra cơ chế chia sẽ và phân phối các nguồn tài nguyên theo yêu cầu. Ví dụ về các dịch vụ IaaS như IBM BlueHouse, Vmware, Amazon EC2, Microsoft Azure Platform, Sun Parascale Cloud Storage…

image

Một số mô hình dịch vụ khác

  • Network as a service (NaaS) – Mạng lưới như một dịch vụ.
  • Storage as a service (STaaS) – Lưu trữ như một dịch vụ. Cung cấp không gian lưu trữ trực tuyến trả tiền theo nhu cầu, như Google Drive, Amazon S3, Fshare, Dropbox, …
  • Security as a service (SECaaS) – Bảo mật như một dịch vụ. Cung cấp các giải pháp bảo mật trực tuyến trả tiền theo nhu cầu, như McAfee, Trend Micro, …
  • Data as a service (DaaS) – Dữ liệu như một dịch vụ. Cung cấp dữ liệu (chỉ đọc) trả tiền theo nhu cầu thông qua các APIs, như Google Maps, Bing Maps, Amazon Public Data Sets (dữ liệu khoa học về trái đất của NASA, gồm cả thời tiết và bản đồ, dữ liệu biến đổi di truyền ở người, dữ liệu nhân khẩu học – điều tra dân số của Hoa Kỳ), Freebase (dữ liệu các sự kiện và khẳng định rất lớn trên thế giới).
  • Desktop as a service (DaaS) – Desktop như một dịch vụ. Cung cấp môi trường desktop ảo qua web hoặc thin client, như VMWare Horizon DaaS.
  • Database as a service (DBaaS) – Cơ sở dữ liệu như một dịch vụ. Cung cấp CSDL trả tiền theo nhu cầu, như MongoDB, Oracle, …
  • Test environment as a service (TEaaS) – Môi trường kiểm tra như một dịch vụ. như Sauce Labs, Perfect Mobile,
  • API as a service (APIaaS) – Giao diện lập trình ứng dụng (Application Programming Interface) như một dịch vụ. Là nền tảng cho phép tạo và host các APIs (REST, XML, Web Services), như PhantomJs.Cloud, …
  • Backend as a service (BaaS) Back-end (phần dành cho người quản trị) như một dịch vụ. như Backendless, Telerik Backend Services, Parse, …
  • Integrated development environment as a service (IDEaaS) – Môi trường phát triển tích hợp như một dịch vụ.
  • Integration platform as a service (IPaaS), see Cloud-based integration – Nền tảng tích hợp như một dịch vụ, xem thêm …..

    Các mô hình triển khai điện toán đám mây

    Đám mây công cộng (Public cloud): được 1 bên thứ 3 (người bán) cung cấp. Tồn tại ngoài tường lửu công ty và được nhà cung cấp quản lý.

    Đám mây cộng đồng (Community cloud): được chia sẽ bởi một số tổ chức và hỗ trợ một cộng đồng cụ thể có mối quan tâm chung. Nó có thể được quản lý bởi các tổ chức hoặc bên thứ ba.

    Đám mây riêng (Private cloud): được sở hữu bởi cá nhân hoặc tổ chức. Những đám mây này tồn tại bên trong tường lửa công ty và chúng được doanh nghiệp quản lý.

    Đám mây lai (Hybird cloud): là sự kết hợp của Public cloud và Private cloud.

    Một số nhà cung cấp dịch vụ

    Nhà cung cấp Iaas

    clip_image001clip_image002clip_image003clip_image004clip_image005clip_image006clip_image007clip_image008clip_image009clip_image010clip_image011clip_image012clip_image013clip_image014clip_image015clip_image016clip_image017clip_image018clip_image019clip_image020

    Nhà cung cấp PaaS

    clip_image001[4]clip_image002[4]clip_image003[4]clip_image004[4]clip_image005[4]clip_image006[4]clip_image007[4]clip_image008[4]clip_image009[4]clip_image010[4]clip_image011[4]clip_image012[4]clip_image013[4]clip_image014[4]clip_image015[4]clip_image016[4]clip_image017[4]clip_image018[4]clip_image019[4]clip_image020[4]

    Nhà cung cấp SaaS

    clip_image001[6]clip_image002[6]clip_image003[6]clip_image004[6]clip_image005[6]clip_image006[6]clip_image007[6]clip_image008[6]clip_image009[6]clip_image010[6]clip_image011[6]clip_image012[6]clip_image013[6]clip_image014[6]clip_image015[6]clip_image016[6]clip_image017[6]clip_image018[6]clip_image019[6]

    (Theo http://Cloud360.com và 1 số trang khác)