Lưu trữ dữ liệu so với dữ liệu
Bạn nên xây dựng cái nào trước: kho dữ liệu hay mart dữ liệu? Đây là câu hỏi đã làm phiền các nhà quản lý CNTT rất nhiều gần đây. Hầu hết các nhà cung cấp sẽ nói rằng kho dữ liệu là khó khăn và tốn kém để làm, và họ không được khuyến khích. Họ nói rằng các kho dữ liệu mất nhiều thời gian để xây dựng. Ngoài ra, họ nói rằng nó phải đối mặt với rất nhiều vấn đề liên quan đến những gì công ty đang phải đối mặt trong thời gian này. Một số vấn đề là sự tích hợp của dữ liệu kế thừa và khó khăn trong việc quản lý số lượng lớn dữ liệu. Data mart chắc chắn đã tạo ra một hình ảnh ảm đạm ra khỏi kho dữ liệu, nhưng tất cả đều không đúng sự thật. Một định nghĩa kỹ lưỡng và trích dẫn khác biệt là cần thiết cho quan niệm sai lầm này. Nhưng kho dữ liệu và kho dữ liệu là gì?
Đầu tiên người ta phải biết rằng mart dữ liệu đại diện cho một công ty cụ thể. Nó đại diện cho các chương trình, dữ liệu, phần mềm và phần cứng của nó. Nó có nghĩa là có mart dữ liệu riêng cho từng bộ phận. Ví dụ, có một trung tâm dữ liệu cho sản xuất, tài chính, một bộ phận khác cho bộ phận bán hàng và một bộ phận khác để tiếp thị. Mỗi mart dữ liệu có chức năng và tính năng cụ thể của riêng mình. Nó không giống với các dữ liệu khác từ các bộ phận khác, nhưng chúng có thể phối hợp với nhau. Data mart tập trung vào bộ phận cá nhân và cụ thể, đó là lý do tại sao nó không thể xử lý dữ liệu lớn. Cơ sở dữ liệu cấu trúc sao tham gia được sử dụng để thu thập tất cả cơ sở dữ liệu mart cho thiết kế. Có hai loại mart dữ liệu, mart dữ liệu độc lập (đây là dữ liệu mạnh hơn) và mart dữ liệu phụ thuộc (đây là loại dữ liệu ít mạnh hơn). Người ta phải tạo nhiều dữ liệu độc lập để có thể sử dụng nó cho tổ chức.
Kho dữ liệu rộng và không giới hạn chỉ tập trung vào các bộ phận cụ thể. Nó có thể đại diện cho toàn bộ công ty; nó bao gồm tất cả các đối tượng và mô hình của dữ liệu công ty. Kho dữ liệu không giới hạn liên quan đến lĩnh vực chủ đề của các bộ phận và tập đoàn. Dữ liệu được lưu trữ trong kho dữ liệu chi tiết hơn so với dữ liệu mart. Cách chỉ số kho dữ liệu là nhẹ vì nó phải xử lý khối lượng dữ liệu lớn. Kho dữ liệu bao gồm một khu vực rộng lớn của tập đoàn hoặc công ty, đó là lý do tại sao phải mất một thời gian dài để xử lý nó. Đó cũng là lý do tại sao các bảng dữ liệu nhanh chóng và dễ sử dụng, thiết kế và triển khai vì nó chỉ xử lý một lượng nhỏ dữ liệu. Đây cũng là lý do tại sao kho dữ liệu đắt hơn so với data mart.
TÓM LƯỢC:
1.
Data Mart tập trung vào các bộ phận riêng lẻ của công ty hoặc công ty trong khi kho dữ liệu có thể đại diện cho toàn bộ công ty hoặc tập đoàn.
2.
Data mart chỉ có thể xử lý một lượng nhỏ dữ liệu, không giống như kho dữ liệu có thể xử lý lượng lớn dữ liệu.
3.
Kho dữ liệu có thể trở nên đắt đỏ và khó sử dụng vì nó bao gồm một phần rộng của công ty hoặc tập đoàn, không giống như trung tâm dữ liệu có giá cả phải chăng và thuận tiện vì nó liên quan đến các bộ phận nhỏ của công ty hoặc tập đoàn.