Etl Là Gì

Tổng quan ETL

Tiến trình ETL tốt còn được gọi là quá trình thu thập với tích vừa lòng tài liệu (Data Acquisition và Integration).quý khách sẽ xem: Etl là gì

Extract (Data Acquisition): truy vấn khối hệ thống mối cung cấp nhằm trích xuất tài liệu. Dữ liệu được ra đời từ bỏ quy trình này gọi là dữ liệu mối cung cấp (Source Data).

Bạn đang xem: Etl là gì

Transform (Data Integration): chất vấn, có tác dụng sạch, kiểm soát và điều chỉnh phù hợp các thưởng thức của DW. Dữ liệu được tạo nên bảo quá trình này Điện thoại tư vấn là tài liệu sở hữu (Load Data).Load (Data Integration): update DW cùng với tài liệu được cung cấp từ Load Data.


*

Data Mapping

Data Mapping giúp xác định dữ liệu mối cung cấp (địa chỉ location, trạng thái state, thời hạn timing,…) đáp ứng nhu cầu những kinh nghiệm tài liệu của một DW. Các phnghiền đổi khác những thiết để tạo thành những nhân tố dữ liệu vào DW cũng rất được thể hiện trong bạn dạng thứ dữ liệu này. Data Mapping hoàn toàn có thể được trình bày nghỉ ngơi dạng bảng tính, biểu đồ dùng hoặc văn bản.

Xem thêm: Ông Nguyễn Đức Chung: Tiểu Sử Nguyễn Đức Trung, Nguyễn Đức Chung


*

*

Business Rule

Ví dụ:


*

*

Trong vận dụng ETL, data được lấy từ bỏ hệ thống chuyển động Operational System. Dữ liệu trích xuất Extracted Data được nắm bắt trên nền tảng gốc rễ đươc tinh chỉnh vì chưng vận dụng ETL. Tiến trình nắm bắt dữ liệu bên trên nền tảng gốc rễ này được Call là Staging. Nền tảng này được Điện thoại tư vấn là Staging Platform hoặc Staging Environment. Tại thời điểm đó, Staged Data sinh hoạt dạng thô raw, giống thể thức và tâm trạng của nó trong vận dụng hoạt đông. Trước quy trình Transsize, Staged Data được Gọi là Source Data.

Ứng dụng Transsize triển khai những phiến chuyển đổi dữ liệu cần thiết trên Source Data để làm nó phù hợp với những qui tắc, bố cục tổng quan với định dạng vào DW. Transformed Data vẫn được được thâu tóm vào Staging Platsize. Tuy nhiên, sau khi Transsize, Staged Data được gọi là Load Data.

Ứng dụng Load là cầu nối khoảng cách giãu ETL/Staging Platform cùng DW Platform. Ứng dụng Load đọc Load Data và xúc tiến các bước INSERT, UPDATE, DELETE trên DW. khi vận dụng Load thành công xuất sắc, ETL chấm dứt.

Extract-Load-Transform


Ứng dụng ELT áp dụng căn cơ ELT nhỏng một căn cơ trong thời điểm tạm thời nhằm kết nối tới căn cơ DW RDBMS. Nền tảng ELT trích xuất tài liệu hoạt động, cài đặt thẳng vào những Staging Table bên trên gốc rễ DW RDBMS. Tất cả chức năng Transform được triển khai bên trên nền tảng gốc rễ này. Cuối thuộc, DW được thiết lập từ bỏ phía bên trong căn nguyên DW RDBMS.

Ngulặng lý xây đắp ETL

Process principles:

One Thing at a TimeKnow when lớn BeginKnow when lớn EndLarge khổng lồ Medium lớn SmallStage Data IntegrityKnow what you have

Stage principles: