ETL
提取转换加载(extract, transform, load,简称ETL),用来描述将数据从来源端经过抽取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
ETL与ELT
ETL所描述的过程,一般常见的作法包含ETL或是ELT(Extract-Load-Transform),并且混合使用。通常愈大量的数据、复杂的转换逻辑、目的端为较强运算能力的数据库,愈偏向使用ELT,以便运用目的端数据库的平行处理能力。
工具
ETL(或ELT)的流程可以用任何的编程语言去开发完成,由于ETL是极为复杂的过程,而手写程序不易管理,有愈来愈多的企业采用工具协助ETL的开发,并运用其内置的元数据(metadata)功能来保存来源与目的的对应(mapping)以及转换规则。
工具并可以提供较强大的连接功能(connectivity)来连接来源及目的端,开发人员不用去熟悉各种相异的平台及数据的结构,亦能进行开发。
参见
外部链接
- CloverETL(页面存档备份,存于)
- Pentaho Data Integration(页面存档备份,存于)
- Talend Open Studio(页面存档备份,存于)
- Benetl (freeware)(页面存档备份,存于)
- Simple Data Integrator (页面存档备份,存于)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.