Kettle

来自开放百科 - 灰狐
2021年2月24日 (三) 10:45Allen (讨论 | 贡献)的版本

跳转到: 导航, 搜索

Kettle is a powerful, open source, metadata-driven ETL tool

目录

简介

Pentaho Data Integration (ETL, EII - jobs & transformations), License: Apache v2

组成

Pentaho Data Integration (Kettle) 包含以下工具:

  • Spoon:一个创建转换和任务的图形化IDE
  • Kitchen:一个运行任务的命令行工具
  • Pan:一个运行转换的命令行工具
  • Carte:一个在远程主机运行任务和转换的轻量级服务器

用处

  • Data warehouse population with built-in support for slowly changing dimensions, junk dimensions and much, much more.
  • Export of database(s) to text-file(s) or other databases
  • Import of data into databases, ranging from text-files to excel sheets
  • Data migration between database applications
  • Exploration of data in existing databases. (tables, views, synonyms, )
  • Information enrichment by looking up data in various information stores (databases, text-files, excel sheets, )
  • Data cleaning by applying complex conditions in data transformations
  • Application integration

插件

Kettle的插件体系

仓库

MySQL

create database kettle;

然后通过资源库的创建向导完成数据库的创建,会新建41个表 (3.0.1版本),然后每次启动登录资源库

admin/admin 

可把整个资源库导出: repositories.xml, 也可把资源库从xml导入

Kettle Repository DDL

集群

./carte.sh 127.0.0.1 8080
http://127.0.0.1:8080
cluster/cluster

Eclipse

基于Eclipse体系和框架进行重构?

大数据

图集

链接

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱