Kettle 是”Kettle E.T.T.L. Envirnonment”只取首字母的缩写,这意味着它被设计用来帮助你实现你的 ETTL 需要:抽取、转换、装入和加载数据;翻译成中文名称应该叫水壶,名字的起源正如该项目的主程序员 MATT 在一个william hill官网 里说的哪样:希望把各种数据放到一个壶里然后以一种指定的格式流出。
Spoon 是一个图形用户界面,它允许你运行转换或者任务,其中转换是用 Pan 工具来运行,任务是用 Kitchen 来运行。Pan 是一个数据转换引擎,它可以执行很多功能,例如:从不同的数据源读取、操作和写入数据。Kitchen 是一个可以运行利用 XML 或数据资源库描述的任务。通常任务是在规定的时间间隔内用批处理的模式自动运行。
Kettle 的安装
要运行此工具你必须安装 Sun 公司的 JAVA 运行环境 1.4 或者更高版本
运行 Spoon
下面是在不同的平台上运行 Spoon 所支持的脚本:
Spoon.bat: 在 windows 平台运行 Spoon。
Spoon.sh: 在 Linux、Apple OSX、Solaris 平台运行 Spoon。
资源库
一个 Kettle 资源库可以包含那些转换信息,这意味着为了从数据库资源中加载一个转换,你必须连接相应的资源库。
要实现这些,你需要在资源库中定义一个数据库连接,你可以在 Spoon 启动的时候,利用资源库对话框来定义。
定义
1.6.1 转换
1. Value:Values 是行的一部分,并且是包含以下类型的的数据:Strings、floating point Numbers、unlimited precision BigNumbers、Integers、Dates、或者 Boolean。
2. Row:一行包含 0 个或者多个 Values。
3. Output Stream:一个 Output Stream 是离开一个步骤时的行的堆栈。
4. Input Stream:一个 Input Stream 是进入一个步骤时的行的堆栈。
5. Hop:一个 Hop 代表两个步骤之间的一个或者多个数据流。一个 Hop 总是代表着一个步骤的输出流和一个步骤的输入流。
6. Note:一个 Note 是一个转换附加的文本注释信息。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !