Search This Blog

Sunday, December 13, 2009

Pig

Pig는 data analysis program을 표현하기 위한 high-level language로 구성고 이러한 program을 evaluation하기 위한 infrastructure와 연결된 large data sets를 분석하기 위한 platform이다. Pig program들의 특징은 그들의 구조가 parallelization에 적합하고, 따라서 very large data sets를 handle하게 해줄 수 있다는 것이다.

현재, Pig의 infrasturucture layer는 Map-Reduce program의 sequence를 생성하는 compiler로 구성되어 있으며, 그것에 대해서 large-scale parallel implementation이 조냊한다. Pig의 language layer는 Pig Latin이라 불리우는 textual language로 구성되어 있다.

For more information: http://hadoop.apache.org/pig/

No comments:

Post a Comment

Blog Archive