Search This Blog

Sunday, December 13, 2009

Hive

Hive는 Hadoop 위에 design된 data warehouse infrastructure로 data summarization, adhoc querying, 그리고 Hadoop files에 저장된 대용량 data 분석을 위한 tool을 제공한다. 이것은 이 data위에 structure를 얹는 machanism을 제공하고, SQL을 base로 한 Hive QL이라 불리우는 simple query language를 제공한다. 동시에 이 language는 전통적인 map/reduce programmer들로 하여금 그들의 custom mappers와 reducers들을 plug in하여 이 language가 자체적으로 제공하지 않는 더 세련된 분석을 가능하게 한다.

For more information: http://hadoop.apache.org/hive/

No comments:

Post a Comment

Blog Archive