Apache Hadoop

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Apache Hadoop
Hadoop logo new
開発元 Apacheソフトウェア財団
初版 2006年4月1日 (18年前) (2006-04-01)
最新版

3.3.1 / 2021年6月15日 (2年前) (2021-06-15)[1]

リポジトリ ウィキデータを編集
プログラミング
言語
Java
対応OS クロスプラットフォーム
サポート状況 Active
種別 分散ファイルシステム
ライセンス Apache License 2.0
公式サイト http://hadoop.apache.org/
テンプレートを表示

Apache Hadoopは大規模データの分散処理を支えるオープンソースソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。HadoopはGoogleMapReduceおよびGoogle File System(GFS)論文に触発されたものである。

HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。[2]

アーキテクチャ[編集]

Hadoopは、以下の4つのモジュールによって構成されている。

  • Hadoop Common: 他のモジュールから共通して利用されるライブラリ群。
  • Hadoop Distributed File System (HDFS): Hadoop独自の分散ファイルシステム。
  • Hadoop YARN: Hadoopクラスタのリソース管理や、Hadoop上で動作するアプリケーションのスケジューリングを担当する。
  • Hadoop MapReduce: Hadoop上で動作するMapReduceフレームワークの実装。

また、HadoopではHDFS以外のファイルシステムもサポートしている。2015年5月現在では、下記のファイルシステムをサポートしている。

Hadoop Distributed File System (HDFS)[編集]


Hadoop Distributed File System (HDFS)HadoopHDFS(128MB)()RAID321

HDFSNameNodeDataNodeNameNodeHDFS()DataNodeDataNodeNameNodeDataNodeDataNodeDataNodeDataNode

DataNode100010PB

NameNodeHadoop 2.2HAHadoop 2.2NFSv3

Yet Another Resource Negotiator (YARN)[]


Yet Another Resource Negotiator (YARN)HadoopHadoop 1HadoopHDFSMapReduce2YARNHadoop 2.2

: Hadoop 1MapReduce(JobTracker)MapReduceMapReduce()3JobTrackerHadoop1000

: Hadoop 1MapReduce(TaskTracker)MapReduceMapReduceMapReduceMapTaskTracker使

MapReduce: HadoopMapReduceMapReduce2MapReduceHDFSMapReduceHDFSMapReduceMapReduce

YARNHadoop 1MapReduceYARNHDFS()ResourceManager()NodeManagerMapReduceApplicationMasterApplicationMasterNodeManagerMapReduceApplicationMasterYARNMapReduceApache Spark()Apache Storm()Apache Tez[3] 

Hadoop MapReduce[編集]


Hadoop 2YARNMapReduceMRv2JobTrackerTaskTrackerMapReduceMRv1Hadoop 2MRv1MapReduceDataNodeMap

MRv2[]


YARNMapReduceResourceManagerResourceManagerApplicationMasterNodeManagerApplicationMasterMapReduceResourceManager

MRv1[]


MapReduceJobTrackerJobTrackerMapReduceJobTrackerTaskTrackerTaskTrackerJobTrackerMapReduceJobTrackerMapReduce

[]


A9.com

Facebook

Fox Interactive Media

IBM

ImageShack

ISI

Joost

Last.fm

Powerset



Rackspace



Veoh

Metaweb


[]


WebHadoopHadoop[4]10 TB

調HadoopI/O[5]調218

[]


Arun C. Murthy, Vinod Kumar Vavilapalli, Doug Eadline, Joseph Niemiec, Jeff MarkhamApache Hadoop YARN: Moving beyond MapReduce and Batch Processing with Apache Hadoop 2Addison-Wesley Professional2014ISBN 978-0321934505

, , , , , , Hadoop 22013ISBN 978-4798129648

Tom White, , Hadoop 32013ISBN 978-4873116297

[]



(一)^ Hadoop Releases.  Hadoop.apache.org. 2021615

(二)^ Hadoop Users List

(三)^ Apache Tez

(四)^ Hadoop Is Falling  Why?. 201813

(五)^ Hadoop--調. 201813

[]


Nutch

HBase

Aster Data Systems


[]


Hadoop
()

Database Landscape Map  December 2012