タグ

Hiveに関するt_otodaのブックマーク (5)

  • 金融機関でのHive/Presto事例紹介

    Hadoop/Spark Conference Japan 2016でのライトニングトークの資料 by Ryosuke Iwanaga (@riywo) Read less

    金融機関でのHive/Presto事例紹介
  • バッチ処理、ジョブ管理について書いてみる - wyukawa's diary

    僕はHive, Pythonでバッチ処理を書いてAzkabanでジョブ管理するシステムを構築、運用した経験が2年ほどあるので今日はバッチ処理、ジョブ管理について書いてみようと思います。 僕の経験上Hadoop特有の部分、例えばテスト環境が作りづらいとかバッチサーバーはジョブをsubmitするだけなので負荷はそんなにかからないとか、はあるけれど割と汎用的なのではないかと思います。そもそもバッチ処理、ジョブ管理について書かれたものはほとんど見た事がないので参考になれば嬉しいし、こういう良い方法もあるよ!とかあれば是非ブログ等に書いてほしいと思っております。 最初に言っておくとバッチ処理、ジョブ管理において重要なのは障害時のリカバリのしやすさです。正常時はまあいいでしょ。 なので例えば引数に日付を持てないようなバッチ書いたら辛いですし、LL言語で書く方がコンパイル、パッケージングとか楽です。CP

    バッチ処理、ジョブ管理について書いてみる - wyukawa's diary
  • Cloudera Impalaをサービスに組み込むときに苦労した話

    HBase×Impalaで作るアドテク�「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer

    Cloudera Impalaをサービスに組み込むときに苦労した話
  • Treasure Dataでの大容量データベンチマーク - Qiita


     Treasure Data使 Treasure Data hadoopTreasure Datahadoophive
    Treasure Dataでの大容量データベンチマーク - Qiita
  • Hiveクエリチューニングメモ - 科学と非科学の迷宮


    Hadoop2Deals of the day    Hive  Hadoop Hive   Hive  JOIN  MR  JOIN  1JOIN = 1 MR  JOIN 使
    Hiveクエリチューニングメモ - 科学と非科学の迷宮
  • 1