[B! facebook][db] ikeikeikeikeのブックマーク

ikeikeikeike id:ikeikeikeike

facebookとdbに関するikeikeikeikeのブックマーク (2)

Facebook, Twitter, Instagram等がどうやってIDを生成しているのかまとめ - Qiita
まえがきデータにIDを持たせたいとき、単純な方法としては、DBの提供するauto incrementを使う場合やUUIDを利用することがある。それぞれの方法の利点欠点は以下の通り。データベースのauto incrementを使う場合利点: 特別な実装が必要ない欠点: DBを1台で運用するとデータベースがパフォーマンス・障害のボトルネックになる DBを二台にするとIDのユニークさや順序の保証が困難 UUID(v4)※1を利用する場合利点: 分散環境で各々がIDを生成しても衝突しないIDを公開したくない場合に、推測されにくいIDを生成できる欠点: 128ビット必要、DBのインデクシングやプログラミング言語で扱うときに不利なことがあるIDから時間の情報が失われる、例えば2つのIDを比べてどちらが古い投稿か判断できない世界の大企業がどうしてるか調べてみると多くの企業がブログなど
ikeikeikeike 2014/08/19
id

programming

DB

auto

development

facebook

twitter
リンク
Facebook、分散SQLエンジン「Presto」公開。大規模データをMapReduce/Hiveの10倍効率よく処理すると
Facebookは、数ペタバイト級の大規模データに対しても、対話的にアドホックな問い合わせを可能にする分散SQLエンジン﹁Presto﹂を、オープンソースで公開しました。 PrestoはFacebook社内で大規模データの分析のために開発され、すでに同社社内使われているもの。 FacebookはPrestoを開発した背景として、大量のデータをHadoop/HDFSベースで保存したものの、バッチ指向のMapReduceではなく、リアルタイム性に優れた処理が必要になったためだと、次のように説明しています。 Facebook’s warehouse data is stored in a few large Hadoop/HDFS-based clusters. Hadoop MapReduce [2] and Hive are designed for large-scale, reliabl
ikeikeikeike 2013/11/08
Impalaはドコイッタネン比較して欲しいな

hive

facebook

hadoop

hdfs

sql

bigdata

db

database
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx