原文: https://blog.cloudera.com/blog/2019/05/small-files-big-foils-addressing-the-associated-metadata-and-application-challenges/ 著者: Shashank Naik, Bhagya Gummalla 訳注: 本稿は2019/5/9に公開されたブログ記事の翻訳です。 「スモール・ファイル」はApache Hadoopの世界では一般的な課題であり、注意して扱わないと、いくつかの複雑な問題を引き起こす可能性があります。Apache Hadoop分散ファイルシステム(HDFS)は、テラバイトからペタバイトの範囲にわたる、大きなデータセットを格納して処理するために開発されました。しかしHDFSはスモール・ファイルを効率的に格納しないため、スモール・ファイルによってNameNo
![小さなファイルが大きな問題を引き起こす:Hadoopクラスターでのスモールファイルの予防と対処について - Cloudera株式会社 公式ブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/2f8f63a3bc087c02cc9756efb076fc01f898a4ae/height=288;version=1;width=512/https%3A%2F%2Fblog.cloudera.jp%2Fwp-content%2Fuploads%2F2021%2F12%2Fimage-one.jpeg)