2020-09-01から1ヶ月間の記事一覧

Sparkでファイル形式や圧縮形式について実験した

大規模データを処理するために、Sparkを活用しています。先日、Twitter上での投稿に対して、もみじあめさんから、下記コメントをもらいました。検証したのがだいぶ前なので事情が変わってるかもしれませんが、以前に調べたときは圧縮率とスループットが基…