IT業界のすみっこ暮らし

ふと気がついたときの記録

spark-notebookを触ってみた

まだApache SparkもSpark Notebookも勉強中なので詳しくは分からない状態だけど、軽く触ってみたのでその内容のメモ。

Apache Spark

オープンソースクラスタコンピューティングフレームワーク

Apache Spark™ is a fast and general engine for large-scale data processing.
Apache Spark™は、大規模なデータ処理のための高速かつ一般的なエンジンです。 spark.apache.org

Spark Notebook

Sparkを実行できるWebUI

Interactive and Reactive Data Science using Scala and Spark.
Spark Notebook

Spark Notebookを触ってみた

まだあまり理解が追いついていないが、エンジニア仲間のcrowdyさんが作った環境を一緒に触る機会があったので簡単に触ってみた。 f:id:papamau:20170618142502p:plain

サンプルなどを実行
f:id:papamau:20170618144603p:plain

※「Spark runs on Java 7+, Python 2.6+/3.4+ and R 3.1+. For the Scala API, Spark 2.1.1 uses Scala 2.11. You will need to use a compatible Scala version (2.11.x).」らしい。 spark.apache.org

f:id:papamau:20170618151436p:plain

f:id:papamau:20170618152424p:plain

f:id:papamau:20170618153312p:plain

f:id:papamau:20170618154229p:plain

f:id:papamau:20170618161455p:plain


今回触ったのは全てランダムでデータを生成して地図とかグラフとか一覧で表示してるんだけど、色んな種類が用意されていて触るだけでも面白い。

f:id:papamau:20170618155120p:plain


感想

まだデータ分析の方は基盤がないので???!!???の状態だったけど、良い刺激になった。Jupyter Notebookも含めデータ分析についてこれから勉強していきたいと思う。