Apache Spark徹底入門

購入済み

シリーズ

全1冊

作品情報

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、MLflow、Delta Lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびDelta Lakeを使いこなすための解説を行います。本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習・Spark の操作とSQLエンジンの理解・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実行・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化・[日本語版オリジナルコンテンツ]pandas DataFrame、SparkDataFrameに関する各種データフレームの使い分け ・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践※本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

作品をシェアする

同じ作者の本

翔泳社のおすすめ本

スマホ・PC・ITのおすすめ本

チェックリストに追加しました
クリップボードにURLをコピーしました
カートに追加しました
お気に入りに登録しました
作者をフォローしました

ポイント詳細

  • 通常ポイント

    pt

    ご購入額に応じて、dポイントを還元いたします。還元するdポイント数はご購入代金100円(税抜)につき1ポイントです。

【dカードならさらにおトク!】

さらにdカードをご利用の場合、ご購入代金100円(税込)につき2ポイントを加算し還元いたします。

  • dポイントによるお支払いはポイント進呈の対象外となります。
  • 開催中のキャンペーンにより、還元されるdポイント数は変動いたします。
dカードのお申込みはこちら

お手数ですが、ログイン後に再度登録をお試しください