Skip to the content.

エンジニアのためのデータ分析基盤入門

本リポジトリは、技術評論社から出版された以下の書籍 のWeb補足情報を提供するためのものです。書籍に関する「正誤表」や関連情報をまとめています。

title : エンジニアのためのデータ分析基盤入門

Publisher : 技術評論社 (February 24, 2022)

Publication date : February 24, 2022

Language : Japanese

Tankobon Softcover : 272 pages

ISBN-10 : 4297127245

ISBN-13 : 978-4297127244

本書の構成

各章のハイライトです。

正誤表

正誤表へのリンクです。
正誤表

動作環境

本書を作成時に利用した筆者の動作の確認環境は以下です。

著者について

普段はデータを活用する企画業務に従事
ビッグデータのシステム構築から活用までアドバイザリーをやっています。

本書内で紹介している書籍など

ここではビッグデータ関連書籍として、書籍内で紹介している書籍やおすすめの書籍について紹介します。

その他補助になると考えられるもの

本書で頻繁に出てくるSpark(Pyspark)やKafka、メタデータストア、ストリーミングをコード中心に駆け回ってみる講座たちです。
コードはGithubに公開していますので更に理解を深めるためにご利用ください。

  1. 「データサイエンスのための前処理入門PythonとSparkで学ぶビッグデータエンジニアリング(PySpark) 速習講座」

Gitリポジトリ
https://github.com/yk-st/pyspark_batch

  1. 「【PythonとSparkで始めるデータマネジメント入門】 ビッグデータレイクのための統合メタデータ管理入門」

Gitリポジトリ
https://github.com/yk-st/pyspark_datamanagement_metadata

  1. 「【データサイエンスのためのストリーミング前処理入門 PythonとSparkで始めるビッグデータストリーミング処理入門」

Gitリポジトリ
https://github.com/yk-st/pyspark_streaming

  1. 「超速入門!【データサイエンスへの最初の一歩】PythonとSparkで学ぶデータ分析のための前処理と分散処理 一気見講座」

Gitリポジトリ
https://github.com/yk-st/pyspark_super_crush_course