がんばった!自分じゃないけど!がんばってた!みんながんばってた!
というわけで技術書典16で「はじめてのデータウェアハウス 〜データブリックスではじめるデータ基盤ガイド〜」という本が出ることになりました!
この本はDatabricksならPySparkというわけではなく、あえてデータウェアハウスとしてのDatabricksの簡単なはじめ方からチューニング、アプリケーション、ダッシュボード、データガバナンスなどなどなどなど、、、色々詰め込めるだけ詰め込んだ本になっております!(詰め込みすぎて198ページになったそうな、、、w)
ということでせっかくみんなが頑張ったこの本、
![](https://blog.akuwano.net/wp-content/uploads/2024/05/dwh-edited.png)
皆様に読んでいただきべく紹介記事を書かせていただきます!
第 1 章 Databricks SQL の概要
まずは最初が要の第1章!
Databricks SQLとはなにか!?そもそもDatabricksってなに?そしてDatabricks SQLをどう初めるのか?などを説明した章になっています。
そして書いたの自分ですwよんでください(純粋な願い)
第 2 章 Unity Catalog ではじめるデータマネジメント
次は2章、Databricksでとっても大事なサービス、データガバナンスを司るUnity Catalogの章です!
Unity Catalogではデータのメタデータ管理や、アクセス制御など様々なことができますが、それをわかりやすくまとめた章になっています。
DatabricksといえばUnity Catalog!覚えていってください!
第 3 章 データエンジニアリング
次はデータエンジニアリング、データをどう取り込むか、そしてデータ処理するかなど、データ操作についてをまとめています。この章もSQL、Delta Live Tablesなどを使ってワークフロージョブ、パイプライン、などのデータエンジニアリングをどう行うか、ということを重視しています!
メダリオンアーキテクチャ!(言いたいだけ
第 4 章 Lakeview によるデータ可視化と BI ダッシュボード
DatabricksではLakeviewという簡単にダッシュボードを作るためのツールを用意しています。
この章ではLakeviewを使ってどのようにダッシュボードを作っていくのかをAIアシスタントなども活用する例を説明しています!
簡単BI!Lakeview!
第 5 章 Databricks SQL と Raspberry Pi を使って IoT データダッシュボードを作る
やばない?
ラズパイを使ったIoTアプリケーションをDatabricks SQLを使って実現する、という章です。
データの受け側から、収集、処理してダッシュボードで見るところまで一通り体験することができます!
これだけで1章にするの豪華では?(真顔)
第 6 章 Databricks SQL の拡張機能
この章はDatabricks SQLのUDFや、AI Functionなどの拡張機能についてまとめています!
データエンジニアやデータサイエンティストの皆様がよ り効率的かつ高度なデータ処理を実現するための機能として活用頂ける章になっています!
UDFってなれると便利だよね!なれないと難しいけど!
第 7 章 Databricks SQL パフォーマンス‧チューニング Tips
めちゃくちゃパフォーマンスチューニングをできる章です(雑)
チューニングにはI/Oの改善や、実行プランの改善などいろんなステップがあります。この章ではどのように改善していけるのかどの様な手順で行うべきかを実際の手順も示しながらまとめている章になります!
このパフォチュー(死語)完全保存版なので期待してください!
第 8 章 Databricks SQL サーバーレスのネットワークセキュリティ
セキュリティは大事です(大事)
この章は、Databricks SQLサーバレスをセキュアに保つために、Databricks SQL サーバーレスとクラウドオブジェクトストレージ間のセキュアな ネットワーク接続を管理するための機能である「ネットワーク接続構成(NCC)」について、Azure Databricks を例に概要と設定手順を紹介しています!
セキュリティは大事です(二回目)
第 9 章 既存データウェアハウスから Databricks への実践的な移行方法と成功のための ヒント
最後の章は、どのようにDatabricksへデータを移行すべきかについて具体的なプラクティスをまとめた章になっています、今あるデータをより良く活用するためにDatabricksを使いたいけどどうしたらいいのか、、、という方は是非参考にしてみてください!
Databricks使ってみてください!(切実な願い)
付録 A データブリックスが作った新しい LLM「DBRX」って、一体どんなモデル?
終わりかと思ったら終わりじゃないよ!w
Databricksが作ったオープンLLM、「DBRX」についてまとめたコラムを付録としてついております!
LLMのアーキテクチャ概要話、めちゃくちゃおもしろいので是非楽しんでいってね!
最後に
この本の装丁やらみんなの本のデバッグやらとりまとめやらしてくれてる@kitksqさん毎回お疲れ様です!ありがとうございます!
そんなこんなで
繰り返しになりますが、技術書典16で「はじめてのデータウェアハウス 〜データブリックスではじめるデータ基盤ガイド〜」という本が出ることになりました!
ご興味ありましたら是非読んでいってくださいね!!!
コメントを残す