今回は頑張れなかった!すいません!でもブログは書くぜ!

というわけで技術書典18で「MLflowとデータブリックスで はじめる ML/LLMシステム構築 [実践]入門」という本が出ます!

今回も多分実質無料レベル!

252ページという脅威のボリューム!!!みんなの血と汗と休日の溶けた傑作になっております!

前回の本は、はじめてDatabricksに触る人向けの本になっていました!一部に機械学習の話もありましたが、今回の本は決定版!

Databricksで、AI/MLを始めるためにはどうするか!

これです!AI/MLってよくわからないよ、、、という人に最初から学べるコンテンツもあればより深く触っていくぞ!ということもできる、かなり多岐にわたったコンテンツになっております!

データ分析は、、、わかった!でもAI/ML、LLMはわからん!という人に向けて、今この本を送ります!(僕は何も書いてません、すいません、何目線なの?)

ということでこの本

皆様に読んでいただくべく紹介記事を書かせていただきます!

各章のご紹介!

それではそんなみんなで頑張った本の各章のご紹介をさせていただきます!

第1章:MLflow の機能紹介

まずは最初が要の第1章!(毎回いっているシリーズ)

MLflowとはMLや、LLMの実験管理(どういう結果がでたかなどの管理)や、モデル管理などAI/MLのライフサイクル管理を行うための大事なソフトウェアです!

この章ではMLflowの機能の一つであるLLM(ここではOpenAI)の記録とトレースについて紹介しています!

LLMが正しく動いているか確認するのは大事!

第2章:OSS MLflow の 環境構築 & 第3章:Managed MLflow の環境構築

DatabricksといえばOSS!OSSといえばDatabricks!(それはいいすぎ)

で、もちろんMLflowもOSSです。

でもDatabricksではマネージドでMLflowを提供してます。

この2、3章ではMLflowの環境構築方法についてまとめております!

千里の道も一歩から!

第4章:Databricks Mosaic AI Model Serving 実践ガイド~多様な⽇本語 LLM と埋め込みモデルをサービングする~

Model を Serving するのがModel Servingです!(わかりやすい)

多種多様なモデルをDatabricks上でホストすることができるのがModel Servingという機能になっています。勿論標準で使えるものもあれば自分たちで作ってホストすることも可能ですし、外部のOpenAIなどのモデルをExternalモデルとしてホストすることもできます。

この章では各種LLMをModel Servingで提供できるようにするためにはどうするか、を紹介しています!

第5章:Databricks 環境での Claude 3.7 Sonnet 実践ガイド

知ってましたか、、、Databricks上でSonnet3.7(今ではSonnet 4もです)が使えることを、、、

この章ではSonnet3.7の概要紹介と、Databricks上のどこで使用できるかを紹介しています!

AnthropicさんとDatabricksは仲良し!(きっと)

第6章:LLM バッチ推論による名寄せパイプラインの構築

名寄せって言葉最近ちゃんと知りました(桑野です)

名寄せとは、複数のエンティティを⼀覧管理するための情報、⼩売業では POS データに記録される販売店舗や商品名などについて、表記揺れと正規化不⾜を解決していく作業です

この章は、LLMバッチ推論によって名寄せ作業をやっていこうぜ!っていう話になってます!

いやー、モデルをいちからかかなくていいなんて、いい時代になりましたね(おっさん

第7章:LLM による個⼈情報マスキングシステムの構築

データエンジニアリングと切っても切り離せないのがこれ、マスキングです。

これ見せちゃまずいよね、という個人情報データをマスキングする作業は皆様行うことが多いかと思いますが、これもLLMにやらせちゃいましょう!

SQLでちょちょいとLLMを使ったマスキングができちゃいます!

第8章:Databricks + MLflow で回す評価ドリブンの AI Agent 開発

AI Agent、最近よく聞くようになりましたよね、僕もお客様とお話していてもAI Agent作りたいよって話はよくきくようになりました!

ここでは、DatabricksとMLflowを使って、ただAI Agentを作るんじゃなく、ちゃんと正しいエージェントかの評価までしてプロダクションレベルのAI Agentを作るためにはどうしたらいいのか、まで踏み込んでいきます!

個人的にも勉強になりました!w

第9章:Databricks Genie と Claude で作るチャット Agent システム

Databricksには Genieという自然言語でデータにアクセスするためのサービス、〜例えば「2025年の営業データをまとめて」といえばそのデータをとってきてくれるような〜

を用意しております!

ここでは、ClaudeとGenieを組み合わせて、データの取得からそこから得られる示唆まで含めて確認できるようなチャットエージェントのシステム構築についてまとめております!

Genieは良いぞ?

第10章:DSPy で LLM Agent の作成‧最適化

DSPy(Declarative Self-improving Python)は、スタンフォード⼤学の NLP チームによって開発されたオープンソースの Python フレームワークで、⼤規模⾔語モデル(LLM)を活⽤したAI アプリケーションの構築と最適化を⽀援します。

はい、まるまるコピーですw

DSPyはプロンプトエンジニアリングではなく、宣言的なプログラミング手法を活用したエージェントフレームワークになっている事が特徴です。

そのDSPyを使用したAI Agentの作成方法についてまとめています!

読み方がよくわからないんだよね、、、でぃすぱい?

第11章:AutoML で挑む競艇予測モデル(基本編) & 第12章:AutoML で挑む競艇予測モデル(応用編)

11章、12章はw

つい草を生やしましたがw
DatabricksにはAutoMLがあり、簡単にMLモデルの作成を行うことが可能です。

この章では競艇の予測モデルとしてLightGBMを使用して、競艇の予測をするぞ!という章になってますw

あたったら奢ってくださいw

第13章:Databricks で作る! ブロードリスニングの⼿法を⽤いたお客様の声分析

コールセンタなどではお客様の声を聞くことが大事になりますが、それを集めてまとめるのはめっちゃ大変ですよね?

そのためにもLLMは重要な役割を果たします。

集めたお客様の声をLLMを使ってサマリーし、それを分析するという一連の流れを行うための手法をまとめています!

PDCAまわしてこ!

第14章:週末プロジェクト ⼦供部屋に眠る書物をおうち DX

かわいいプロジェクト!

お子さんの英語の絵本をDatabricksに格納、OCR、翻訳、お子さんでも読めるように漢字に読み仮名をつけるなどのチャレンジ!

お子さんと一緒にAI開発、2025年の親子ですね!

ぼくも読み仮名つけてほしいよ!()

第15章:Mosaic AI Model ServingとDatabricks Apps を活⽤した物体検出システムの構築

最後の章はレシートの検出アプリケーション!あれっすよ、、、経費精算めんどくさくないっすか、、、ということでレシート自動認識と経費精算システムへの送信をするためのアプリをチャッと作っちゃおう!

AI/MLは世界を良くするためにある!w

最後に

毎回本の装丁やら印刷所の手配までしてくれてる@kitksqさん

お疲れ様です!ありがとうございます!この本が出たのは@kitksqさんのおかげです!

みんなも崇めよう!:pray:

そんなこんなで

15章!!!!!おおくね!!!!!!w

DatabricksでAI/ML、LLMを使う際のヒントやエッセンスの詰まった本なので、データ分析は知ってるけど、AI/MLは難しいな、という人や、LLMやってみたいけどどこからやったらいいかわからない、って人に是非!この一冊!という感じです!

繰り返しになりますが、技術書典18で「MLflowとデータブリックスで はじめる ML/LLMシステム構築 [実践]入門」という本が出!

ご興味ありましたら是非読んでいってくださいね!!!

コメントを残す

Trending