もうすぐなんです、、、!
気づいたらもうすぐDATA+AI SUMMIT 2025 (DAISって言ったりします)が開催されるんです!
今年も熱いセッションがたくさん予定されているようで、公式サイトを見ていたらワクワクが止まらんのですよ
てなわけで純粋に「おっ!これ面白そう!」と思ったセッションをピックアップしていきたいと思います。
DATA+AI SUMMITってめちゃくちゃセッション数多いんですよね。全部見るのは物理的に無理なので、自分が気になったものだけをチョイスしていきます。「いやいや、こっちのセッションも面白そうですよ!?」というツッコミ大歓迎ですので、コメントとかXとかで教えてください!
それでは早速、私が勝手に選んだ面白そーセッションを紹介していきましょう!(多分偏ってますw)
まずはこれ!日本の会社系のセッション!
A Japanese Mega-Bank’s Journey to a Modern, GenAI-Powered, Governed Data Platform
SMBCさんがAzure/Databricks上でGenAI活用の近代的クラウドデータ基盤を構築中!20以上の基幹システムをマルチテナントDatabricksアーキテクチャに移行してレガシープラットフォームを廃止して、Delta-shareでグローバルなデータ共有ニーズに対応、Unity Catalogによるデータガバナンス強化みたいな感じで面白そう!
Scaling Demand Forecasting at Nikon: Automating Camera Accessories Sales Planning with Databricks
Nikonさんはプロカメラマンのニーズを満たすアクセサリーの供給予測をしています。色々な課題親製品への依存性、まばらな需要パターン、そして世界中の子会社での何千もの商品管理などがありました!そこでDatabricksを活用し、MLや時系列モデルを最適なものを選択し、異常検知、まばらな需要に対応するアクセサリー販売計画の自動化ソリューションを構築した、という話のようです!
Maximizing Business Value and Ensuring Data Privacy with Databricks in Connected Vehicles
トヨタさん!コネクテッドビークルのデータプラットフォームにDatabricksを統合し、ガバナンスとビジネス成果の両方を向上させる方法を紹介するとのこと、EMRからDatabricksへの移行でDelta Lakeを活用し、削除パフォーマンス向上とコスト99%(!)削減を実現した事例です!このプラットフォームはコンプライアンスとビジネス価値のバランスを取りながら、安全で効率的なモビリティエコシステム構築のグローバルスタンダードを目指す!期待上げ!
最近は色々ありますよねぇ、、、Open Table Format系セッション!
Delta Lakeもそうですし、Icebergもよく聞くようになりました。今回のDAISではOpen Table Format(OTF)のセッションもいっぱいあります!
The Future of Open Table Formats
元TabularのRyanさんも話すセッションです!
“オープンテーブルフォーマットは急速に進化しています。このセッションでは、Delta LakeとApache Iceberg™の最新機能について探っていきます。オープンテーブルフォーマットにおけるイノベーションを推進している要因について学ぶために、ぜひご参加ください。”
ということで、期待するしか無いっしょ!
Breaking the Ice(berg): Riskified’s Journey to its Next-Generation Lakehouse
Riskfiedさんのセッション!既存のSLAを維持しながらコストを25%削減し、DatabricksのApache IcebergサポートとUnity Catalogを活用して、データの重複なしでクロスプラットフォームクエリを実現する次世代レイクハウスを構築したそうで、データ移行からパフォーマンス最適化まで技術的課題の克服、その結果、ユーザーは単にユースケースに最適なクエリエンジンを選ぶだけでよくなった、、、まさにOTFワクワクやん!
Iceberg Table Format Adoption and Unified Metadata Catalog Implementation in Lakehouse Platform
あのごはんお届け!なDoorDashさんの話です!データ組織はレイクハウスパラダイムを積極的に採用していて、この発表では従来のデータウェアハウスとデータレイクプラットフォームを統合されたレイクハウスソリューションに移行するための手法の解説とのこと。過剰なデータ移動の排除、Snowflake、Databricks、EMR、Trinoを含むクエリエンジン層のシームレスな統合、クエリパフォーマンスの最適化、基盤となるストレージ層とテーブルフォーマットの複雑さの抽象化、そして様々な計算プラットフォーム間で使用される統一メタデータカタログに関する戦略など、DoorDashさんの規模のデータアーキテクチャ話が聞けるのは中々ないのでピックアップ!
Lessons Learned: Building a Scalable Game Analytics Platform at Netflix
Netflixさんといえば、、、Icebergを作った会社ですよね!過去3年間でTV、モバイル、Webプラットフォーム向けに100以上のゲームを提供しているNetflixさんが、プレイヤーの行動の洞察、ゲームパフォーマンスの最適化、会員エンゲージメント向上のため、堅牢なゲーム分析プラットフォームの構築を行った話です!はいもう書かない!はい面白い!(勢い)
Databricks系のセッション
弊社の人が話すセッションも面白そうなのがあったのでピックアップします!
Introduction to Modern Open Table Formats and Catalogs
DeltaやIcebergのようなOTFがなぜ重要で、カタログとどのように連携するかを学べるセッション!OTFが生まれた背景、仕組み、データとAIプラットフォームにもたらすメリットについて解説、そしてこれらのフォーマットがますます相互運用可能や、Databricksの将来のビジョンについても紹介、とのことでOTFについて知りたい人はチェケラ!(古すぎる)
The Upcoming Apache Spark 4.1: The Next Chapter in Unified Analytics
Spark 4.1についての新機能紹介!大規模クラスタ展開とローカルラップトップ開発の両方で優れた性能を発揮するよう再設計されているよ、とか小さなデータセット向けの単一ノード最適化、シンプルなインストール・明確なエラーメッセージ・Pythonic APIへの大規模な「Python化」、データソースの柔軟性向上(Python Data Source API含む)とUDFエコシステムの充実、リアルタイムユースケースのサポート強化、組み込みデータ品質チェック、そしてローカルワークフローと完全分散実行をつなぐSpark Connectエコシステムの拡大など、、、徐々にDatabricksもSpark4系への対応を進めていきますがその未来が少し見えるセッションじゃないかと!
AI系
AI系のセッションも勿論あります!
Accelerate End-to-End Multi-Agents on Databricks and DSPy
プロダクション対応のGenAIアプリケーションにはエンドツーエンドワークフローを作成する統一プラットフォームが必要です、DatabricksはこれをDLTとジョブによるETL、Unity Catalogによるガバナンス、ノートブックによるコード開発、MLflowとUnity Catalogによるエージェントバージョン管理とメトリック追跡、Mosaic AIエージェントフレームワークとDSPyによる評価と最適化、モデルサービングとAIゲートウェイによる監視機能付きホスティングインフラ、そしてDatabricks Appsによるフロントエンドと色々な部品が揃っています!このセッションではそれらについて語っていくのかなーと思ってます!エージェント作ろ!
Optimize Cost and User Value Through Model Routing AI Agent
Metaさんのセッション!各LLMには固有の強みと弱み、万能のソリューションはなく、レイテンシ、マルチモダリティ、APIコスト、ユーザーニーズ、プロンプトの複雑さなどで、コスト削減とユースケースの価値最大化のバランスを取る、モデルルーティングはパフォーマンスとコストの最適化、スケーラビリティの向上、ユーザー満足度の向上に使えるもので、その具体的な手法について説明していくセッション(だと思います!w)
Real-Time Botnet Defense at CVS: AI-Driven Detection and Mitigation on Databricks
CVSさん、薬局さんですよね。ボットネットによる攻撃に対応するためにDatabricksプラットフォーム上にAI/ML機能を活用したボット攻撃をほぼリアルタイムで検出・軽減するシステムを紹介!絶対おもしろいやつやん、リアルタイム好きやし、見るやん。
その他
その他気になったセッション!
Breaking Silos: Enabling Databricks-Snowflake Interoperability With Iceberg and Unity Catalog
この前Cross Data Platforms Meetupなんてイベントも有りました(面白かったです!)が、Snowflakeさんなどの他プロダクトと併用する方もやはりいらっしゃいます、このセッションは、Unity CatalogとIceberg REST APIを通じてSnowflakeとのシームレスな統合の実現、Databricksをクロスプラットフォーム相互運用性の中心ハブにした構成についての紹介、とのことなので今の構成をどうしていこうか、、、なんて悩まれている方にいいのかも!?
State Street Uses Databricks as a Cybersecurity Lakehouse for Threat Intelligence & Real-Time Alerts
サイバーセキュリティのState Streetさんは、脅威検知のため、新たな脅威に対抗するため膨大なデータ管理に課題がありました。構造化・非構造化データの効率的管理、50ペタバイトのデータをリアルタイムで分析するスケーラビリティ、重要セキュリティデータストリームの取り込みと解析、高度なサイバーセキュリティデータプロダクトの構築などを実現した話が聞けると思います!リアルタイム好き!
ということで
と、単純に自分が見てみたいセッションを並べてみましたw
他にもいっぱいセッションがあって、多分バーチャルでも見られるようになると思います!おそらく君の見たいセッションもどこかにある!
それ以外でもKeynoteでも面白い話がいっぱい聞けると思うので、是非DATA+AI SUMMIT登録お願いします!





2025年の総括、そしてDATAとAIを追いかけ続けた年の記録(のはず) – 256bitのミステリ世界 への返信 コメントをキャンセル