Techhome/articles/tech/·2026-04-27T00:00:00Z

Recruit データ基盤刷新事例 — 数十サービスの統合

Recruit Data Platform Renewal — Consolidating Dozens of Services

JLPT

リクルートグループは、SUUMO、ホットペッパー、タウンワークたうんわーく、ゼクシィ、リクナビなど数十すうじゅうのサービスを展開てんかいしています。それぞれが長年ながねんにわたって独自どくじのデータ基盤きばんを構築こうちくしてきた結果けっか、データの重複ちょうふくや整合性せいごうせいの問題もんだいが顕在化けんざいかしていました。本ほん記事きじでは、リクルートが数年すうねん掛けてかけて実施じっしした全社ぜんしゃデータ基盤きばん刷新さっしんの概要がいようを紹介しょうかいします。

従来じゅうらい基盤きばんの課題かだい

従来じゅうらいは各かくサービスがHadoop、Redshift、Snowflakeなどを個別こべつに採用さいようしており、同じおなじ「会員かいいんID」が異なることなるカラム名めいで管理かんりされているケースも多々たたありました。マーケティングまーけてぃんぐ部門ぶもんが複数ふくすうサービスを横断おうだんして分析ぶんせきする際さい、毎回まいかいデータの正規化せいきかに時間じかんを要するようすることが大きなおおきな課題かだいでした。

BigQueryへの一本化いっぽんか

リクルートは全社ぜんしゃの中央ちゅうおうデータ倉庫そうことしてGoogle BigQueryを採用さいようしました。選定せんてい理由りゆうには、ストレージとコンピュートが分離ぶんりされておりコスト管理かんりがしやすいこと、列れつ指向しこうストレージにより大規模だいきぼ集計しゅうけいが高速こうそくであること、そしてGoogle Cloudの他たサービスとの統合とうごうが容易よういであることが挙げられあげられます。

dbtによる変換へんかん層そう

データ変換へんかんにはdbt（data build tool）を全社ぜんしゃ標準ひょうじゅんとして採用さいようしています。dbtのモデルはGitで管理かんりされ、プルリクエスト経由けいゆで変更へんこうが行わおこなわれます。これにより、SQLが属人化ぞくじんかせず、誰だれがいつ何なにを変更へんこうしたかが追跡ついせきできる体制たいせいになりました。さらに、dbtの機能きのうを活用かつようしてテーブル間かんの依存いぞん関係かんけいを自動じどうで可視化かしかし、データ系譜けいふを全社ぜんしゃで共有きょうゆうしています。

データメッシュの原則げんそく

組織そしき規模きぼが大きくおおきくなると、中央ちゅうおうデータ基盤きばんチームちーむが全ぜんサービスのデータを管理かんりするのは困難こんなんになります。リクルートは各かくサービス領域りょういきに「データプロダクトオーナー」を配置はいちし、その領域りょういきのデータの品質ひんしつと公開こうかいに責任せきにんを持たもたせています。これがいわゆるデータメッシュの考え方かんがえかたです。中央ちゅうおう基盤きばんチームちーむは共通きょうつうインフラと標準ひょうじゅんを提供ていきょうし、各かく領域りょういきが自律的じりつてきに運営うんえいします。

個人こじん情報じょうほう保護法ほごほうへの対応たいおう

日本にほんの改正かいせい個人こじん情報じょうほう保護法ほごほうでは、利用りよう目的もくてきの特定とくていや第三者だいさんしゃ提供ていきょうの同意どうい取得しゅとくが厳格げんかくに求められもとめられます。リクルートは共通きょうつうの同意どうい管理かんり基盤きばんを構築こうちくし、ユーザーが許可きょかした範囲はんいの利用りようしか行えないおこなえないよう技術的ぎじゅつてきに制御せいぎょしています。BigQuery側がわでもrow-level securityとcolumn-level securityを活用かつようし、必要ひつよう最小さいしょう限げんのアクセス制御せいぎょを実現じつげんしています。

系譜けいふ追跡ついせきの重要性じゅうようせい

全社ぜんしゃで数万すうまんのテーブルが存在そんざいする環境かんきょうでは、「このダッシュボードの数値すうちは最終的さいしゅうてきにどの元もとデータから計算けいさんされているのか」を追跡ついせきすることが極めてきわめて重要じゅうようです。dbtの系譜けいふ情報じょうほうと、Dataplexなどメタデータ管理かんりサービスを組み合わせるくみあわせることで、影響えいきょう範囲はんい分析ぶんせきや障害しょうがい対応たいおうが迅速じんそくに行えおこなえます。

今後こんごの展望てんぼう

リクルートは今後こんご、生成AIを活用かつようした自然しぜん言語げんごでのデータ検索けんさく、データ品質ひんしつの自動じどう診断しんだん、そして国際こくさい展開てんかいを見据えたみすえたマルチリージョン対応たいおうに投資とうししていく方針ほうしんを掲げてかかげています。

Word	Reading	Meaning	Level
刷新	さっしん	renewal	N1
統合	とうごう	consolidation	N2
倉庫	そうこ	warehouse	N2
変換	へんかん	transformation	N2
系譜	けいふ	lineage	N1
分権	ぶんけん	decentralization	N1
個人情報	こじんじょうほう	personal information	N2
保護	ほご	protection	N2
遵守	じゅんしゅ	compliance	N1
規模	きぼ	scale	N2
重複	ちょうふく	duplication	N2
領域	りょういき	domain	N2