Softwarehome/articles/software/·2026-04-26T00:00:00Z·Sansan Builders Box ↗

Sansan Data Intelligenceリリースに寄せて

On the Release of Sansan Data Intelligence

JLPT

Sansan Data IntelligenceのProduct Owner（PO）を務めてつとめています猿田さるた貴之たかゆきと申しもうします。本日ほんじつ12月がつ12日にち、私わたしたちは約やく4年ねんぶりとなる新規しんきプロダクトSansan Data Intelligenceをリリースいたしました。これは、Sansanが名刺めいし管理かんりサービスから、企業きぎょうの意思いし決定けっていを支えるささえるビジネスインフラへと進化しんかするための挑戦ちょうせんの一つひとつになります。

背景はいけい：名寄せなよせ技術ぎじゅつの蓄積ちくせき

今回こんかいのリリースは構想こうそうから約やく半年はんとしという短期間たんきかんで実現じつげんしましたが、その背景はいけいには10年ねん以上いじょうにわたる名寄せなよせ技術ぎじゅつの蓄積ちくせきと、既存きそんのデータベースアーキテクチャをリビルドするSOC v2の開発かいはつがありました。名寄せなよせとは、複数ふくすうのデータベースに登録とうろくされている顧客こきゃく情報じょうほうから、重複ちょうふくする部分ぶぶんを洗い出しあらいだし、一つひとつに統合とうごうする作業さぎょうを意味いみします。

なぜ今いま、Sansan Data Intelligenceなのか？

現在げんざい、多くおおくの企業きぎょうが「2025年ねんの崖がけ」対策たいさくや生成せいせいAI活用かつように向けたむけたデータ基盤きばん構築こうちくを進めてすすめています。しかし、企業きぎょうの約やく8割わりが「取引先とりひきさきデータに重複ちょうふく・表記ひょうき揺れゆれ・更新こうしん漏れもれなどの経験けいけんがある」と回答かいとうしており、AI活用かつように取り組むとりくむ企業きぎょうの約やく9割わりが「期待きたい通りどおりの精度せいどが出ないでない」と嘆いてなげいています。いわゆる「Garbage In, Garbage Out」の状況じょうきょうです。

現場げんばで起きておきている負ふのループ

入力にゅうりょくの属人化ぞくじんか：現場げんばの営業えいぎょう担当者たんとうしゃが手て入力にゅうりょくするため、社名しゃめいが「（株かぶ）」だったり「株式かぶしき会社かいしゃ」だったりバラバラになる。更新こうしんの放置ほうち：移転いてんや合併がっぺいがあっても、古いふるい情報じょうほうがそのまま残るのこる。結果けっか、請求書せいきゅうしょが届かないとどかない、与信よしん管理かんりが漏れるもれるといった実害じつがいが出るでる。

Data Hubとの関係性かんけいせい

Data Hubでも高こう精度せいどな名寄せなよせは可能かのうですが、「A社しゃとB社しゃが合併がっぺいしてC社しゃになった」「D社しゃはEグループの傘下さんかに入ったはいった」といった複雑ふくざつな企業間きぎょうかんの関係性かんけいせいを表現ひょうげんして、管理かんりすることには限界げんかいがありました。つまり、Data Hubで培ったつちかった名寄せなよせ技術ぎじゅつという資産しさんを継承けいしょうしつつ、それを企業きぎょう全体ぜんたいのデータガバナンス基盤きばんへと昇華しょうかさせたのがSansan Data Intelligenceです。

SOC v2の実現じつげん

この高度こうどなデータマネジメントを実現じつげんしている裏側うらがわには、SOC v2 (Sansan Organization Code version 2)というコードがあります。従来じゅうらいのSOCシステムではRDBのテーブル構造こうぞうを採用さいようしていましたが、時系列じけいれつ方向ほうこうに遡れないさかのぼれない、合併がっぺいで新しん会社かいしゃができるとIDが変わりかわり、過去かこのIDとの連続性れんぞくせいが断絶だんぜつしてしまうという技術的ぎじゅつてき課題かだいに直面ちょくめんしていました。

時系列じけいれつグラフモデル

これらを解決かいけつするために、SOC v2は時系列じけいれつグラフモデルを採用さいようしました。最大さいだいの特徴とくちょうは、すべてのEdgeが有効ゆうこう期間きかんを持ってもっていることです。移転いてんや合併がっぺいなどの変更へんこうは、レコードの上書きうわがきではなく、新しいあたらしいEdgeを追加ついかする更新こうしんで表現ひょうげんされます。これによって、過去かこのいかなる時点じてんの状態じょうたいも破壊はかいすることなく保持ほじし続けるつづけることができます。

おわりに

Sansan Data IntelligenceとSOC v2は、単なるたんなるマスターデータ管理かんりシステムではありません。それは、「いつ、誰だれが、どのような状態じょうたいで存在そんざいしたか」を証明しょうめいするデータ・ガバナンスのインフラです。Data Hubで培ったつちかった技術ぎじゅつを礎いしずえに、この新規しんきプロダクトを得てえて、Sansanは世界せかいのビジネス構造こうぞうそのものを記述きじゅつするプラットフォームへと進化しんかします。

Word	Reading	Meaning	Level
新規	しんき	new, fresh	N2
意思決定	いしけってい	decision-making	N1
進化	しんか	evolution	N2
挑戦	ちょうせん	challenge	N2
構想	こうそう	concept, plan	N1
短期間	たんきかん	short period	N2
実現	じつげん	realization, achievement	N2
蓄積	ちくせき	accumulation	N1
名寄せ	なよせ	record matching, deduplication	N1
既存	きそん	existing, established	N2
重複	ちょうふく	duplication, overlap	N2
統合	とうごう	integration, consolidation	N2
顧客	こきゃく	customer, client	N2
基盤	きばん	foundation, infrastructure	N2
構築	こうちく	construction, building	N2
表記	ひょうき	notation, written form	N2
更新	こうしん	update, renewal	N2
精度	せいど	accuracy, precision	N2
属人化	ぞくじんか	person-dependent process	N1
営業	えいぎょう	sales, business	N2
放置	ほうち	neglect, leaving as-is	N2
合併	がっぺい	merger	N2
請求書	せいきゅうしょ	invoice	N2
与信	よしん	credit assessment	N1
実害	じつがい	actual harm, real damage	N1
傘下	さんか	under the umbrella of	N1
継承	けいしょう	inheritance, succession	N1
昇華	しょうか	sublimation, elevation	N1
高度	こうど	advanced, sophisticated	N2
従来	じゅうらい	conventional, traditional	N2
構造	こうぞう	structure	N2
採用	さいよう	adoption, employment	N2
時系列	じけいれつ	time-series, chronological	N1
連続性	れんぞくせい	continuity	N2
断絶	だんぜつ	severance, discontinuity	N1
直面	ちょくめん	confrontation, facing	N2
有効	ゆうこう	valid, effective	N2
破壊	はかい	destruction	N2
保持	ほじ	retention, maintaining	N2
証明	しょうめい	proof, verification	N2
礎	いしずえ	cornerstone, foundation	N1
記述	きじゅつ	description, notation	N2