Techhome/articles/tech/·2026-04-27T00:00:00Z

Cookpadのレシピ検索 — 学習to-rank実装

Cookpad's Recipe Search — Learning-to-Rank Implementation

JLPT

クックパッドくっくぱっどは日本にほん最大級さいだいきゅうのレシピ投稿とうこうサービスとして、一日いちにちに数すう百万ひゃくまん件けんのレシピ検索けんさくを処理しょりしています。「今夜こんやの献立こんだて」を考えるかんがえる利用者りようしゃが最ももっとも満足まんぞくするレシピを上位じょういに並べるならべるためには、単純なたんじゅんなキーワード一致いっちだけでは不十分ふじゅうぶんです。本ほん記事きじではクックパッドくっくぱっどの検索けんさく順位付けじゅんいづけの全体ぜんたい像ぞうを整理せいりします。

特徴量とくちょうりょうの設計せっけい

順位付けじゅんいづけモデルに入力にゅうりょくされる特徴量とくちょうりょうは多た岐きにわたります。食材しょくざいの一致いっち度ど、レシピの人気にんき（つくれぽつくれぽ数すうや保存ほぞん数すう）、季節きせつとの相性あいしょう、利用者りようしゃの過去かこ閲覧えつらん履歴りれき、作者さくしゃの信頼しんらい度ど、投稿とうこうからの経過けいか時間じかんなど、数十すうじゅうから数百すうひゃくに及ぶおよぶ特徴量とくちょうりょうを組み合わせくみあわせます。

形態素けいたいそ解析かいせきと日本語にほんご特有とくゆうの難しさむずかしさ

日本語にほんごの検索けんさくクエリは英語えいごのように空白くうはくで単語たんごが区切られてくぎられていません。「豚肉ぶたにくキャベツ簡単かんたん」というクエリを処理しょりするためには、形態素けいたいそ解析かいせき器き（mecabめかぶやkuromojiくろもじ）で単語たんごに分解ぶんかいする必要ひつようがあります。クックパッドくっくぱっどは料理りょうりドメインどめいんに特化とっかした辞書じしょを整備せいびし、食材しょくざい名めいや料理りょうり用語ようごを正しくただしく切り出せるきりだせるようにしています。

表記ひょうき揺れゆれと同義語どうぎごの吸収きゅうしゅう

「人参にんじん」「ニンジン」「にんじん」、「豚ぶたバラ」「豚ぶたばら肉にく」など同じおなじ食材しょくざいでも表記ひょうきの揺れゆれが豊富ほうふにあります。索引さくいん時じにこれらを正規せいき化かし、クエリ側がわでも同義語どうぎご展開てんかいを行うおこなうことで、ユーザーがどのどの書き方かきかたをしても同じおなじレシピがヒットひっとするようになります。

学習がくしゅうto-rankモデル

特徴量とくちょうりょうを人手ひとでで重みおもみ付けつけするのではなく、利用者りようしゃのクリックやつくれぽつくれぽ投稿とうこうを正解せいかいデータとして学習がくしゅうするモデルが使われつかわれます。LambdaMARTやXGBoostといった勾配こうばいブースティングぶーすてぃんぐ木きモデルが代表的だいひょうてきで、各かく特徴量とくちょうりょうの重要じゅうよう度どを自動的じどうてきに学習がくしゅうします。「人気にんきが高ければたかければよい」という単純たんじゅんな線形せんけい関係かんけいではなく、食材しょくざい一致いっちとの組み合わせくみあわせで非ひ線形せんけいに評価ひょうかできる点てんが強みつよみです。

季節きせつと地域ちいき変動へんどう

日本にほんの食しょく文化ぶんかは季節きせつと強くつよく結びついてむすびついており、夏なつは冷ひややし中華ちゅうかや素麺そうめん、冬ふゆは鍋なべや煮込みにこみが人気にんきです。クックパッドくっくぱっどは食材しょくざいの旬しゅんや気温きおんと連動れんどうした特徴量とくちょうりょうを加えくわえ、同じおなじ「簡単かんたんレシピ」というクエリでも時期じきによって結果けっかが変わるかわるように設計せっけいしています。地域ちいき差さ（関西かんさいと関東かんとうの味付けあじつけなど）も考慮こうりょに入れいれます。

A/Bテスト基盤きばん

新しいあたらしいモデルや特徴量とくちょうりょうを本番ほんばんに投入とうにゅうする前まえに、必ずかならずA/Bテストで既存きそんモデルとの差さを計測けいそくします。評価ひょうか指標しひょうはクリックくりっく率りつだけでなく、「つくれぽつくれぽが投稿とうこうされたか」「保存ほぞんされたか」など料理りょうりが実際にじっさいに作られたつくられたことを示すしめす後段こうだんの行動こうどうを重視じゅうしします。クリックされても作られつくられなければ本当のほんとうの満足まんぞくとは言えないいえないからです。

個人化こじんかと嗜好しこう履歴りれき

同じおなじ「カレー」というクエリでも、肉にく食しょくの利用者りようしゃにはチキンカレー、野菜やさい中心ちゅうしんの利用者りようしゃにはベジタブルカレーが上位じょういに来るくるように、個人こじんの過去かこ行動こうどうを考慮こうりょした個人化こじんかが行われおこなわれます。ただしただし、強すぎるつよすぎる個人化こじんかは「いつもいつも同じおなじレシピしか出ないでない」フィルターバブルを生むうむため、一定いっていの割合わりあいで新しいあたらしいレシピを混ぜ込むまぜこむ工夫くふうが必要ひつようです。

低ていレイテンシでの応答おうとう

数すう百万ひゃくまんレシピから数十すうじゅうを即座そくざに返すかえすためには、二ふた段階だんかい検索けんさくが基本きほんです。第だい一いち段階だんかいは転置てんちインデックスで候補こうほを数百すうひゃくに絞りしぼり、第だい二に段階だんかいで重いおもい学習がくしゅうto-rankモデルを適用てきようして最終さいしゅうの順位付けじゅんいづけを行いおこないます。全件ぜんけんにモデルを掛けるかけると応答おうとう時間じかんが爆発ばくはつするため、現実的げんじつてきな計算けいさんコストで精度せいどを出すだす工夫くふうが施されてほどこされています。

おわりに

クックパッドくっくぱっどの検索けんさくは「食材しょくざいが一致いっちしている」「人気にんきが高いたかい」という基本きほんに加えくわえ、日本語にほんご特有とくゆうの表記ひょうき揺れゆれ、季節きせつ・地域ちいき変動へんどう、個人こじん嗜好しこうを組み合わせてくみあわせて「今夜こんや作りたいつくりたいレシピ」を届けるとどける仕組みしくみです。機械きかい学習がくしゅうと料理りょうりドメインどめいん知識ちしきの両方りょうほうが揃ってそろって初めてはじめて満足まんぞくする体験たいけんが実現じつげんします。

Word	Reading	Meaning	Level
検索	けんさく	search	N2
順位付け	じゅんいづけ	ranking	N1
食材	しょくざい	ingredients	N2
一致	いっち	match	N2
人気	にんき	popularity	N3
季節	きせつ	season	N3
履歴	りれき	history	N1
学習	がくしゅう	learning	N3
形態素	けいたいそ	morpheme	N1
解析	かいせき	analysis	N2
地域	ちいき	region	N2
変動	へんどう	variation	N1
旬	しゅん	peak season	N1
特徴量	とくちょうりょう	feature	N1
推薦	すいせん	recommendation	N1
嗜好	しこう	preference	N1
個人化	こじんか	personalization	N1
評価	ひょうか	evaluation	N2
指標	しひょう	metric	N1
検証	けんしょう	verification	N2
改善	かいぜん	improvement	N2
索引	さくいん	index	N2
揺れ	ゆれ	variation	N2
表記	ひょうき	notation	N2
同義語	どうぎご	synonym	N1