今から学ぶ「Googleが推進するFLoC」とは何か

f:id:sotakaki_sn:20210623154854p:plain

Webブラウザーにおける「サードパーティーCookie」が終焉を迎えつつある。その代わりにGoogleが導入を進めているのが「FLoC（Federated Learning of Cohorts）」である。現在はまだ開発途上であるが、今年の3月からテストが始まっている。サードパーティCookieの代わりにFLoCが導入されるとどうなるのか？ FLoCを批判する人々はなにを問題と考えているのか？その点を改めて考えてみたい。

サードパーティCookieからFLoCへ

FLoCとはなにか、を解説するには、前提条件として「サードパーティーCookieとなにか」を理解しておいた方が良い。

CookieはWebブラウザが「アクセス時に生成する一時的なデータ」のこと。もともとは、Webサイトの設定やID・パスワードの一時的な保存などのために生まれた。しかしすぐに「サイトを訪れたことがわかる」という要素を活かし、広告に活用する手法が生まれる。さらには、あるサイトで記録されたクッキー自体を集積してそのサイト以外、特にユーザーをターゲティングしたネット広告に使うようになった。

これが「サードパーティーCookie」だ。

サードパーティーCookieを使うと、データの設定方法と解析方法を工夫すれば、ほぼ確実な精度で個人を特定することが可能だ。また、データが収集されたあとは、個人側でその利用方法をコントロールするのが難しい。結果的に、ユーザーがWebを活用する中で「自分の行動履歴が使われ続け、プライバシー侵害が起きやすい」状況を生み出す元になっていた。

アップルやGoogle、FirefoxなどがサードパーティーCookieの利用を基本的に止める方向に向かったのは。プライバシー侵害によって人々の「ネット自体を使う量が減る」ことを危惧してのものだ。サードパーティーCookieはネット広告、特にサイトへの再訪を促す「リターゲティング広告」の有用性は高い。

プライバシー保護は重要だが、広告ビジネスの巨大さから、プライバシー保護とビジネスの両立が可能な手法を求める声も多い。その1つが、Googleの提唱する「FLoC」である。

GoogleやFacebookが期待する「連合学習」とはなにか

FLoCとは「Federated Learning of Cohorts」の略。日本語訳すれば「共通する因子をもった集団（コホート）の連合学習」といったところだろうか。正直これではさっぱりわからない。

連合学習とは「データを集約せずに、分散させたまま学習させること」を指す。この「データを集約せずに」という部分はプライバシー保護を意味している。

機械学習におけるプライバシー上の課題は「学習のためのデータを1つの場所に集める」ことにある。データが持ち主である個人のもとを離れるということは、プライバシー保護上望ましくない。また、全員がデータ収集を許諾するとは考えづらく、そもそも「データを集める」のが難しい部分もある。

そこで登場するのが「連合学習」だ。

データは個人の機器からコピーされず、機器の中で学習処理が行われ、その結果だけが収集される。学習結果はあくまで「結果」であり、生のデータとは違い、個人の特定が難しい。結果を集積してさらに新しい学習モデルを配ることで、データを集積した場合に近い学習結果を得ることができる……というのが、連合学習の基本的な考え方である。

連合学習自体はそこまで新しい発想ではない。有用性も検証済みで、多くの企業が期待している技術だ。

例えば、Androidの文字入力システムである「Googleキーボード」での入力予測の学習には連合学習が使われている。「スマホ上での文字入力履歴」は非常にプライベートな情報であり、そのままネットに収集するわけには行かない。そこで自分のスマホ内で学習作業を行い、その結果だけがアップされるようになっている。また前述の通り、Googleは自社のWebブラウザ「Chrome」で、サードパーティーCookieの代わりに連合学習をベースにしたFLoCを使おうと計画している。

Facebookのマイク・シュレーファーCTOも「プライベートな情報が自宅や機器の中から出ないようにしていくことには、極めて大きな可能性がある。センシティブなデータを使わずに、モデルのパラメータだけを持ち寄って精度を高める『フェデレーション・ラーニング』には大きな価値がある｣と、筆者との取材の中で語っている。

端末の中で閲覧履歴を学習、IDで「嗜好」をグループ化

では、具体的にFLoCはどう働くのか？仕組みはこうだ。

サードパーティーCookieでは、ユーザーの行動の手がかりとなる情報がそのままネットに収集されていた。だがFLoCでは、PCやスマホなど「個人の機器にあるWebブラウザの中」で、過去1週間の閲覧履歴から、ブラウジングの行動を分析する。結果として、そこからはユーザーの嗜好を表す「FLoC ID」が生成される。これによって、ユーザーは「個人」でなく「嗜好」でグループ化される事になる。嗜好でトラッキングするのだから個人を特定しているわけではない、という論旨だ。FLoC IDはハッシュ計算のアルゴリズムを使って生成されており、FLoC IDから元の個人のデータを割り出すことは不可能に近い。

確かにこの仕組みを使えば、個人情報を集めることなく「個人の属性情報」を集め、属性によってターゲティングすることが可能となる。精度はこれまでよりも下がるが、リターゲティング広告にも使える。

FLoCは本当に「プライバシーの味方」なのか

ただし、FLoCが「本当にプライバシー上問題ないのか」「他にも問題を抱えていないのか」という点については、かなりの議論が巻き起こっている。

確かに「属性」でのターゲティングは個人を特定するものではないが、ブラウザーや機器を特定する技術など、他のトラッキング手法と組み合わせると、結局は個人を特定できてしまう。FLoCは「ユーザーのプライバシーとトラッキングを両立する方法」とは言えず、結局はトラッキングの1手法に過ぎないのではないか……という批判だ。

また、Googleという「ネット広告の巨人」が分析手法を作り、導入を主導するということは、ネット全体におけるGoogleの支配力を強める結果になるのでは……との声もある。

FLoCはオープンな技術だが、Chrome以外のWebブラウザでは、現状、積極的にFLoCをサポートするという話は聞こえてこない。

批判にこたえ、Googleはこの後の開発により、FLoCの方向性がさらに変える可能性もある。だがどちらにしろ、Chromeというシェアの大きなWebブラウザに搭載されれば、その影響力は大きなものになる。

実際にこの技術をどう使うのか？どうユーザーから支持を得るのか？そうした部分の検証と議論は、まだ始まったばかりだ。

著者紹介

西田宗千佳（にしだ・むねちか）

f:id:sotakaki_sn:20200820162715j:plain

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など｢電気かデータが流れるもの全般｣。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、年数冊のペースで書籍も執筆。テレビ番組の監修なども手がける。主な著書に｢ポケモンGOは終わらない｣（朝日新聞出版）、｢ソニー復興の劇薬｣（KADOKAWA）、｢ネットフリックスの時代｣(講談社現代新書)、｢iPad VS. キンドル日本を巻き込む電子書籍戦争の舞台裏｣（エンターブレイン）がある。

本記事は筆者と編集部の独自の取材に基づく内容です。スマートニュースの公式見解ではありません。