social-networks

ニコラス・クリスタキス いかに社会的ネットワークが流行を予想するか

人はどのようにそしてなぜ社会的ネットワークを形成するでしょうか」ニコラスは語りかける。ここでは、48万ビューを超える Nicholas Christakis のTED講演を訳し、社会的ネットワークが流行を予想できるという研究について紹介する。

要約

人々の複雑な社会的ネットワークを可視化したニコラス・クリスタキスとジェームス・フォウラーは、この情報をもとにして生活の改善をする方法の研究に着手しました。ここではクリスタキスが、革新的なアイデアやリスクのある行動、新型インフルエンザのようなウイルス等の流行は、社会的ネットワークを利用することによって従来より早期に感知できるという最新の研究結果を紹介します。

Nicholas Christakis explores how the large-scale, face-to-face social networks in which we are embedded affect our lives, and what we can do to take advantage of this fact.

 

1 人はどのようにそしてなぜ社会的ネットワークを形成するのか

私はこの10年間 人はどのようにそしてなぜ 社会的ネットワークを 形成するのか解明しようと努力してきました。ここで言う社会的ネットワークとは 最近のインターネット上のものでなく どちらかというと アフリカのサバンナに出現して以来何十万年もの間 人類が築いてきた社会的つながりです。つまり私が友人関係や同僚関係 そして兄弟関係や親類関係を持ち その人達が似た関係を他の人達と持ち これが果てしなくずっと広がっていって このようなネットワークができます。それぞれの点は人で 間の線は二人が関係していることを表します。いろいろな人間関係です。このような広大な人間社会の構造ができ 私達は皆その一部となっています。

 

2 疫病の流行を予想する取り組み

私は同僚のジェームス フォウラーと かなり以前から どのような数学的 社会的、生物学的そして心理学的な法則が これらのネットワークの構築を左右するのか またどんな法則がどうネットワークを動かし 人々の生活に影響するのかについて研究してきました。そして最近は 解明するだけでなく その洞察を利用して実際に 世の中を改善する方法を見つけ もっと役立つことをして 何かを解決したりできないかと考えています。そこでまず取り組もうと思ったのが 疫病の流行を予想することでした。

 

3 「インフルトレンド」というグーグルのツール

疫病対策センターやその他の国家機関での 感染症流行の予測技術の現状は 現場の医師や研究所が報告する 特定の疾患の有病率や 発生率のデータを 機関の拠点から収集するというものです。患者の誰々さんが何かの病気だと診断された 他にも発症した患者がいた こうしたデータが情報センターにいくらか遅れて入るわけです。滞りなくすべて進めば 今日どこで疫病が流行っていたか 1~2週間後に分かるのです。実のところ 1年ほど前に 「インフルトレンド」という グーグルのツールが広まりました。人々の現在の検索パターンを見て インフルエンザの発生地域 現在の流行状況や 有病率が把握できるのです。

 

4 流行を早期に感知できるかもしれないひとつの方法

でも今日皆さんにお見せしたいのは 伝染病の発生を 迅速に警告するだけでなく 実際にその流行を 早期に感知できるかもしれない ひとつの方法です。事実 このアイデアは 細菌による感染症を予測するだけでなく 様々なタイプの流行の予想に応用できます。例えば社会的感染という形で広まるものは すべてこうして理解できます。図の左に示した愛国心や 利他主義や宗教のような抽象的な概念から 食生活や書籍購入 そして飲酒などの習慣 自転車ヘルメット着用などの安全習慣や 売れる商品 電子機器の購入などまで 人を通して広がるものすべてです。新しいアイデアの普及なども 今からご覧いただく方法によって 理解し予測することが可能です。

 

5 普及はネットワークを通して行なわれ、特定の構造がある

おそらく皆さんご存知だと思いますが 普及を表すには従来 イノベーション普及率という 採用曲線を使用します。Y軸は何%の人が影響されているか そしてX軸は時間を表します。最初の時点ではあまり多くの人が影響されておらず 典型的なS字型カーブの グラフになります。なぜこのような形になるのかと言うと 一番初めに1人か2人が 影響または感染されているとすると その2人が次の2人を感染させ 次に感染されるのは4人 そして8人 16人と増え 流行の増殖期のカーブを形成するからです。最終的には人口のほとんどが感染され まだ感染されていない人が どんどん少なくなり カーブは頭打ちとなります。そして典型的なS字型カーブとなるのです。これは病原菌やアイデア 製品普及や習慣のようなものでも 同じです。でも物事は人々の間でランダムに普及しません。普及はネットワークを通して行なわれます。私達は皆 ネットワークの中で生きているからです。そしてこれらのネットワークには特定の構造があります。

 

6 ネットワーク内の位置のすべてが平等というわけではない

こちらのネットワークを見てください。105人います。点は人を表し 線は友人関係を表します。人によってネットワーク内の位置が 違うことが分かると思います。また人間関係も多様です。友人関係 兄弟関係 夫婦関係 同僚関係 隣人関係などいろいろあります。そして関係によって 違うものが広がります。例えば性感染症は 性的つながりをもって広がります。喫煙習慣は 友人関係に影響されるかもしれません。利他的または慈善的行為だと 同僚に感化されてかもしれませんし 隣人の影響かもしれません。でもネットワーク内の位置のすべてが平等というわけではありません

 

7 つながりの数は人によって違う

これを見てもらえばすぐ分かりますが つながりの数は人によって違います。1つの人もいれば2つの人もいて 6つの人もいれば10個の人もいます。これはノードの度数とも言われ 節点の持つつながりの数です。しかしそれだけではありません。節点AとBを見てもらうと 両者とも6つのつながりを持っています。でもこの図を全体的に見ると 節点AとBには大きな違いがあると 気づくと思います。こう考えたら分かりやすいと思います。もし致死的な病原菌が ネットワーク内で広まっていたらAとBのどちらになりたいですか? (聴衆:B) クリスタキス:もちろんBですね。Bはネットワークの端に位置しています。では気になる噂話が ネットワーク内で流れていたらどちらになりたいですか? Aですね 一見して Aの方がいち早く 広まる噂を耳にする可能性が高いと分かります。これはネットワーク構造上の位置のおかげです。実際にAは中心寄りに位置しており これは数式で表すことができます。ですから ネットワークを通じて 広がっている何かを追跡したい場合 節点Aも含んだ ネットワークの中心部の人々に センサーをつけ その人々を観察することによって ネットワークを介して広がっている何かを 早期発見するのが理想です。

 

8 中心部の人々を観察できれば結果が予測できる

この人々が病気に感染したり情報を得たら 近いうちに 全員にこの病原菌または情報が 伝わるだろうと分かるのです。この方法は集団の構造を踏まえずに ランダムに選出した 6人を観察するよりずっと効果的です。実際 中心部の人々を観察できれば このような結果が見られる筈です。左の図には前に見たS字型の採用曲線があります。赤の点線は ランダムに選出された人々の間での普及です。左側の左にずれている線は ネットワーク中心部の人々の間での 普及を表します。Y軸は感染者の累積人数です。X軸は時間です。右にあるのは同じデータですが 1日ごとの発症件数です。ここにご覧いただけるのは たった数人の感染者からどんどん増えて ここで流行のピークとなることです。左にずれたグラフが中心部の人々の状態です。そしてこの2つの間の時間差が 兆しとなり この人々の間で流行が起こる 早期警告となるのです。

 

9 あなたの友人にはあなたより友人がいる

しかし問題は 社会的ネットワークを図にするのが いつも可能なわけでないことです。コストが高すぎたり実施が難しかったり 倫理的でなかったり ただ単にそんなことは不可能な場合もあります。では実際にネットワークを図にしないで どのように中心にいるのは誰かを 調べることができるのでしょうか? 我々が思いついたのは 社会的ネットワークについて前から 知られている現象を利用することでした。このような現象です。あなたの友人にはあなたより たくさん友人がいると知っていましたか? あなたの友人にはあなたより友人がいるのです 「友人関係のパラドックス」と言われています。社会的ネットワークの中でとても人気があり 友人が多いパーティのホストと 友人は1人だけの人間嫌いがいるとします。ここからランダムに選ばれた人はパーティのホストを 知っている確率の方が高いのです。彼らがパーティのホストを友人として挙げたら パーティのホストには大勢の友人がいるので 彼らよりも友人が多いということになります。基本的にこれが「友人関係のパラドックス」というものです。ランダムに選ばれた人達よりその友人達の方が より多くのつながりを持ち 中心寄りの位置にいるのです。

 

10 ランダムに選出された人が友人を挙げると、ネットワークの中心に近づく

ネットワークの端の方にいる人々に注目すると このことが自然に理解できると思います。この人を見ると 友人として挙げられるのはこの人しかいません。そして この人にはネットワークの構造上 最低2人 通常はそれ以上の友人がいることになります。端の節点のどれをとってもこの現象は見られ 実際ネットワークの中心に向かって全体的に見られます。誰を選出してもです。ランダムに選出された人が友人を挙げると ネットワークの中心に近づくわけです。そこで我々はこのアイデアを利用して ネットワーク内の現象を予測できるか研究しようと考えました。このアイデアをもとにすれば ネットワークの図がなくても 集団からランダムに誰かを選び 友人を挙げてもらって 中央寄りの人の選出ができるからです。

 

11 友人グループを追跡することで集団流行を16日前に警告できる

我々はハーバード大学での新型インフルエンザの発生で これを検証しました。つい2~3ヶ月前の2009年秋から冬でした。ランダムに選出した学部生1300人に 友人を挙げてもらい そのランダムの学生と友人の両方を 毎日 追跡調査して 流行のインフルエンザへの感染を調べました。大学内診療所の利用監視と 週に数回のメール報告での調査です。すると我々が予想した通りのことが起こりました 赤い線がランダムのグループです。友人グループの中での流行は左のこちらへ寄っています。2つのグループの違いは16日です。友人グループを追跡することによって この集団における感染流行を 16日前に警告できるわけです。

 

12 一定の集団の中で起こるインフルエンザの流行を1ヵ月半以上前に察知できる

またそれだけでなく アナリストが流行の研究や 新製品の普及の予測をしようするときに 集団からランダムに選んだサンプルと さらに挙げてもらった友人の 両方のグループを追跡することができます。例えばその友人グループで イノベーション普及に急上昇があれば 流行の兆しとなります。また左にあるように2つの線が 分岐し始めるのもサインです。友人グループの線が急上昇し ランダムサンプルのグループに差をつけて 開き始めたのはどの時点か? それはこの白い線が示す時点で 流行のピークの 46日前でした。つまりこの方法を使えば 一定の集団の中で起こる インフルエンザの流行を1ヵ月半以上前に察知できるのです。どのくらい前の時点で そのような兆しが見られるかは 様々な要素により異なると思います。病原体の特性によることもあり得ます。この方法で違う種類の病原体を 見た場合 異なる兆候が出ると思います。他の広がっている現象でもそうです。人のネットワークの構造が違うからということもあります。我々の実例では必要ではなかったのですが 実際に 学生のネットワークを図にすることが出来ました。

 

13 714人の学生と彼らの友人のつながりを示した図

これが714人の学生と 彼らの友人のつながりを示した図です。これからこの図の移り変わりを見せます。ネットワークの日々の変化を 120日分見てみましょう。赤い点がインフルエンザの感染を示します。そして黄色い点がインフルエンザ感染者の友人です。点の大きさはインフルエンザに感染している 友人の数に応じて大きくなります。つまり大きい点はインフルエンザに感染した友人が多い人です。この図を見てください。9月13日の状態です。いくつか色のついた点がみられます。インフルエンザが中心でポツポツ見られます。今10月19日の状態です。11月になると流行のカーブが立ち上がり パッパッと中心部で次々に感染が広がります。そしてだんだん頭打ちになっていきます。12月末に近づくにつれて感染がどんどん少なくなります。このような可視化によって こういった流行はまず 中央部の人間から感染して 他の人々に感染することが明らかになります。

 

14 感染も情報も常識も言動も人々の間で広がる

それで今まで申し上げてきたように この方法は細菌だけでなく 人々の間で伝染するもの何にでも使えます。情報は人々を通じて広がります。常識も人から人へと広がります。言動も人々の間で広がります。言動というのは犯罪行為や 選挙投票もあれば 健康管理行為で 喫煙や予防接種のようなこともあり 製品普及やその他の行動で 人間同士が影響し合うものもあります。言動によって回りの人間が影響される傾向があったら この方法により その集団における流行の発生や 兆しを早期に知り得ることができるわけです。この方法が成り立つポイントは 人間同士の影響があることです。一斉に実施され全員が 同じように影響されるような仕組みでは駄目です。

 

15 300人が挙げた友人達300人に予防接種を実施すると、集団免疫と同等の免疫ができる

さてこの同じ洞察を違うやり方で ネットワークに関連するものに対して 活用することもできます。介入目的のために特定の人々を 対象として選ぶのに利用するのが一例です。例えば皆さん集団免疫については たぶん知っていると思いますが 1000人のグループがいたとして このグループをある病原体から守りたい場合 全員に予防接種する必要はありません。このうち960人に免疫ができれば 1000人に予防接種したのと同じになります。たとえ1人か2人の免疫のない人が感染しても その人達が病気をうつす相手がいないからです。免疫のある人ばかりに囲まれているわけです。このように96%は100%と同じくらい効果的です。1000人の中から30%をランダムで選出し 予防接種をしたらどうなるか 計算した科学者達がいましたが 集団レベルでの免疫が得られるかと言うと 得られません。でもこの同じ30%の300人に 友人を挙げてもらって 同じ数の予防接種を 300人が挙げた友人達300人に 実施すると 集団免疫と同等の免疫ができます。集団の96%に予防接種したのと同じ効果を 厳しい予算でもずっと効率よく得られるのです。

 

16 どんな商品の宣伝にも使える対象者の選定手法

似たようなアイデアを使って 発展途上国で蚊帳などを配布する際に 対象者を限定することもできます。村のネットワークの構造が分かっていれば 蚊帳などの普及を促進する中心部の 人々をターゲットにして介入援助できます。また率直に言って これはどんな商品の宣伝にも使えます。対象者の選定の仕方が分かれば 目的を達成する効率を 上げることができます。事実 現在ありとあらゆるところで 集められているデータを利用できます。

 

17 今の時代は大量のデータが自動的に蓄積されている

こちらはヨーロッパにおける 800万人の電話利用者の関係図です。それぞれの点は人を表し 線はその人達の間の電話回数を表します。私達はこのような自動的に集められたデータによって これらの国の全体像を見たり ネットワークのどこに誰がいるか理解できます。特別なデータ処理などしなくても このような構造の洞察を得ることができるのです。お気づきと思いますが このようなデータは 他の情報源からも手にすることができます。メールやインターネット上のやりとり ソーシャルネットワークなどです。実際 今の時代は 大量のデータが自動的に蓄積されています。大量に収集されたデータの使い道は幾通りもあります。集団を追跡するためのセンサーとなる 中心部の人々を特定したり その集団の中で何が起こっているか理解したり 改善の為に介入したりできます。最近の技術では 誰と誰がしゃべっているかだけでなく 人々がどこにいるのかも分かるからです。アップロードされるものから人々が考えていることが分かり 購入記録から商品の売れ筋も分かります。これらすべての管理データを合わせて処理すれば 人々の行動を 以前はできなかった方法で理解できます。

 

18 燃料購入、渋滞予測、薬品処方の普及についても確認できる

トラックの運転手による燃料購入を例にします。運転手達は普段通りに仕事をして 燃料を購入します。私たちは燃料の購入量が急上昇するのを見て 経済低迷期の終わりが近いと分かります。または人々が高速道路を 移動している速度を携帯電話で計測することもできます。電話会社は 速度が落ちるのを見て 渋滞を感知できます。更にその情報を携帯電話ユーザーに提供できるわけです。それも同じ高速道路上で その渋滞の後続のユーザーに限定できます。医師の薬品処方状況を観察することもできます。新規の医薬品がどのように医師の間で普及するのか 理解することができます。人々の商品購入状況の観察をして このようなタイプの現象がどうやって 人々の間で普及するのか確認することができます。

 

19 自動蓄積された大量データの3つの利用法

自動蓄積された大量データの利用法は 3つあると思います。1つ目は完全に受身的な 先ほど説明したようなものです。トラックの運転手の例のような 実際には集団に一切介入しないしないものです。そして半能動的な 例に挙げたインフルエンザのような 人々に友人を挙げてもらい 彼らがインフルエンザに感染しないか 観察して警告を受けるものもあります。別の例として 電話会社がネットワークの中心に位置する人を調べて 「毎日熱を測って携帯メールで送ってもらえますか?」 「体温だけでかまいません」と頼み 大量の体温データを中心部の人々に限定して 収集することも考えられます。こうして人々の最低限の情報提供だけで 伝染病の流行の兆しを 広範囲に監視できるのです。またはもっと積極的なアプローチもできます。このあとの講演者も話しますが 人々が世界中からウィキに参加したり 写真や選挙の追跡をしたりして 情報をアップロードしたものを 社会的プロセスや現象を理解するために 収集することもできます。

 

20 計算社会科学は望遠鏡や顕微鏡の発明に似ている

事実これらのデータが入手できるのは 専門家が言うところの 「計算社会科学」のような一種の新たな 時代の到来を告げています。これはガリレオが望遠鏡を使って それまでにないやり方で 天空の観察ができたことや レーウェンフクが顕微鏡を発明し 生物学に新たな見解を もたらしたことに似ています。今度は大量データが入手できるようになり 社会的プロセスや現象を 以前にはなかったやり方で 理解することができるようになったわけです。そしてこの科学により私達は 社会全体が具体的にどうやって ただ一人ひとりを足しただけよりも 偉大となるのか理解することができるのです。そして実際にこれらの洞察を利用して 社会および人々の生活を改善できるのです。ありがとうございました。

最後に

普及はネットワークを通して行なわれ、特定の構造がある。あなたの友人にはあなたより友人がいる。一定の集団の中で起こるインフルエンザの流行を1ヵ月半以上前に察知できる。感染も情報も常識も言動も人々の間で広がる。300人が挙げた友人達300人に予防接種を実施すると、集団免疫と同等の免疫ができる。計算社会科学は望遠鏡や顕微鏡の発明に似ている。友人の紹介は効果抜群

和訳してくださった Sawa Horibe 氏、レビューしてくださった Natsuhiko Mizutani 氏に感謝する(2010年6月)。

ビッグデータの正体 情報の産業革命が世界のすべてを変える


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>