「まず始めに、私たちに手が加わっていない生データを下さい」World Wide Webを発明したティムはこう語りかける。ここでは、75万ビューを超えるTim Berners-LeeのTED講演を訳し、データを公開することによる可能性を考える。
要約
20年前、ティム・バーナーズ=リーは、World Wide Webを発明しました。彼の次のプロジェクトは、ウェブが文字や画像、動画を対象に行ったように、私たちのデータを解放し、データの相互利用方法の再構成を意図とした、オープンでリンクするデータの為の新しいウェブの構築です。
Tim Berners-Lee invented the World Wide Web. He leads the World Wide Web Consortium, overseeing the Web’s standards and development.
1 World Wide Webの再構築
時がたつのは早いものです。ちょうど20年程前に 情報の利用方法や、協力して仕事する方法を再構築したいと考え、 World Wide Webを発明しました。そして今、20年後のTEDで、 私は皆さんに新しい再構築に協力頂きたいと思います。
2 18ヶ月間関心は向けられなかった
1989年の頃に遡ります。私はグローバル バイパーテキスト システムを 提唱する提案書を書きました。誰もそれに関してあまり関心を向けませんでした。でも、18ヶ月後、このようにイノベーションは起こるのですが、18ヶ月後、私の上司が私にこのプロジェクトをサイドプロジェクトとして私たちが得た 新しいコンピューターの点検がてら、 取り組む事を許可してくれました。そして彼は、私にコーディングを行う時間をくれたのです。そこで私はHTMLの大まかな部分を作りました。HTTPと呼ばれるハイバーテキスト プロトコルや、“http”で始まる物事を指す名前である URLの概念などです。私はコードを書いて、外に公開しました。
3 互換性のなさへのもどかしさ
なぜ、私はこのような事をしたのか。それは、基本的にストレスがあった為です。私は不満を持っていました。私はソフトウェアエンジニアとして巨大で、 エキサイティングな研究所に、世界中から 集まった多くの人達と共に働いていました。彼らは、多様なコンピューターを研究所に持ち寄ってきました。彼らは多様なデータフォーマットや 様々な文書システムを利用していました。そこで、そのような多様性が存在する中で、もし私があれこれ使って、何かを作りたいと思い立った場合、見ればどれも、新しいマシンに繋げなければならなかったり、新しいプログラムの 動かし方を学ばなければならなかったり、 欲しかった情報が新しいデータ形式で見つかったりします。そしてこれらは全て互換性がないものです。それはとてももどかしいものでした。開きうる可能性に対するもどかしさです。
4 「よくわからないが興味深い」
実際それらのハードディスクの中にはドキュメントがあったのです。例えばインターネットのように もしそれが、どこかの巨大な仮想文書システム上に あったとしたら、 苦労をせずに済むでしょう。一度そのようなアイディアを得ると、心を捉えられてしまうものです。たとえ人々が見向いてくれなかったとしても 上司は実際見てくれた訳ですが、彼の死後見つかった資料には 欄外に鉛筆で「よくわからないが興味深い」と書かれていました(笑)。
5 難しかったのは想像させること
しかし一般的には、ウェブというものを説明することは非常に難しいものでした。今では当時難しかったことを 説明する方が難しい訳ですが。でも、TEDが始まった時のように、ウェブは存在せず、 例えばクリックするという行為には今とは別の意味がありました。誰かにハイパーテキストという、リンクが含まれるページを見せ、リンクをクリックすれば、「チーン」、別のハイパーテキストページが表示されます。あまり見栄えはしません。CD-ROMにもハイパーテキストが含まれていたりします。難しかった事は、彼らに想像させることでした。実質的に考え得るあらゆる文書にリンクで飛ぶことができるのだと 想像させるということです。これは難しい概念的な飛躍だったのです。まあ、ある人々は受け入れてくれましたが説明するのは難しかったものの、草の根運動が起こったのです。そしてそれこそがこの事を最も面白くさせたのです。私が最も興奮したことは、技術自体でも、人々が技術を使ってやったことでもなく そこから生まれたコミュニティーであり、 力を合わせる人々の精神に対してです。あの頃はそんなふうでした。
6 「ウェブにみなさんの文書を置いてください」
面白い事に今も当時と同じ状況になりつつあります。私はいわば皆さんにお願いしていたのでした。「このウェブっていうのにみんなの文書を置いてください」 そしてみんなそうしてくれました ありがとうございます。すごい事になりましたよね。かなり面白い事になっていたと思います。なぜならウェブ上で起こったことは、 私たちを本当に圧倒したからです。それらは私たちが始めのウェブサイトを 始めた時に想像していたことを 遥かに超えていました。次は、ウェブに皆さんのデータを置いて頂きたいのです。ここにはまだ開かれずにいる大きな可能性があります。未だ人々はデータがウェブ上に データとして存在していないことから、多くの不満を抱えています。
7 文書とデータの違い
そもそもデータとは何でしょう。文書とデータの違いは何でしょう。文書は読み物です。内容を読めるし、リンクを辿ることもできますが、それだけです。一方、データの場合、様々な事が出来ます。ハンス ロスリングの講演を聴いた方はいらっしゃいますか。最も素晴らしい、ええ、多くの方はご覧になったと思いますが、 最も卓越したTED Talkの一つでした。ハンスはこのプレゼンテーションより 様々な国々に対して、異なる色で表現し、彼は、所得水準を一方の軸で表し、もう片方を幼児死亡率とし、 時の経過をアニメーションで示しました。彼はこれらのデータを元に 人々が発展途上諸国の経済に対して持っていた 思い込みをプレゼンテーションで吹き飛ばしたのです。
8 「たくさんのデータを持つことが重要なのです」
彼はこのようなスライドを紹介しました。地下には全てのデータが存在し、 データは面白みのない茶色の箱として描かれていますが そういうものだとみんな思っています。なぜならデータはそのまま使う事は出来ないからです。でも実は、誰かがそのデータを元に何かを生み出すことによって データは私たちの生活に大きな影響を与えるものなのです。このケースでは、ハンスが 国連の様々なウェブサイトなどを通じて発見したデータを組み合わせたのです。彼はデータを一緒に組み合わせ、 個別のデータより遥かに面白いものを生み出し、 確か彼の息子さんが開発したという このソフトウェアに取り込ませることで、 この素晴らしいプレゼンテーションを作成したのです。そしてハンスは 「沢山のデータを持つ事が重要なのです」と言っていました。そして私は昨夜のパーティーで、彼はまだとても強く、 沢山のデータを持つ事の重要性を語っていたのを見てとても嬉しかったです。
9 Linked Dataのルール—HTTPが必要
そこで私は皆さんに 彼のようにただ2つや、6つのデータを繋げるというだけではなく、みんながデータをウェブに載せ、実質的に考えうるあらゆるものがウェブ上にあるという世界を 考えていただきたいのです。これをLinked Dataと呼びます。この技術はごくシンプルなものです。ウェブに何かを載せるには3つのルールがあります。まず“http:”で始まる HTTP名が必要です。これからは文書だけではなく 文書に書かれているものにも使います。人や、場所、 製品やイベントに対しても利用するのです。様々な概念に対して、それぞれHTTPで表されるようになるのです。
10 重要なデータを取得できる
2つ目のルールは、もし私がこのHTTPの名称をもとに ウェブ上で検索し、データを HTTPプロトコルを使ってウェブから 取得したら、人々が知りたがる物事やイベントを 有益な情報としてデータを標準形式で 取得出来ることです。そのイベントには 誰が出るのか?その人の事や、 生まれた場所などと言った事についてです。つまり重要な情報を取得できる点です。
11 関連情報も取得できる
3つ目のルールは、その情報を取得したら、 身長、体重、生まれた場所などその人自身のことだけでなく 関連をも取得できるということです。データとは関連なのです。面白い事に、データは関連を表すのです。この人はベルリンで生まれました。ベルリンはドイツにあります。関連が表明されるとき 関連しているものについて HTTPで始まる名前が取得でき 私はその情報を調べることができます。まずその人を調べ、そこから彼らが生まれた都市を探し、その都市の地域や、町、 そして人口などを探し出せます。つまり、私はこれらの情報に 目を通すことができるのです。
12 つながるデータが多いほど価値が高まる
簡単でしょう? これがLinked Dataなのです。何年か前に 私は”Linked Data”という記事を書きました。そしてその後、物事が進み始めたのです。このLinked Dataは、ハンスが示したように 沢山の箱を私たち自身が持ち、そこから 沢山の芽が伸びてくるイメージです。単なる沢山の草というのではなく 一本の草が伸びている根というのでもなく それぞれの植物は、それがプレゼンテーションや分析結果であれ、データにパターンを見出そうとする人が あらゆるデータを見ることができ データをつなぎ合せることができるのです。そしてデータに関して最も重要なのは、繋がるデータが多い程、価値が高まるということです。
13 WikipediaとDbpedia
という訳で、Linked Dataという ミームは世の中に放たれました。程なくして、これに関する興味深いものをはじめに発表した一人である ベルリン自由大学のクリス ビッツァは、Wikipediaに目を向けました。皆さんのご存知の、興味深い膨大な文書が 詰まったオンライン辞書です。それらの文書には小さな囲み記事があり それらインフォボックスの中にはデータがあります。彼はそれらのデータをWikipediaから抽出してウェブ上の Linked Dataのノードに 入れるためのプログラムを作りました。Dbpediaです。Dbpediaは、このスライドで真ん中に見える青い塊として表現されています。そして実際にベルリンを調べてみると、他にもベルリンに関連する様々なデータが 互いに繋がっていることを見る事ができます。Dbpediaからベルリンに関してデータを取得すれば、 他の情報も合わせて引っ張りだせます。そしてワクワクすることに、それが成長し始めたのです。これもまた、全くの草の根の運動なのです。
14 データの設置を自由に許容している点が重要
データに関して少々考えてみましょう。データは様々な形で存在します。ウェブの多様性を考えてみてください。ウェブが様々なデータを 自由に設置することを許容している点が非常に重要なのです。いろいろなデータについてご紹介できます。政府のデータというのがあります。企業データというのも非常に重要です。科学データや、個人データ、 気象データに、イベントに関するデータ、講演に関するデータや、ニュースなどといったあらゆるデータが存在します。皆さんには、ウェブの多様性について理解して頂き、さらに解放される可能性を持ったデータの 多さを知って頂くために、いくつかを紹介するだけにとどめます。
15 政府のデータを公表しよう
政府のデータから始めましょう。バラク オバマは、スピーチで、アメリカ政府のデータをインターネットから利用できるようにすると言いました。私は政府がLinked Dataとしてデータを公開することを願います。それが重要なのです。なぜでしょうか 透明性の為だけではありません。もちろん透明性は重要ですが、 そのデータは、全ての政府の機関から集められたデータです。その中にアメリカの人々の生活についてのデータがどれほどあることでしょう。それは実際に役に立ち、価値があります。自分の会社で使うことができます。子どもが宿題をするのに使うこともできます。つまりこのデータが利用できることによって、 世界をより良くしようという話なのです。
16 「データベースの抱え込み」から解放しよう
政府機関がデータをどう扱っているかおわかりと思いますが 彼らはデータを公開せずに 抱え込んでいる傾向が強いのです。ハンスはこれを「データベースの抱え込み」と呼んでいます。データベースを抱きかかえ、美しいサイトが 完成するまで見せようとしないのです。私は、それをするよりかは、 ええ、美しいウェブサイトを作ってください。美しく作るなと言っている訳ではないのです。美しいウェブサイトは是非作ってください。ですが、まず始めに、私たちに手が加わっていない生データを下さい。私たちが欲しいのはそのデータなのです。生のデータを公開して頂きたいのです。生データを今すぐ解放してほしいことを伝えなければなりません これからみんなで言う練習をしましょう。
ティム: 「生の」会場:「生の」ティム: 「データを」会場:「データを」ティム: 「今すぐに!」会場:「今すぐに!」ティム: そう、「生のデータを、今すぐに!」会場:「生のデータを、今すぐに!」是非練習してください。
私たちが納税者としてそのお金を出しているというのに 彼らは多くの理由をつけ、データを保管し、 皆さんにデータを公開しないので、この言葉はとても重要なのです。そしてこれは世界中で起きていることです。もちろん政府に限ったことではなく、企業に対してもそうです。
17 人類の知識の大半は共有されていない
データに対する私の考えについてもう少し話したいと思います。ここTEDでは、常に人類社会が現在直面している 大きな課題に対して意識しています。癌の治療、アルツハイマー治療のための脳の理解 より安定させることを目的とした経済への理解や、 世界の仕組みに対する理解など これらの課題の解決を目指す学者は、アイディアを頭の中に持ちつつ、ウェブを介して情報を交換し合っています。しかしながら、現在の人類における知識の大半は、データベースに存在し、大抵コンピューター内に留まり、実際に共有されていません。
18 異なる領域をまたぐ質問ができるという変化
実際、例えば、もしあなたがアルツハイマー病に関する 創薬について情報を探すと、多くの Linked Dataが公開されつつあることを知るでしょう。なぜならその分野の科学者達は 今まで、ゲノムデータを一つのデータベースに格納し、 タンパク質のデータを別のデータベースに格納していたことから、それらの情報を解放するきっかけになることに気づいたからです。今や彼らはそれをLinked Dataにしており 今まで問うことのできなかった質問が 問えるようになりました。「シグナル伝達及び錐体神経に関係する タンパク質は何か」 この質問をグーグルに投げかけてみましょう。もちろん、だれも以前にこの質問をした人がいなかったことから、 この質問に答えるページは存在しません。22万3千ページがヒットしますが、 参考になるページはありませんでした。次にLinked Dataのシステムに質問してみると、32件ヒットし、そのどれもが問うている性質を持ったタンパク質で そこから調べることができます。科学者として、このように異なる領域を実際にまたぐ質問をすることが出来るようになったこと、これは大きな変化です。それはとても重要なことです。科学者達は、他の科学者達が収集し 外部から隔てられたデータの前に完全に立ち往生している状況であり、解放することで大きな問題に取り組める体制が必要です。
19 サイト同士の相互運用性を持たせることが重要
おそらく皆さんは全てのデータは巨大な研究機関から生まれてくるものであり、個人には関係のない話と思っているかもしれません。でもそれは違います。データは私たちの生活より生まれるものです。お好きなソーシャルネットワークサイトにアクセスし、「この人は私の友人です」と言えば、「チーン!」関係性と共にデータが生まれます。「この写真は、この人を撮したものです」と言えば、 「チーン!」これもデータです。データ、データ、データ。ソーシャルネットワークサイトで 何かをする度に、それらのデータをサイト側が取得し、利用することで、サイト上の他の人々の生活を更に面白くなるようにしています。それでも、別のLinked Dataを 使ったサイトに行けば、例えば、旅行関連サイトがあるとして、この写真をそのグループに所属している全員に送りたくとも サイト間で、写真は送れません。エコノミスト誌や多くのブログで話題になる 不満が存在するのです。この壁を取り払うには、サイト同士の 相互運用性を持たせることです。Linked Dataなら可能なのです。
20 Linked Dataの本質は人々が相互に情報提供すること
最後にご紹介するお話は、恐らく最も面白いものだと思います。ここに来る前に、私はOpenStreetMapを使いました。これは地図であり、Wikiでもあります。この四角を拡大すれば、それは私たちが今いる劇場である、テラス劇場です。名前がなかったので、 編集モードを使って、この劇場を選択し、 名前を一番下に追加し、保存しました。再度このOpenStreetMap.orgに戻ってみると、この場所テラス劇場に名前が付けられていることが分かります。私がやったんですよ! 僕が地図に名前を付けたんだ! 俺がつけてやったんだよ、どうだい? この市街地図は、私のようにみんなでそれぞれほんの少しずつ 手を加える事で、途方もない資料を作り出しているのです。そしてそれこそがLinked Dataの本質なのです。人々が幾ばくかの情報を提供し、 それが全て繋がっていくのです。そうやってLinked Dataは機能するのです。あなたも、他の人も、それぞれの情報を提供するのです。あなた自身には、ウェブに載せるだけの大量のデータがなかったとしても 要求することはできます。私たちはそれを練習しました。
21 データをつなぐことが大きな力を持つ
というわけでLinked Dataです。これは途方もないものです 私はまだほんの一握りのことしか皆さんに紹介していません。私たちの生活には仕事や娯楽をはじめ、 あらゆる面にデータが存在し、ただ、データが生成される拠点の数が課題なのではなく、それを繋げていくことが重要なのです。文書としてのウェブでは得られなかった力が データを繋ぎ合せることで得られるのです。この中から本当に途方もなく巨大な力が生まれます。今はこれが素晴らしいアイディアだと思う人々が 行動を起こすべき時です。他のみんなが参加して初めて見返りの得られる 投資効果がすぐにはない話であっても それを実行に移す人がTEDにもたくさんいます。それは彼らが、それを実行し、周りもそれに倣えば 世の中がより良くなると信じているからです。これがLinked Dataです。皆さんにはこれを作って頂きたいのです。皆さんにはこれを要求して頂きたいのです。それが、私の世に広めるべきアイディアです。ありがとうございました。
最後に
データを抱え込まないでいられるだけの自信と実力はあるか。何歳になっても「よくわからないが興味深い」とおもしろがれる人でいられるか。必要なのは主体性と好奇心。
和訳してくださった Yuki Okada 氏、レビューしてくださった Yasushi Aoki 氏に感謝する(2009年3月)。
![]() |