マッシュアップとは何なのかをさらに理解するには、その言葉の起源を調べる必要があります。マッシュアップはポップ ミュージックから来ており、マッシュアップは 2 つの異なる曲 (通常は異なるジャンルに属する) のボーカルとインストゥルメンタル トラックをミックスしたものです。 。マッシュアップ ジャンルでは、人気のあるマッシュアップを調査します。
1. はじめに
新しいタイプの Web ベースのデータ統合アプリケーションがインターネット上で徐々に出現しています。マッシュアップという用語でよく呼ばれるその人気は、インタラクティブなユーザー エンゲージメントとサードパーティ データの統合をフランケンシュタインのように重視することから生まれました。私たちが「スプラウト」という言葉を使うのには理由があります。マッシュアップ Web サイトは、組織の境界外にあるデータ ソースのコンテンツと機能を活用して Web 上に出現することを特徴としています。
マッシュアップの不可解なデータ統合定義は、確かにそれほど厳密ではありません。マッシュアップとは何なのかをさらに理解するには、その言葉の起源を調べる必要があります。マッシュアップはポップ ミュージックから来ており、マッシュアップは 2 つの異なる曲 (通常は異なるジャンルに属する) のボーカルとインストゥルメンタル トラックをミックスしたものです。 。それらの「ろくでなしポップ」ソングと同様に、マッシュアップは、(コンピューターではなく)人間によって合成されたコンテンツ(多くの場合、無関係なソースから派生したもの)の珍しい革新的な組み合わせです。
では、マッシュアップとはどのようなものなのでしょうか? ChicagoCrime.org Web サイトには、マップ マッシュアップとは何かを説明する非常に直感的な例があります。広く普及した最初のマッシュアップの 1 つは、シカゴ警察のオンライン データベースの犯罪記録と Google マップの地図を組み合わせた Web サイトでした。ユーザーは、たとえば、南カリフォルニアでの最近の住居侵入すべての詳細を示す画鋲を含む地図を含むグラフィカル インターフェイスを表示するように指示することで、マッシュアップ サイトを操作できます。コンセプトとプレゼンテーションは非常にシンプルで、犯罪データとマップ データを組み合わせることで提供される視覚化機能は非常に強力です。
マッシュアップ ジャンルでは、マップ マッシュアップなどの人気のあるマッシュアップを調査します。マッシュアップの構築と運用に関連する技術的状況について簡単に説明します。技術的課題と社会的課題のセクションでは、マッシュアップに影響を与える主な技術的課題と社会的課題をそれぞれ紹介します。
2. マッシュアップの種類
このセクションでは、よく知られているマッシュアップの種類についていくつかの調査を簡単に紹介します。
マップ マッシュアップ
情報技術のこの段階では、人々は物や行動に関する大量のデータを収集しますが、その両方に位置の注釈情報が含まれることがよくあります。位置データを含むこれらのさまざまなデータセットはすべて、地図を使用して驚くべき方法でグラフィカルに表示できます。マッシュアップ ブームの主な原動力の 1 つは、Google による Google Maps API の一般公開です。これにより、Web 開発者 (愛好家、パッチ開発者など) があらゆる種類のデータ (原爆災害からボストンのカウパレードの牛まで) をマップに含めることができるようになります。 Microsoft (Virtual Earth)、Yahoo (Yahoo Maps)、AOL (MapQuest) も他社に遅れをとらないよう、独自の API をいち早く公開しました。
ビデオと画像のマッシュアップ
画像ホストとソーシャル ネットワーキング サイト (画像共有に独自の API を使用する Flickr など) の台頭により、多くの興味深いマッシュアップが出現しました。コンテンツプロバイダーは保存した画像に関連付けられたメタデータ(写真を撮った人、その写真の内容、いつ、どこで撮影されたかなど)を持っているため、マッシュアップデザイナーはこれらの写真と他の写真をメタデータと組み合わせることができます。一緒に。たとえば、マッシュアップでは、歌や詩を分析して関連する写真をつなぎ合わせたり、同じ写真のメタデータ (タイトル、タイムスタンプ、その他のメタデータ) に基づいてソーシャル ネットワーク グラフを表示したりできます。別の例では、Web サイト (たとえば、CNN などのニュース サイト) を入力として取り、ニュース内の写真マッチングを通じて写真の内容をテキストの形式で提示することができます。
検索とショッピングのマッシュアップ
検索とショッピングのマッシュアップは、マッシュアップという用語が作られるずっと前から存在していました。 Web API が登場する前は、BizRate、PriceGrabber、MySimon、Google の Froogle など、かなりの数のショッピング ツールがありましたが、これらはすべて B2B テクノロジーまたは画面スクレイピングを使用して、関連する価格データを蓄積していました。マッシュアップやその他の興味深い Web アプリケーションの開発を促進するために、eBay や Amazon などの消費者サイトは、コンテンツにプログラムでアクセスするための独自の API をリリースしました。
ニュース マッシュアップ
ニュース ソース (ニューヨーク タイムズ、BBC、ロイターなど) は、2002 年以来、RSS や Atom などのシンジケーション テクノロジを使用して、さまざまなトピックに関するニュース フィードを公開してきました。フェデレーション テクノロジーに基づくマッシュアップでは、ユーザーのフィードを集約し、Web 上でレンダリングして、読者固有の興味に合わせてカスタマイズされた新聞を作成できます。 Diggdot.us はその一例で、Digg.com、Slashdot.org、Del.icio.us のテクノロジー関連コンテンツを統合しています。
3. 技術的課題
他のデータ統合分野と同様に、マッシュアップ開発にも解決すべき多くの技術的課題が山積しています。マッシュアップ アプリケーションの機能がさらに充実するにつれて、この課題はさらに深刻になってきています。このセクションでは、いくつかの課題を簡単に紹介します。そのうちのいくつかは現在解決または軽減可能ですが、その他は未解決のままです。
データ統合の課題: セマンティックおよびデータ品質
品質調査によると、今日のエンタープライズ IT の主な関心事は、エンタープライズ仮想組織でのデータ統合です。 (この場合、仮想組織という用語は、それぞれが独自の管理ドメインに含まれる多くのフェデレーション ビジネス ユニットの組み合わせを指すために使用します。) 従来のデータ ソースの統合に多忙を極めている多くの組織では、企業の IT マネージャーのような (たとえば、現在のビジネス状況を反映するエンタープライズ ダッシュボードの作成など)、マッシュアップ開発者は、異種データ セット間でセマンティクスを共有することから生じる同様の課題に直面しています。したがって、マッシュアップ開発者がこれにどのように準備しているかを理解するには、エンタープライズ IT が直面している統合の課題を理解するだけで済みます。
たとえば、データモデル間の変換システムを設計する必要があります。データを共通形式に変換するとき、マッピングが不完全な場合(たとえば、あるデータ ソースには、ある住所タイプに国フィールドが含まれるモデルがあるが、別のモデルにはこのフィールドが存在しない場合)、何らかの合理的な仮定を行う必要があります。 。これらの課題には直面していますが、マッシュアップ開発者はソース データ モデルの分野の専門家ではない可能性があります。これは、これらのモデルがサードパーティ製品である可能性があり、これらの合理的な前提が直観的かつ明確ではない可能性があるためであり、これが課題の深刻さを悪化させます。
データの欠落やマッピングの不完全さに加えて、マッシュアップ設計者は、統合したいデータが機械の自動化に適していないことに気づく場合があり、これには多くのサニタイズ作業が必要になります。たとえば、法執行機関の逮捕記録には一貫性がない可能性があります。記録では名前に一般的な略語が使用されている場合があり (たとえば、ある記録では「mkt sqr」、別の記録では「マーケット スクエア」)、自動推論が同じであるかどうかが不明確になります。 -性行動は、たとえ適切なヒューリスティックルールがあっても非常に困難になります。 RDF などのセマンティック モデリング テクノロジは、データ ストレージ メディアに埋め込まれているさまざまなデータ セット間で自動的に推論する問題を簡素化するのに役立ちます。従来のデータ ソースの場合、通常、セマンティック モデリング テクノロジで使用できるようになる前に、分析とデータ純化に多くの人的資源と物的リソースが投資されます。
マッシュアップ開発者は、IT 統合マネージャーが直面する必要のないいくつかの問題にも直面しなければならない場合があります。その 1 つはデータ汚染です。アプリケーション設計の一部として、多くのマッシュアップでは一般ユーザーからの入力が必要です。ウィキ アプリケーションの分野の調査によると、これは両刃の剣です。オープンな貢献とクラス最高のデータ イノベーションが可能になるため、非常に強力ですが、データ項目に一貫性のない、不正確な、または誤解を招く可能性があります。 。後者はデータの信頼性を損ない、最終的にはマッシュアップがもたらす価値を低下させる可能性があります。
マッシュアップ開発者が直面する必要があるもう 1 つの統合問題は、データを取得するために使用する必要がある画面スクレイピング技術から発生します。前のセクションで説明したように、ツールとデータ モデルの分析と取得には、リバース エンジニアリングに関連する多くの作業が必要です。最良のシナリオでは、これらのツールとモデルを作成できますが、ソース サイトが独自のコンテンツをどのようにレンダリングするかという問題が依然としてあり、統合プロセスが中断され、マッシュアップ アプリケーションでエラーが発生する可能性があります。
コンポーネントの課題
Web 開発の Ajax モデルは、従来のページ全体の更新手法よりも豊かでシームレスなユーザー エクスペリエンスを提供できますが、いくつかの課題も引き起こします。 Ajax の基本レベルでは、ブラウザの設計者が完全に想定したコンテンツ配信方法を実装するために、ブラウザのクライアント側スクリプト機能と独自の DOM を使用する必要があります。 (おそらく、Ajax のハッカー的な性質が Ajax の魅力をさらに高めています。) しかし、これにより、Ajax ベースのアプリケーションは、Microsoft が Internet Explorer を開発して以来 Web 開発者を悩ませてきたのと同じブラウザ互換性の問題にさらされることになります。たとえば、Ajax エンジンは XMLHttpRequst オブジェクトを使用して、リモート サーバーと非同期にデータを交換します。 Internet Explorer 6 では、このオブジェクトはネイティブ JavaScript ではなく ActiveX を使用して実装されるため、ActiveX を有効にする必要があります。
より基本的な要件は、Ajax ではユーザーのブラウザーで JavaScript が有効になっている必要があることです。これはほとんどの人にとって合理的な想定かもしれませんが、一部の特定のユーザーにとっては、ブラウザーまたは自動ツールが JavaScript をサポートしていないか、JavaScript サポートが有効になっていない可能性があります。このようなツールには、インターネットやイントラネットの検索エンジンの情報を収集するロボット、スパイダー、Web クローラーなどがあります。機能の譲歩がなければ、Ajax ベースのマッシュアップ アプリケーションはユーザー ベースの一部を失い、検索エンジンにとって魅力的でなくなる可能性もあります。
JavaScript を使用してページ上のコンテンツを非同期的に更新すると、ユーザー インターフェイスの問題も発生します。コンテンツをブラウザのアドレス バーの URL にリンクする必要がなくなるため、ユーザーはブラウザの [戻る] ボタンやブックマークの機能を体験できなくなる可能性があります。さらに、Ajax はコンテンツの増分更新をリクエストすることで遅延を短縮できますが、設計が不十分だとユーザー エクスペリエンスに悪影響を及ぼす可能性があります。たとえば、更新の粒度が非常に小さい場合、更新の数と負荷が利用可能なリソースをすべて占有してしまいます。さらに、インターフェイスの読み込み時やコンテンツの更新時にユーザーをサポートする方法 (たとえば、プログレス バーなどの視覚的なフィードバック テクノロジを使用する) にも注意する必要があります。
他の分散クロスドメイン アプリケーションと同様に、マッシュアップ開発者やコンテンツ プロバイダーが対処する必要があるセキュリティ上の懸念があります。アイデンティティの概念は厄介なテーマになる可能性があり、従来の Web は主に匿名アクセスを目的として構築されていました。シングル サインオンは望ましい機能ですが、複数の競合テクノロジ (Microsoft Passport から Liberty Alliance まで) があり、統合する必要がある ID 名前空間が混乱する可能性があります。コンテンツ プロバイダーは、有料サブスクリプションや機密データを含むビジネス モデルを強化するために、独自の API で認証および認可モデル (安全な ID または安全な確認済み属性の概念が必要) を採用する場合があります。機密データには一定レベルの機密性 (暗号化など) が必要な場合もあり、リスクを招くことなく他のリソースと統合するタイミングを知る必要があります。 ID は監査や規制遵守にとっても重要です。さらに、データ統合はサーバー側とクライアント側の両方で行われるため、ユーザーからマッシュアップ サービスへの ID と証明書の委任も要件となる場合があります。
4. 社会的課題
前節で紹介した技術的課題に加えて、マッシュアップのさらなる普及に伴い、いくつかの社会的課題も浮上しています(あるいはこれから生じようとしています)。
マッシュアップ開発者が直面する必要がある最も深刻な社会問題の 1 つは、知的財産および消費者のプライバシーの保護と、宣伝および情報の自由な流れとの間のバランスを取ることです。疑いを持たないコンテンツ プロバイダー (画面スクレイピングのターゲット)、データの取得を容易にする API を提供するコンテンツ プロバイダーは、承認していない方法でコンテンツが他者によって使用されているかどうかを判断する必要がある場合があります。マッシュアップ Web アプリケーションはまだ初期段階にあり、趣味で暇なときにマッシュアップを作成している人もいます。これらの開発者は、セキュリティなどの問題を認識していない (または気にしていない) 可能性があります。さらに、コンテンツ プロバイダーは、マシンベースでコンテンツにアクセスするための API を提供することの価値を理解し始めたばかりであり、多くのプロバイダーはこれをビジネスの中核的な懸念事項とは考えていません。これらすべてが組み合わさって、今日ではテストや品質保証などの取り組みが概念実証やイノベーションよりも優先順位が低くなり、低品質のソフトウェアを生み出しています。ソフトウェア開発プロセスの成熟を促進するには、コミュニティが全体として協力してオープン スタンダードと再利用可能なツールキットを開発する必要があります。
マッシュアップがクールなおもちゃからプログラムによるアプリケーションに移行する前に、非常に堅牢な標準、プロトコル、モデル、ツールキットを策定するために多くの作業を行う必要があります。これを行うには、主要なソフトウェア開発業界の先駆者、コンテンツ プロバイダー、起業家が、マッシュアップの価値を実行可能なビジネス モデルとして認識する必要があります。 API プロバイダーは、コンテンツに対して課金するかどうか、課金する場合はどのように課金するか (サブスクリプションまたは使用ごとなど) を決定する必要があります。おそらく、異なるレベルのサービス品質を提供するでしょう。 eBay や Amazon などの一部のマーケットプレイス プロバイダーは、無料の API によって商品の売上高が増加すると考えている場合があります。マッシュアップ開発者は、広告ベースの収益モデルを追求したり、注目を集めるために興味深いマッシュアップ アプリケーションを構築したりしたい場合があります。
結論
マッシュアップは確かにかなり新しい Web アプリケーションです。セマンティック Web から派生したデータ モデリング技術と、疎結合でサービス指向でプラットフォームに依存しない通信プロトコルを組み合わせることで、最終的には、大量の Web 情報を完全に活用して統合できるアプリケーションの開発に必要なインフラストラクチャが提供されます。マッシュアップ アプリケーションがますます注目を集めているため、特定の社会問題 (公共利用と知的財産保護の間の問題など) や他のアプリケーション分野 (インターネットなど、組織の境界を越えたデータの統合) にマッシュアップ アプリケーションがどのように貢献するかを理解することが重要です。これがグリッド コンピューティングと B2B ワークフロー管理にどのような影響を与えるかを見るのは興味深いでしょう。