매시업이 무엇인지 더 자세히 이해하려면 단어의 유래를 살펴봐야 합니다. 매시업은 팝 음악에서 유래되었으며 매시업은 두 가지 다른 노래(일반적으로 다른 장르에 속함)의 보컬과 악기 트랙을 혼합한 것입니다. . 매시업 장르에서는 인기 있는 매시업을 살펴봅니다.
1. 소개
새로운 유형의 웹 기반 데이터 통합 애플리케이션이 인터넷에서 점차 등장하고 있습니다. 종종 매시업이라는 용어로 언급되는 이러한 인기는 프랑켄슈타인과 같이 대화형 사용자 참여와 제3자 데이터 통합을 강조하는 데서 비롯됩니다. 우리가 새싹이라는 단어를 사용하는 이유는 매시업 웹 사이트가 조직 경계 외부에 있는 데이터 소스의 콘텐츠와 기능을 활용하여 웹에 등장한다는 특징이 있기 때문입니다.
매시업의 비밀스러운 데이터 통합 정의는 확실히 그다지 엄격하지 않습니다. 매시업이 무엇인지 더 자세히 이해하려면 단어의 유래를 살펴봐야 합니다. 매시업은 팝 음악에서 유래되었으며 매시업은 두 가지 다른 노래(일반적으로 다른 장르에 속함)의 보컬과 악기 트랙을 혼합한 것입니다. . "개자식 팝" 노래처럼 매시업은 컴퓨터가 아닌 인간이 합성한 독특하고 혁신적인 콘텐츠 조합(종종 관련 없는 소스에서 파생됨)입니다.
그렇다면 매시업은 어떤 모습일까요? ChicagoCrime.org 웹 사이트에는 지도 매시업이 무엇인지 설명하는 매우 직관적인 예가 있습니다. 널리 인기를 끌었던 최초의 매시업 중 하나는 시카고 경찰국 온라인 데이터베이스의 범죄 기록과 Google 지도의 지도를 결합한 웹 사이트였습니다. 사용자는 매시업 사이트와 상호 작용할 수 있습니다. 예를 들어 남부 캘리포니아에서 최근 발생한 모든 가정 침입에 대한 세부 정보를 표시하는 압정이 포함된 지도와 함께 그래픽 인터페이스를 표시하도록 지시하는 방식으로 매시업 사이트와 상호 작용할 수 있습니다. 컨셉과 표현이 매우 단순하며, 범죄와 지도 데이터를 결합하여 제공되는 시각화 기능은 매우 강력합니다.
매시업 장르에서는 지도 매시업을 비롯한 인기 있는 매시업을 살펴봅니다. 매시업 구축 및 운영과 관련된 기술 환경에 대해 간략하게 소개합니다. 기술적 과제와 사회적 과제 섹션에서는 각각 매시업에 영향을 미치는 주요 기술적 과제와 사회적 과제를 소개합니다.
2. 매시업 유형
이 섹션에서는 잘 알려진 매쉬업 유형에 대한 몇 가지 조사를 간략하게 소개합니다.
지도 매시업
정보 기술의 이 단계에서 사람들은 사물과 행동에 대한 많은 양의 데이터를 수집하며, 두 데이터 모두 위치 주석 정보가 있는 경우가 많습니다. 위치 데이터가 포함된 다양한 데이터 세트는 모두 지도를 사용하여 놀라운 방식으로 그래픽으로 표시할 수 있습니다. 매시업 붐의 주요 원동력 중 하나는 Google의 Google Maps API 공개 출시입니다. 이는 웹 개발자(애호가, 패치 개발자 등)가 지도에 모든 유형의 데이터(원자폭탄 재해부터 보스턴의 CowParade 소까지)를 포함할 수 있는 문을 열어줍니다. 뒤처지지 않기 위해 마이크로소프트(Virtual Earth), 야후(Yahoo Maps), AOL(MapQuest)도 자체 API를 발빠르게 공개했다.
비디오 및 이미지 매시업
이미지 호스트와 소셜 네트워킹 사이트(예: 이미지 공유를 위해 자체 API를 사용하는 Flickr)의 등장으로 인해 많은 흥미로운 매시업이 등장했습니다. 콘텐츠 제공자는 자신이 저장한 이미지와 관련된 메타데이터(예: 사진을 찍은 사람, 사진의 내용, 촬영 시기 및 장소 등)를 갖고 있으므로 매시업 디자이너는 이러한 사진과 기타 사진을 메타데이터와 결합할 수 있습니다. 함께. 예를 들어 매시업은 노래나 시를 분석하여 관련 사진을 연결하거나 동일한 사진 메타데이터(제목, 타임스탬프 또는 기타 메타데이터)를 기반으로 소셜 네트워크 그래프를 표시할 수 있습니다. 또 다른 예는 웹 사이트(예: CNN과 같은 뉴스 사이트)를 입력으로 취하고 뉴스의 사진 매칭을 통해 사진의 내용을 텍스트 형식으로 표시할 수 있습니다.
검색 및 쇼핑 매시업
검색 및 쇼핑 매시업은 매시업이라는 용어가 만들어지기 오래 전부터 존재해 왔습니다. Web API가 등장하기 전에는 BizRate, PriceGrabber, MySimon, Google의 Froogle과 같은 쇼핑 도구가 꽤 많았으며 모두 B2B 기술이나 스크린 스크래핑을 사용하여 관련 가격 데이터를 축적했습니다. 매시업 및 기타 흥미로운 웹 애플리케이션의 개발을 촉진하기 위해 eBay 및 Amazon과 같은 소비자 사이트에서는 콘텐츠에 프로그래밍 방식으로 액세스할 수 있는 자체 API를 출시했습니다.
뉴스 매시업
뉴스 소스(예: New York Times, BBC 또는 Reuters)는 2002년부터 RSS 및 Atom과 같은 신디케이션 기술을 사용하여 다양한 주제에 대한 뉴스 피드를 게시해 왔습니다. 연합 기술을 기반으로 한 매시업은 사용자의 피드를 집계하고 이를 웹을 통해 렌더링하여 독자의 고유한 관심사에 맞는 개인화된 신문을 만들 수 있습니다. Diggdot.us는 Digg.com, Slashdot.org 및 Del.icio.us의 기술 관련 콘텐츠를 병합한 그러한 예 중 하나입니다.
3. 기술적 과제
다른 데이터 통합 분야와 마찬가지로 매시업 개발도 해결해야 할 많은 기술적 과제로 가득 차 있습니다. 매시업 애플리케이션의 기능이 더욱 풍부해지면서 이러한 과제는 더욱 심각해졌습니다. 이 섹션에서는 몇 가지 문제를 간략하게 소개합니다. 그 중 일부는 현재 해결되거나 완화될 수 있지만 다른 일부는 아직 해결되지 않았습니다.
데이터 통합 과제: 의미 체계 및 데이터 품질
품질 설문 조사에 따르면 오늘날 기업 IT의 주요 관심사는 기업 가상 조직의 데이터 통합입니다. (이 경우 가상 조직이라는 용어를 사용하여 각각 자체 관리 도메인에 포함된 많은 연합 비즈니스 단위의 조합을 나타냅니다.) 기존 데이터 소스를 통합하는 데 바쁜 많은 조직의 경우 기업 IT 관리자와 같습니다(예: 현재 비즈니스 상황을 반영하는 엔터프라이즈 대시보드 생성) 매시업 개발자는 이기종 데이터 세트 간의 의미 체계 공유에서 발생하는 유사한 문제에 직면합니다. 따라서 매시업 개발자가 이를 어떻게 준비하고 있는지 이해하려면 엔터프라이즈 IT가 직면한 통합 문제만 이해하면 됩니다.
예를 들어 데이터 모델 간 변환 시스템을 설계해야 합니다. 데이터를 공통 형식으로 변환할 때 매핑이 불완전한 경우(예를 들어 한 데이터 원본에 한 주소 유형에 국가 필드가 포함된 모델이 있을 수 있지만 다른 모델에는 이 필드가 없는 경우) 몇 가지 합리적인 가정을 수행해야 합니다. . 이러한 문제에 직면했음에도 불구하고 매시업 개발자는 소스 데이터 모델 분야의 전문가가 아닐 수 있습니다. 왜냐하면 이러한 모델은 타사 제품일 수 있고 이러한 합리적인 가정이 직관적이고 명확하지 않아 문제의 심각성을 더욱 악화시킬 수 있기 때문입니다.
누락된 데이터와 불완전한 매핑 외에도 매시업 설계자는 통합하려는 데이터가 기계 자동화에 적합하지 않다는 사실을 발견할 수 있으며, 이로 인해 많은 정리 작업이 필요하게 됩니다. 예를 들어, 법 집행 기관의 체포 기록은 일관성이 없을 수 있습니다. 기록은 이름에 대해 일반적인 약어를 사용할 수 있습니다(예: 한 기록에서는 "mkt sqr", 다른 기록에서는 "Market Square"). -좋은 경험적 규칙이 있어도 성행위는 매우 어려워집니다. RDF와 같은 의미론적 모델링 기술은 데이터 저장 매체에 내장된 다양한 데이터 세트 간의 자동 추론 문제를 단순화하는 데 도움이 될 수 있습니다. 전통적인 데이터 소스의 경우 의미론적 모델링 기술에 사용되기 전에 분석 및 데이터 정제에 많은 인력과 물적 자원이 투자되는 경우가 많습니다.
매쉬업 개발자는 IT 통합 관리자가 직면할 필요가 없는 몇 가지 문제에 직면해야 할 수도 있습니다. 그 중 하나는 데이터 오염입니다. 애플리케이션 설계의 일부로 많은 매시업에는 공용 사용자의 입력이 필요합니다. Wiki 애플리케이션 분야의 연구에 따르면 이는 양날의 검입니다. 이는 공개적인 기여와 동급 최고의 데이터 혁신을 허용하므로 매우 강력할 수 있지만 일관성이 없거나 부정확하거나 오해의 소지가 있는 데이터 항목으로 이어질 수 있습니다. . 후자는 데이터의 신뢰성을 위태롭게 하고 궁극적으로 매시업이 가져오는 가치를 감소시킬 수 있습니다.
매시업 개발자가 직면해야 하는 또 다른 통합 문제는 데이터를 얻는 데 사용해야 하는 화면 스크래핑 기술에서 발생합니다. 이전 섹션에서 설명한 것처럼 도구와 데이터 모델을 분석하고 획득하려면 리버스 엔지니어링과 관련된 많은 작업이 필요합니다. 최상의 시나리오에서는 이러한 도구와 모델을 만들 수 있지만 소스 사이트가 자체 콘텐츠를 렌더링하는 방식에 대한 문제가 여전히 남아 있으며, 이로 인해 통합 프로세스가 중단되고 매시업 애플리케이션에 오류가 발생할 수 있습니다.
구성 요소 문제
Ajax 웹 개발 모델은 기존의 전체 페이지 새로 고침 기술보다 더 풍부하고 원활한 사용자 경험을 제공할 수 있지만 몇 가지 문제도 발생합니다. 기본 수준에서 Ajax는 브라우저 디자이너가 완전히 구상한 콘텐츠 전달 방법을 구현하기 위해 자체 DOM과 함께 브라우저의 클라이언트 측 스크립팅 기능을 사용해야 합니다. (아마도 Ajax의 해커와 같은 특성이 매력을 더할 것입니다.) 그러나 이로 인해 Ajax 기반 애플리케이션은 Microsoft가 Internet Explorer를 개발한 이후 웹 개발자를 괴롭혔던 것과 동일한 브라우저 호환성 문제에 직면하게 됩니다. 예를 들어, Ajax 엔진은 XMLHttpRequst 객체를 사용하여 원격 서버와 비동기적으로 데이터를 교환합니다. Internet Explorer 6에서 이 개체는 ActiveX를 활성화해야 하는 기본 JavaScript가 아닌 ActiveX를 사용하여 구현됩니다.
보다 기본적인 요구 사항은 Ajax가 사용자 브라우저에서 JavaScript를 활성화하도록 요구한다는 것입니다. 이는 대부분의 사람들에게 합리적인 가정일 수 있지만 일부 특정 사용자의 경우 브라우저나 자동화 도구가 JavaScript를 지원하지 않거나 JavaScript 지원이 활성화되지 않았을 수 있습니다. 이러한 도구에는 인터넷 및 인트라넷 검색 엔진에 대한 정보를 수집하는 로봇, 스파이더 및 웹 크롤러가 포함됩니다. 기능을 양보하지 않으면 Ajax 기반 매시업 애플리케이션은 일부 사용자 기반을 잃고 검색 엔진의 매력이 떨어질 수도 있습니다.
JavaScript를 사용하여 페이지의 콘텐츠를 비동기적으로 업데이트하면 사용자 인터페이스 문제가 발생합니다. 콘텐츠가 더 이상 브라우저 주소 표시줄의 URL에 연결될 필요가 없기 때문에 사용자는 브라우저의 BACK 버튼이나 북마크 기능을 경험하지 못할 수 있습니다. 또한 Ajax는 증분 콘텐츠 업데이트를 요청하여 대기 시간을 줄일 수 있지만 잘못된 설계는 사용자 경험에 부정적인 영향을 미칠 수 있습니다. 예를 들어 업데이트 세분성이 매우 작은 경우 업데이트 수와 로드가 사용 가능한 모든 리소스를 차지합니다. 또한 인터페이스를 로드하거나 콘텐츠를 업데이트할 때 사용자를 지원하는 방법(예: 진행률 표시줄과 같은 시각적 피드백 기술 사용)에도 신경을 써야 합니다.
분산된 크로스 도메인 애플리케이션과 마찬가지로 매시업 개발자와 콘텐츠 제공자가 해결해야 할 보안 문제가 있습니다. 신원 개념은 까다로운 주제일 수 있으며 기존 웹은 주로 익명 액세스를 위해 구축되었습니다. Single Sign-On은 바람직한 기능이지만, 통합해야 하는 ID 네임스페이스를 혼란스럽게 만들 수 있는 여러 가지 경쟁 기술(Microsoft Passport에서 Liberty Alliance까지)이 있습니다. 콘텐츠 제공업체는 유료 구독 또는 민감한 데이터와 관련된 비즈니스 모델을 시행하기 위해 자체 API에 인증 및 권한 부여 모델(보안 ID 또는 보안 확인 속성 개념 필요)을 채택할 수 있습니다. 민감한 데이터에는 특정 수준의 기밀성(예: 암호화)이 필요할 수 있으며 위험을 초래하지 않고 언제 다른 리소스와 통합해야 하는지 알아야 합니다. ID는 감사 및 규정 준수에도 중요합니다. 또한 데이터 통합이 서버측과 클라이언트측 모두에서 발생하므로 매시업 서비스에 대한 사용자의 ID 및 인증서 위임도 요구 사항이 될 수 있습니다.
4. 사회적 과제
이전 섹션에서 소개한 기술적 과제 외에도 매시업의 인기가 높아짐에 따라 몇 가지 사회적 문제도 나타났습니다(또는 곧 발생할 예정입니다).
매시업 개발자가 직면해야 하는 가장 심각한 사회 문제 중 하나는 지적 재산 보호와 소비자 개인 정보 보호, 홍보 및 정보의 자유로운 흐름 사이에서 균형을 맞추는 것입니다. 데이터 검색을 용이하게 하기 위해 API를 제공하는 콘텐츠 제공자(스크린 스크래핑의 대상)를 의심하지 않는 콘텐츠 제공자는 승인되지 않은 방식으로 다른 사람이 자신의 콘텐츠를 사용하고 있는지 확인해야 할 수도 있습니다. 매시업 웹 애플리케이션은 아직 초기 단계에 있으며 일부 애호가들은 여가 시간에 매시업을 작성합니다. 이러한 개발자는 보안과 같은 문제를 인식(또는 관심)하지 않을 수 있습니다. 또한 콘텐츠 제공업체는 콘텐츠에 대한 기계 기반 액세스를 위한 API 제공의 가치를 이제 막 인식하기 시작했으며 많은 사람들이 이를 핵심 비즈니스 문제로 보지 않습니다. 테스트 및 품질 보증과 같은 노력이 개념 증명 및 혁신보다 우선 순위가 낮기 때문에 이 모든 것이 결합되어 오늘날 낮은 품질의 소프트웨어가 탄생합니다. 소프트웨어 개발 프로세스의 성숙도를 높이려면 커뮤니티가 전체적으로 협력하여 개방형 표준과 재사용 가능한 툴킷을 개발해야 합니다.
매시업이 멋진 장난감에서 프로그래밍 방식의 애플리케이션으로 전환되기 전에 매우 강력한 표준, 프로토콜, 모델 및 툴킷을 공식화하기 위해 많은 작업을 수행해야 합니다. 이를 위해서는 주요 소프트웨어 개발 업계의 개척자, 콘텐츠 제공자 및 기업가가 실행 가능한 비즈니스 모델로서 매시업의 가치를 인식해야 합니다. API 제공업체는 콘텐츠에 대한 비용을 청구할지 여부를 결정해야 하며, 그렇다면 비용을 청구하는 방법(예: 구독 기준 또는 사용량 기준)을 결정해야 합니다. 아마도 그들은 다양한 수준의 서비스 품질을 제공할 것입니다. eBay나 Amazon과 같은 일부 마켓플레이스 제공업체에서는 무료 API가 제품 회전율을 높일 것이라고 생각할 수 있습니다. 매시업 개발자는 광고 기반 수익 모델을 추구하거나 관심을 끌기 위해 흥미로운 매시업 애플리케이션을 구축하기를 원할 수 있습니다.
결론
매시업은 실제로 상당히 새로운 웹 애플리케이션입니다. 시맨틱 웹에서 파생된 데이터 모델링 기술과 느슨하게 결합된 서비스 지향, 플랫폼 독립적인 통신 프로토콜의 조합은 궁극적으로 대량의 웹 정보를 완전히 활용하고 통합할 수 있는 애플리케이션을 개발하는 데 필요한 인프라를 제공할 것입니다. 매시업 애플리케이션이 점점 더 많은 주목을 받으면서 매시업 애플리케이션이 특정 사회적 문제(예: 공공 사용과 지적 재산권 보호 사이의 문제) 및 기타 애플리케이션 영역(인터넷 등 조직 경계를 넘어 데이터 통합)에 어떻게 기여할 것인지 이해하는 것이 중요합니다. ) 이것이 그리드 컴퓨팅과 B2B 워크플로우 관리에 어떤 영향을 미치는지 보는 것은 흥미로울 것입니다.