Чтобы лучше понять, что такое мэшап, следует посмотреть на происхождение этого слова: оно происходит из поп-музыки, а мэшап — это смесь вокальных и инструментальных треков из двух разных песен (обычно принадлежащих к разным жанрам). Новая песня. . В жанре гибридных приложений мы исследуем популярные гибридные приложения.
1. Введение
В Интернете постепенно появляется новый тип веб-приложений для интеграции данных. Часто называемые гибридными приложениями, их популярность проистекает из Франкенштейновского акцента на интерактивном взаимодействии с пользователем и интеграции сторонних данных. Мы используем слово «росток» не просто так: гибридные веб-сайты характеризуются появлением в сети и использованием контента и функциональности из источников данных за пределами организации.
Определение гибридного приложения для интеграции загадочных данных, конечно, не очень строгое. Чтобы лучше понять, что такое мэшап, следует посмотреть на происхождение этого слова: оно происходит из поп-музыки, а мэшап — это смесь вокальных и инструментальных треков из двух разных песен (обычно принадлежащих к разным жанрам). Новая песня. . Как и эти «ублюдочные поп-песни», коллажи представляют собой необычные и инновационные комбинации контента (часто полученные из несвязанных источников), синтезированные людьми (а не компьютерами).
Итак, как же выглядит коллаж? На веб-сайте ChicagoCrime.org есть очень понятный пример, объясняющий, что такое коллаж карты. Одним из первых гибридных приложений, получивших широкую популярность, стал веб-сайт, объединявший уголовные записи из онлайн-базы данных Департамента полиции Чикаго с картами из Google Maps. Пользователи могут взаимодействовать с гибридным сайтом, например, указав ему отобразить графический интерфейс с картой, содержащей кнопки, показывающие подробности всех недавних вторжений в дома в Южной Калифорнии. Концепция и представление очень просты, а возможности визуализации, обеспечиваемые объединением данных о преступности и картографических данных, очень мощные.
В жанре коллажей мы исследуем популярные коллажи, в том числе коллажи карт. Дается краткое введение в техническую среду, связанную с созданием и эксплуатацией гибридных веб-приложений. В разделах «Технические проблемы» и «Социальные проблемы» представлены основные технические и социальные проблемы, влияющие на гибридные приложения соответственно.
2. Типы гибридных веб-приложений
В этом разделе мы кратко представим некоторые обзоры известных типов гибридных веб-приложений.
Map Mashup
На этом этапе развития информационных технологий люди собирают большие объемы данных о вещах и поведении, которые часто содержат информацию о местоположении. Все эти различные наборы данных, содержащие данные о местоположении, можно удивительным образом представить графически с помощью карт. Одной из основных движущих сил бума коллажей является публичный выпуск Google API Google Maps. Это открывает перед веб-разработчиками (любителями, разработчиками патчей и другими) возможность включать в карты все типы данных (от катастроф атомной бомбы до коров на Бостонском параде коров). Чтобы не отставать от других, Microsoft (Virtual Earth), Yahoo (Yahoo Maps) и AOL (MapQuest) также быстро раскрыли свои собственные API.
Видео- и графические коллажи.
Рост числа хостов изображений и сайтов социальных сетей (таких как Flickr, который использует собственный API для обмена изображениями) привел к появлению множества интересных коллажей. Поскольку у контент-провайдеров есть метаданные, связанные с сохраняемыми ими изображениями (например, кто сделал фотографию, о чем эта фотография, когда и где она была сделана и т. д.), дизайнеры коллажей могут комбинировать эти и другие фотографии с метаданными. Размещайте соответствующую информацию. вместе. Например, коллаж может анализировать песню или стихотворение, чтобы объединить связанные фотографии, или отображать график социальной сети на основе одних и тех же метаданных фотографии (название, временная метка или другие метаданные). Другой пример может взять веб-сайт (например, новостной сайт, такой как CNN) в качестве входных данных и представить содержимое фотографии в виде текста посредством сопоставления фотографий с новостями.
Мэшапы для поиска и покупок
Мэшапы для поиска и покупок существовали задолго до того, как был придуман термин «мэшап». До появления Web API существовало довольно много инструментов для покупок, таких как BizRate, PriceGrabber, MySimon и Google Froogle, которые использовали технологию B2B или очистку экрана для сбора соответствующих данных о ценах. Чтобы облегчить разработку гибридных веб-приложений и других интересных веб-приложений, потребительские сайты, такие как eBay и Amazon, выпустили собственные API для программного доступа к своему контенту.
Источники новостейNews Mashup
(такие как New York Times, BBC или Reuters) используют технологии синдикации, такие как RSS и Atom, с 2002 года для публикации новостных лент по различным темам. Коллаж, основанный на технологии федерации, может агрегировать ленту пользователей и отображать ее в Интернете для создания персонализированной газеты, адаптированной к уникальным интересам читателя. Diggdot.us — один из таких примеров, объединяющий технологический контент с Digg.com, Slashdot.org и Del.icio.us.
3. Технические проблемы
Как и другие области интеграции данных, разработка гибридных приложений также сопряжена со многими техническими проблемами, которые необходимо решить. По мере дальнейшего расширения возможностей и функций гибридных приложений эта проблема становится все более серьезной. В этом разделе кратко представлены некоторые проблемы, некоторые из которых теперь можно решить или смягчить, тогда как другие остаются нерешенными.
Проблемы интеграции данных. Исследования качества семантики и качества данных
показывают, что основной задачей современных корпоративных ИТ является интеграция данных в корпоративных виртуальных организациях. (В данном случае мы используем термин «виртуальная организация» для обозначения комбинации многих объединенных бизнес-единиц, каждое из которых находится в своем собственном административном домене.) Многие организации заняты интеграцией традиционных источников данных, таких как ИТ-менеджеры предприятий (например, создавая корпоративные информационные панели, отражающие текущие условия бизнеса), разработчики коллажей сталкиваются с аналогичными проблемами, возникающими из-за совместного использования семантики между разнородными наборами данных. Итак, чтобы понять, как к этому готовятся разработчики коллажей, достаточно понять проблемы интеграции, стоящие перед корпоративными ИТ-отделами.
Например, нам нужно разработать системы преобразования между моделями данных. При преобразовании данных в общий формат, когда сопоставление неполное (например, один источник данных может иметь модель, в которой один тип адреса содержит поле страны, а в другой модели это поле отсутствует), мы должны сделать некоторое разумное предположение. . Несмотря на то, что с этими проблемами сталкивались, разработчики коллажей могут не быть экспертами в области моделей исходных данных, поскольку эти модели могут быть продуктами третьих сторон, и эти разумные предположения могут не быть интуитивно понятными и ясными, что усугубляет серьезность проблемы.
Помимо отсутствующих данных и неполного сопоставления, разработчики коллажей могут обнаружить, что данные, которые они хотят интегрировать, не подходят для машинной автоматизации, это потребует большого объема работы по очистке. Например, записи об арестах правоохранительных органов могут быть непоследовательными: в записях могут использоваться общепринятые сокращения имен (например, «mkt sqr» в одной записи и «Рыночная площадь» в другой), что делает неясным, например, автоматический вывод об одних и тех же -сексуальное поведение становится очень трудным даже при наличии хороших эвристических правил. Технологии семантического моделирования, такие как RDF, могут помочь упростить задачу автоматического анализа различных наборов данных, встроенных в носитель данных. Что касается традиционных источников данных, то на анализ и очистку данных обычно вкладывается много человеческих и материальных ресурсов, прежде чем их можно будет использовать в технологии семантического моделирования.
Разработчикам гибридных приложений также, возможно, придется столкнуться с некоторыми проблемами, с которыми не приходится сталкиваться менеджерам по ИТ-интеграции, одна из которых — загрязнение данных. В рамках разработки приложения многие гибридные приложения требуют участия общедоступных пользователей. Исследования в области вики-приложений показывают, что это обоюдоострый меч: он может быть очень эффективным, поскольку допускает открытый вклад и лучшие в своем классе инновации в области данных, но может привести к непоследовательным, неверным или вводящим в заблуждение элементам данных. . Последнее может поставить под угрозу достоверность данных, что в конечном итоге снизит ценность гибридного приложения.
Другая проблема интеграции, с которой приходится сталкиваться разработчикам коллажей, связана с методами очистки экрана, которые необходимо использовать для получения данных. Как обсуждалось в предыдущем разделе, анализ и приобретение инструментов и моделей данных требуют большой работы, связанной с обратным проектированием. В лучшем случае эти инструменты и модели можно создать, но остается проблема с тем, как исходный сайт отображает собственный контент, что может нарушить процесс интеграции и вызвать ошибки в гибридном приложении.
Проблемы компонентов
Хотя модель веб-разработки Ajax может обеспечить более богатый и удобный пользовательский интерфейс, чем традиционные методы обновления всей страницы, она также создает некоторые проблемы. На базовом уровне Ajax требует использования возможностей браузера по написанию сценариев на стороне клиента с его собственным DOM для реализации метода доставки контента, который был полностью задуман разработчиками браузера. (Возможно, хакерская природа Ajax добавляет ему привлекательности.) Однако это подвергает приложения на основе Ajax тем же проблемам совместимости с браузером, которые преследуют веб-разработчиков с тех пор, как Microsoft разработала Internet Explorer. Например, механизм Ajax использует объект XMLHttpRequst для асинхронного обмена данными с удаленным сервером. В Internet Explorer 6 этот объект реализован с использованием ActiveX, а не собственного JavaScript, что требует включения ActiveX.
Более основное требование заключается в том, что Ajax требует включения JavaScript в браузере пользователя. Для большинства людей это может быть разумным предположением, но у некоторых конкретных пользователей их браузер или автоматизированный инструмент могут не поддерживать JavaScript или не включать поддержку JavaScript. К таким инструментам относятся роботы, пауки и веб-сканеры, которые собирают информацию для поисковых систем Интернета и интрасети. Без уступок в функциональности гибридные приложения на основе Ajax могут также потерять часть пользовательской базы и стать менее привлекательными для поисковых систем.
Использование JavaScript для асинхронного обновления содержимого на странице также создает проблемы с пользовательским интерфейсом. Поскольку контент больше не должен быть связан с URL-адресом в адресной строке браузера, пользователи могут не использовать функциональность кнопки НАЗАД или закладок браузера. Кроме того, хотя Ajax может уменьшить задержку, запрашивая дополнительные обновления контента, плохой дизайн может оказать негативное влияние на взаимодействие с пользователем, например, когда степень детализации обновлений очень мала, количество и загрузка обновлений занимают все доступные ресурсы. Кроме того, нам также необходимо позаботиться о том, как поддерживать пользователей при загрузке интерфейса или обновлении контента (например, с помощью технологии визуальной обратной связи, такой как индикаторы выполнения).
Как и в случае с любым распределенным междоменным приложением, существуют проблемы безопасности, которые необходимо учитывать разработчикам коллажей и поставщикам контента. Понятие идентичности может быть непростой темой, а традиционная сеть в первую очередь была создана для анонимного доступа. Единый вход в систему — желательная функция, но существует множество конкурирующих технологий (от Microsoft Passport до Liberty Alliance), которые могут привести к путанице в пространствах имен удостоверений, которые нам необходимо интегрировать. Поставщики контента могут использовать модели аутентификации и авторизации в своих собственных API (которые требуют концепции безопасных удостоверений или безопасных подтвержденных атрибутов) для реализации бизнес-моделей, включающих платные подписки или конфиденциальные данные. Конфиденциальные данные также могут требовать определенного уровня конфиденциальности (т. е. шифрования), и мы должны знать, когда интегрировать их с другими ресурсами, не создавая при этом риска. Идентичность также важна для аудита и соблюдения нормативных требований. Кроме того, поскольку интеграция данных происходит как на стороне сервера, так и на стороне клиента, делегирование удостоверений и сертификатов от пользователя службе гибридных приложений также может стать требованием.
4. Социальные проблемы
В дополнение к техническим проблемам, описанным в предыдущем разделе, с дальнейшей популярностью коллажей также возникли (или вот-вот возникнут) некоторые социальные проблемы.
Одна из наиболее серьезных социальных проблем, с которыми приходится сталкиваться разработчикам гибридных приложений, — это найти баланс между защитой интеллектуальной собственности и конфиденциальности потребителей и гласностью и свободным потоком информации. Ничего не подозревающие поставщики контента (объект очистки экрана), поставщики контента, которые предоставляют API для облегчения поиска данных, возможно, должны будут определить, используется ли их контент другими способами, которые они не одобрили. Веб-приложения коллажей все еще находятся в зачаточном состоянии, и некоторые любители пишут коллажи в свободное время. Эти разработчики могут не знать (или не интересоваться) такими проблемами, как безопасность. Кроме того, поставщики контента только начинают осознавать ценность предоставления API для машинного доступа к контенту, и многие не считают это основной бизнес-задачой. Все это в совокупности приводит сегодня к низкому качеству программного обеспечения, поскольку такие усилия, как тестирование и обеспечение качества, имеют меньший приоритет, чем проверка концепции и инновации. Чтобы способствовать зрелости процесса разработки программного обеспечения, сообщество должно работать вместе над разработкой открытых стандартов и наборов инструментов многократного использования.
Прежде чем коллажи смогут превратиться из классной игрушки в программное приложение, необходимо проделать большую работу по формулированию высоконадежных стандартов, протоколов, моделей и наборов инструментов. Для этого крупные пионеры индустрии разработки программного обеспечения, поставщики контента и предприниматели должны признать ценность коллажей как жизнеспособной бизнес-модели. Поставщикам API необходимо определить, взимать ли плату за свой контент и, если да, то как взимать за него плату (например, по подписке или за использование). Возможно, они обеспечат разный уровень качества обслуживания. Некоторые поставщики торговых площадок, такие как eBay или Amazon, могут обнаружить, что бесплатные API увеличат оборот продуктов. Разработчики коллажей могут захотеть использовать модель дохода, основанную на рекламе, или создать интересные гибридные приложения, чтобы добиться признания.
Заключение
Мэшапы действительно являются довольно новым веб-приложением. Сочетание методов моделирования данных, полученных из семантической сети, и слабосвязанных, сервис-ориентированных, независимых от платформы протоколов связи в конечном итоге обеспечит инфраструктуру, необходимую для разработки приложений, которые смогут полностью использовать и интегрировать большие объемы веб-информации. Поскольку гибридные приложения привлекают все больше и больше внимания, важно понимать, как они будут способствовать решению определенных социальных проблем (например, проблемы между общественным использованием и защитой интеллектуальной собственности) и других областей приложений (интеграция данных за пределами организационных границ, таких как Интернет). ). Будет интересно посмотреть, как это повлияет на грид-вычисления и управление рабочими процессами B2B.