لفهم المزيد حول ماهية المزج، يجب أن تنظر إلى أصول الكلمة: فهي تأتي من موسيقى البوب، والمزج عبارة عن مزيج من الأغاني والمسارات الموسيقية من أغنيتين مختلفتين (عادةً ما تنتميان إلى أنواع مختلفة من الأغاني الجديدة). . في هذا النوع من Mashup، نستكشف عمليات المزج الشائعة،
1. المقدمة
يظهر تدريجيًا نوع جديد من تطبيقات تكامل البيانات المستندة إلى الويب على الإنترنت. غالبًا ما يشار إليها بمصطلح mashups، وتنبع شعبيتها من التركيز الشبيه بفرانكنشتاين على مشاركة المستخدم التفاعلية ودمج بيانات الطرف الثالث. نحن نستخدم كلمة sprout لسبب ما؛ حيث تتميز مواقع الويب المزججة بظهورها على الويب، والاستفادة من المحتوى والوظائف من مصادر البيانات خارج حدود المؤسسة.
من المؤكد أن تعريف تكامل البيانات المشفرة للمزج ليس صارمًا للغاية. لفهم المزيد حول ماهية المزج، يجب أن تنظر إلى أصول الكلمة: فهي تأتي من موسيقى البوب، والمزج عبارة عن مزيج من الأغاني والمسارات الموسيقية من أغنيتين مختلفتين (عادةً ما تنتميان إلى أنواع مختلفة من الأغاني الجديدة). . مثل أغاني "bastard pop"، فإن عمليات المزج عبارة عن مجموعات غير عادية ومبتكرة من المحتوى (غالبًا ما تكون مستمدة من مصادر غير ذات صلة) والتي يتم تركيبها بواسطة البشر (وليس بواسطة أجهزة الكمبيوتر).
إذًا، كيف يبدو المزج؟ يحتوي موقع الويب ChicagoCrime.org على مثال بديهي للغاية يشرح ما هو المزج بين الخرائط. كان أحد أوائل عمليات المزج التي أصبحت شائعة على نطاق واسع هو موقع الويب الذي يجمع السجلات الجنائية من قاعدة بيانات قسم شرطة شيكاغو على الإنترنت مع خرائط من خرائط جوجل. يمكن للمستخدمين التفاعل مع موقع المزج، على سبيل المثال عن طريق إخباره بعرض واجهة رسومية بخريطة تحتوي على دبابيس تثبيت تعرض تفاصيل جميع عمليات الغزو المنزلية الأخيرة في جنوب كاليفورنيا. المفهوم والعرض بسيطان للغاية، وإمكانيات التصور التي يوفرها الجمع بين بيانات الجريمة والخرائط قوية جدًا.
في هذا النوع من عمليات المزج، نستكشف عمليات المزج الشائعة، بما في ذلك عمليات مزج الخرائط. يتم توفير مقدمة موجزة عن المشهد الفني المتعلق ببناء وتشغيل عمليات المزج. يقدم قسم التحديات التقنية والتحديات الاجتماعية التحديات التقنية الرئيسية والتحديات الاجتماعية التي تؤثر على عمليات المزج على التوالي.
2. أنواع المزج
في هذا القسم، سنقدم بإيجاز بعض الدراسات الاستقصائية لأنواع المزج المعروفة.
Map Mashup
في هذه المرحلة من تكنولوجيا المعلومات، يقوم الأشخاص بجمع كمية كبيرة من البيانات حول الأشياء والسلوكيات، وكلاهما غالبًا ما يحتوي على معلومات توضيحية للموقع. يمكن عرض جميع مجموعات البيانات المختلفة التي تحتوي على بيانات الموقع بيانيًا بطرق مذهلة باستخدام الخرائط. إحدى القوى الدافعة الرئيسية وراء الطفرة في عمليات المزج هي إصدار Google العام لواجهة برمجة التطبيقات لخرائط Google. وهذا يفتح الباب أمام مطوري الويب (الهواة، ومطوري التصحيح، وغيرهم) ليكونوا قادرين على تضمين جميع أنواع البيانات في الخرائط (من كوارث القنبلة الذرية إلى أبقار CowParade في بوسطن). ومن أجل عدم التخلف عن الآخرين، كشفت Microsoft (Virtual Earth) وYahoo (Yahoo Maps) وAOL (MapQuest) بسرعة عن واجهات برمجة التطبيقات الخاصة بهم.
عمليات مزج الصور والفيديو
أدى ظهور مضيفي الصور ومواقع الشبكات الاجتماعية (مثل Flickr، الذي يستخدم واجهة برمجة التطبيقات الخاصة به لمشاركة الصور) إلى ظهور العديد من عمليات المزج المثيرة للاهتمام. نظرًا لأن موفري المحتوى لديهم بيانات تعريف مرتبطة بالصور التي يحفظونها (مثل من التقط الصورة، وموضوع الصورة، ومتى وأين تم التقاطها، وما إلى ذلك)، يمكن لمصممي المزج دمج هذه الصور وغيرها مع البيانات التعريفية ووضع المعلومات ذات الصلة معاً. على سبيل المثال، يمكن أن يقوم برنامج المزج بتحليل أغنية أو قصيدة لدمج الصور ذات الصلة معًا، أو عرض رسم بياني لشبكة اجتماعية استنادًا إلى البيانات التعريفية للصورة نفسها (العنوان، أو الطابع الزمني، أو بيانات التعريف الأخرى). مثال آخر قد يأخذ موقع ويب (على سبيل المثال، موقع إخباري مثل CNN) كمدخل، ويقدم المحتوى الموجود في الصورة في شكل نص من خلال مطابقة الصور في الأخبار.
عمليات المزج للبحث والتسوق
كانت عمليات المزج للبحث والتسوق موجودة قبل وقت طويل من صياغة مصطلح mashup. قبل ظهور Web API، كان هناك عدد لا بأس به من أدوات التسوق، مثل BizRate وPriceGrabber وMySimon وGoogle’s Froogle، والتي استخدمت جميعها تقنية B2B أو تجريف الشاشة لتجميع بيانات الأسعار ذات الصلة. لتسهيل تطوير عمليات المزج وتطبيقات الويب الأخرى المثيرة للاهتمام، أصدرت مواقع المستهلكين مثل eBay وAmazon واجهات برمجة التطبيقات الخاصة بها للوصول البرمجي إلى محتواها.
تستخدم مصادر الأخبار
News Mashup
(مثل New York Times أو BBC أو Reuters) تقنيات المشاركة مثل RSS وAtom منذ عام 2002 لنشر خلاصات الأخبار حول موضوعات مختلفة.يمكن للمزج القائم على تقنية الاتحاد تجميع موجز المستخدم وعرضه عبر الويب لإنشاء صحيفة مخصصة مصممة خصيصًا لتلبية اهتمامات القارئ الفريدة. يعد Diggdot.us أحد الأمثلة على ذلك، حيث يقوم بدمج المحتوى المتعلق بالتكنولوجيا من Digg.com وSlashdot.org وDel.icio.us.
3. التحديات التقنية
مثل مجالات تكامل البيانات الأخرى، فإن تطوير المزج مليء أيضًا بالعديد من التحديات التقنية التي تحتاج إلى حل، ومع إثراء ميزات ووظائف تطبيقات المزج، أصبح هذا التحدي أكثر خطورة. يعرض هذا القسم بإيجاز بعض التحديات، والتي يمكن الآن حل بعضها أو التخفيف منها، بينما يظل بعضها الآخر دون حل.
تحديات تكامل البيانات: تُظهر الدراسات الاستقصائية لجودة البيانات والدلالات
أن الاهتمام الرئيسي لتكنولوجيا المعلومات في المؤسسات اليوم هو تكامل البيانات في المؤسسات الافتراضية للمؤسسة. (في هذه الحالة، نستخدم مصطلح المنظمة الافتراضية للإشارة إلى مجموعة من العديد من وحدات الأعمال الموحدة، كل منها موجودة في المجال الإداري الخاص بها.) مع العديد من المؤسسات التي تجد نفسها مشغولة بدمج مصادر البيانات التقليدية مثل مديري تكنولوجيا المعلومات في المؤسسات (على سبيل المثال، من خلال إنشاء لوحات معلومات مؤسسية تعكس ظروف العمل الحالية)، يواجه مطورو تطبيقات mashup تحديات مماثلة تنشأ عن مشاركة الدلالات بين مجموعات البيانات غير المتجانسة. لذا، لفهم كيف يستعد مطورو برامج المزج لهذا الغرض، لا يحتاج المرء إلا إلى فهم تحديات التكامل التي تواجه تكنولوجيا المعلومات في المؤسسات.
على سبيل المثال، يتعين علينا تصميم أنظمة التحويل بين نماذج البيانات. عند تحويل البيانات إلى تنسيق شائع، عندما يكون التعيين غير مكتمل (على سبيل المثال، قد يحتوي مصدر بيانات واحد على نموذج يحتوي فيه نوع عنوان واحد على حقل بلد، ولكن لا يحتوي نموذج آخر على هذا الحقل)، يجب علينا القيام ببعض الافتراضات المعقولة . على الرغم من مواجهة هذه التحديات، إلا أن مطوري المزج قد لا يكونون خبراء في مجال نموذج البيانات المصدر، لأن هذه النماذج قد تكون منتجات تابعة لجهات خارجية، وقد لا تكون هذه الافتراضات المعقولة بديهية وواضحة، مما يؤدي إلى تفاقم خطورة التحدي.
بالإضافة إلى البيانات المفقودة ورسم الخرائط غير المكتمل، قد يجد مصممو المزج أن البيانات التي يرغبون في دمجها غير مناسبة لأتمتة الآلة، وسيتطلب ذلك الكثير من أعمال التطهير. على سبيل المثال، قد تكون سجلات القبض على جهات إنفاذ القانون غير متسقة: قد تستخدم السجلات اختصارات شائعة للأسماء (على سبيل المثال، "mkt sqr" في أحد السجلات و"Market Square" في سجل آخر)، مما يجعل من غير الواضح ما إذا كان، على سبيل المثال، الاستدلال التلقائي حول نفس - يصبح السلوك الجنسي صعبًا للغاية، حتى مع وجود قواعد إرشادية جيدة. يمكن أن تساعد تقنيات النمذجة الدلالية، مثل RDF، في تبسيط مشكلة التفكير التلقائي بين مجموعات البيانات المختلفة المضمنة في وسط تخزين البيانات. بالنسبة لمصادر البيانات التقليدية، عادة ما يتم استثمار الكثير من القوى العاملة والموارد المادية في تحليل وتنقية البيانات قبل استخدامها في تكنولوجيا النمذجة الدلالية.
قد يتعين على مطوري Mashup أيضًا مواجهة بعض المشكلات التي لا يتعين على مديري تكامل تكنولوجيا المعلومات مواجهتها، ومن بينها تلوث البيانات. كجزء من تصميم التطبيق، تتطلب العديد من عمليات المزج مدخلات من المستخدمين العموميين. تظهر الأبحاث في مجال تطبيقات الويكي أن هذا سيف ذو حدين: يمكن أن يكون قويًا للغاية لأنه يسمح بالمساهمات المفتوحة وابتكار البيانات الأفضل في فئتها، ولكنه قد يؤدي إلى عناصر بيانات غير متسقة أو غير صحيحة أو مضللة . وقد يؤدي هذا الأخير إلى تعريض مصداقية البيانات للخطر، مما يؤدي في النهاية إلى تقليل القيمة التي يجلبها المزج.
هناك مشكلة تكامل أخرى يتعين على مطوري برامج المزج مواجهتها، وهي تنشأ من تقنيات تجريف الشاشة التي يجب استخدامها للحصول على البيانات. كما تمت مناقشته في القسم السابق، يتطلب التحليل والحصول على الأدوات ونماذج البيانات الكثير من العمل المتعلق بالهندسة العكسية. في أفضل السيناريوهات، يمكن إنشاء هذه الأدوات والنماذج، ولكن لا تزال هناك مشكلة تتعلق بكيفية عرض الموقع المصدر للمحتوى الخاص به، مما قد يؤدي إلى تعطيل عملية التكامل والتسبب في حدوث أخطاء في تطبيق Mashup.
تحديات المكونات
على الرغم من أن نموذج Ajax لتطوير الويب يمكن أن يوفر تجربة مستخدم أكثر ثراءً وسلاسة من تقنيات التحديث التقليدية للصفحة بأكملها، إلا أنه يطرح أيضًا بعض التحديات. في مستواه الأساسي، يتطلب Ajax استخدام إمكانات البرمجة النصية من جانب العميل للمتصفح مع DOM الخاص به لتنفيذ طريقة تسليم المحتوى التي تم تصورها بالكامل من قبل مصممي المتصفح. (ربما تزيد طبيعة Ajax الشبيهة بالقرصنة من جاذبيتها.) ومع ذلك، فإن هذا يُخضع التطبيقات المستندة إلى Ajax لنفس مشكلات توافق المتصفح التي ابتلي بها مطورو الويب منذ أن قامت Microsoft بتطوير Internet Explorer. على سبيل المثال، يستخدم محرك Ajax كائن XMLHttpRequst لتبادل البيانات بشكل غير متزامن مع الخادم البعيد. في Internet Explorer 6، يتم تنفيذ هذا الكائن باستخدام ActiveX بدلاً من JavaScript الأصلي، الأمر الذي يتطلب تمكين ActiveX.
الشرط الأساسي هو أن Ajax يتطلب تمكين JavaScript على متصفح المستخدم. قد يكون هذا افتراضًا معقولًا بالنسبة لمعظم الأشخاص، ولكن بالنسبة لبعض المستخدمين المحددين، قد لا يدعم المتصفح أو الأداة الآلية الخاصة بهم JavaScript، أو قد لا يكون دعم JavaScript ممكّنًا. وتشمل هذه الأدوات الروبوتات والعناكب وبرامج زحف الويب التي تجمع المعلومات لمحركات البحث على الإنترنت والإنترانت. بدون التنازلات الوظيفية، قد تجد تطبيقات المزج المستندة إلى Ajax نفسها أيضًا تفقد بعض قاعدة المستخدمين وتصبح أقل جاذبية لمحركات البحث.
يؤدي استخدام JavaScript لتحديث المحتوى بشكل غير متزامن على الصفحة أيضًا إلى حدوث مشكلات في واجهة المستخدم. نظرًا لأن المحتوى لم يعد بحاجة إلى الارتباط بعنوان URL الموجود في شريط عنوان المتصفح، فقد لا يتمكن المستخدمون من تجربة وظيفة زر BACK أو الإشارات المرجعية في المتصفح. بالإضافة إلى ذلك، على الرغم من أن Ajax يمكنه تقليل زمن الوصول عن طريق طلب تحديثات المحتوى المتزايدة، إلا أن التصميم السيئ قد يكون له تأثير سلبي على تجربة المستخدم، على سبيل المثال، عندما تكون تفاصيل التحديث صغيرة جدًا، فإن عدد التحديثات وتحميلها يشغل جميع الموارد المتاحة. بالإضافة إلى ذلك، نحتاج أيضًا إلى الاهتمام بكيفية دعم المستخدمين عند تحميل الواجهة أو تحديث المحتوى (على سبيل المثال، استخدام تقنية التعليقات المرئية مثل أشرطة التقدم).
كما هو الحال مع أي تطبيق موزع عبر النطاق، هناك مخاوف أمنية يجب على مطوري تطبيقات المزج وموفري المحتوى معالجتها. يمكن أن يكون مفهوم الهوية موضوعًا شائكًا، وقد تم إنشاء شبكة الويب التقليدية في المقام الأول للوصول المجهول. يعد تسجيل الدخول الموحد ميزة مرغوبة، ولكن هناك العديد من التقنيات المتنافسة (من Microsoft Passport إلى Liberty Alliance) التي يمكن أن تؤدي إلى فوضى في مساحات أسماء الهوية التي يجب علينا دمجها. قد يعتمد موفرو المحتوى نماذج المصادقة والترخيص في واجهات برمجة التطبيقات الخاصة بهم (والتي تتطلب مفهوم الهويات الآمنة أو السمات المؤكدة الآمنة) لفرض نماذج الأعمال التي تتضمن اشتراكات مدفوعة أو بيانات حساسة. قد تتطلب البيانات الحساسة أيضًا مستوى معينًا من السرية (أي التشفير)، ويجب أن نعرف متى يجب دمجها مع الموارد الأخرى دون التعرض للمخاطر. الهوية مهمة أيضًا للتدقيق والامتثال التنظيمي. بالإضافة إلى ذلك، نظرًا لأن تكامل البيانات يحدث على كل من جانب الخادم والعميل، فقد يصبح تفويض الهوية والشهادة من المستخدم إلى خدمة Mashup أمرًا ضروريًا أيضًا.
4. التحديات الاجتماعية
بالإضافة إلى التحديات التقنية التي تم تقديمها في القسم السابق، مع زيادة شعبية عمليات المزج، ظهرت أيضًا بعض المشكلات الاجتماعية (أو على وشك الظهور).
إحدى المشكلات الاجتماعية الأكثر خطورة التي يتعين على مطوري برامج المزج مواجهتها هي تحقيق التوازن بين حماية الملكية الفكرية وخصوصية المستهلك مقابل الدعاية والتدفق الحر للمعلومات. قد يحتاج موفرو المحتوى المطمئنون (هدف استخلاص الشاشة)، وموفرو المحتوى الذين يقدمون واجهات برمجة التطبيقات لتسهيل استرجاع البيانات، إلى تحديد ما إذا كان المحتوى الخاص بهم يستخدمه آخرون بطريقة لم يوافقوا عليها. لا تزال تطبيقات Mashup Web في مهدها، حيث يقوم بعض الهواة بكتابة تطبيقات مزج في أوقات فراغهم. قد لا يكون هؤلاء المطورون على علم (أو يهتمون) بقضايا مثل الأمان. بالإضافة إلى ذلك، بدأ موفرو المحتوى للتو في رؤية قيمة توفير واجهات برمجة التطبيقات (APIs) للوصول إلى المحتوى عبر الأجهزة، ولا يرى الكثير منهم أن هذا يمثل اهتمامًا تجاريًا أساسيًا. كل هذا يجتمع ليؤدي إلى برامج منخفضة الجودة اليوم، حيث يتم إعطاء الأولوية للجهود مثل الاختبار وضمان الجودة أقل من إثبات المفهوم والابتكار. لتعزيز نضج عملية تطوير البرمجيات، يجب على المجتمع العمل معًا ككل لتطوير معايير مفتوحة ومجموعات أدوات قابلة لإعادة الاستخدام.
قبل أن تتمكن عمليات المزج من الانتقال من لعبة رائعة إلى تطبيق برمجي، يجب القيام بالكثير من العمل لصياغة معايير وبروتوكولات ونماذج ومجموعات أدوات قوية للغاية. وللقيام بذلك، يجب على رواد صناعة تطوير البرمجيات ومقدمي المحتوى ورجال الأعمال أن يدركوا قيمة عمليات المزج كنموذج أعمال قابل للتطبيق. يحتاج موفرو واجهة برمجة التطبيقات (API) إلى تحديد ما إذا كانوا سيفرضون رسومًا مقابل المحتوى الخاص بهم، وإذا كان الأمر كذلك، كيفية تحصيل رسوم مقابل ذلك (على سبيل المثال، عن طريق الاشتراك أو لكل استخدام). ربما سيوفرون مستويات مختلفة من جودة الخدمة. قد يجد بعض موفري خدمات السوق، مثل eBay أو Amazon، أن واجهات برمجة التطبيقات المجانية ستزيد من معدل دوران المنتج. قد يرغب مطورو Mashup في اتباع نموذج إيرادات قائم على الإعلانات، أو إنشاء تطبيقات Mashup مثيرة للاهتمام للحصول على التقدير.
الاستنتاج:
يعد Mashups بالفعل تطبيق ويب جديدًا إلى حد ما. إن الجمع بين تقنيات نمذجة البيانات المستمدة من الويب الدلالي وبروتوكولات الاتصال المستقلة عن النظام الأساسي والموجهة نحو الخدمة ستوفر في نهاية المطاف البنية التحتية اللازمة لتطوير التطبيقات التي يمكنها استغلال ودمج كميات كبيرة من معلومات الويب بشكل كامل. نظرًا لأن تطبيقات المزج تكتسب المزيد والمزيد من الاهتمام، فمن المهم فهم كيفية مساهمتها في بعض القضايا الاجتماعية (مثل المشكلة بين الاستخدام العام وحماية الملكية الفكرية) ومجالات التطبيق الأخرى (دمج البيانات عبر الحدود التنظيمية، مثل الإنترنت ). سيكون من المثير للاهتمام أن نرى كيف يؤثر ذلك على الحوسبة الشبكية وإدارة سير العمل بين الشركات.