[คำนำ] จริงๆ แล้วมีหลายวิธีในการรับข้อมูลสำหรับการวิเคราะห์เว็บไซต์ ตัวอย่างเช่น ใช้ข้อมูลบันทึกของเซิร์ฟเวอร์ หรือติดตั้งซอฟต์แวร์การตรวจสอบบางอย่างบนไคลเอนต์ วิธีการรับข้อมูลเพื่อการวิเคราะห์เว็บไซต์โดยใช้วิธีแท็กเพจนั้นแตกต่างจากสองวิธีก่อนหน้านี้ แต่เมื่อเกิดขึ้นแล้ว ก็ทำให้ทุกคนตกใจและกลายเป็นวิธีกระแสหลักอย่างรวดเร็ว อันที่จริง หัวข้อเกือบทั้งหมดในบล็อกของฉัน ( http://www.chinawebanalytics.cn ) อิงตามมาร์กอัปหน้า บทความวันนี้จะพาเพื่อนๆ มาทำความเข้าใจอีกครั้งว่าการวิเคราะห์เว็บไซต์ที่ติดแท็กหน้าคืออะไร และข้อมูลใน Omniture Site Catalyst หรือรายงานการวิเคราะห์เว็บไซต์ Google Analytics ที่เราอ่านทุกวันถูกบันทึกอย่างไร
เนื่องจากฉันกำลังเดินทางไปทำธุรกิจฉันจึงมีเวลาเขียนบล็อกน้อยลง บทความนี้ตัดตอนมาจากหนังสือที่ฉันกำลังเขียนเกี่ยวกับพื้นฐานของการวิเคราะห์เว็บไซต์ ฉันหวังว่าหนังสือเล่มนี้จะใช้ได้กับทุกคนในปีหน้า
【ข้อความ】
เมื่อพูดถึงการเก็บข้อมูลเพื่อการวิเคราะห์เว็บไซต์ ทุกคนควรมีความรู้เบื้องต้นก่อน นั่นคือ หลักการพื้นฐานของการวิเคราะห์เว็บไซต์มาร์กอัปหน้าและการวิเคราะห์เว็บไซต์ด้วยวิธีบันทึกมีความแตกต่างกันโดยสิ้นเชิง เกี่ยวกับหลักการวิเคราะห์เว็บไซต์โดยใช้วิธีการบันทึก โปรดอ่านโพสต์นี้: หลักการ ข้อดี และข้อเสียของการวิเคราะห์เว็บไซต์ด้วยวิธีบันทึกเซิร์ฟเวอร์ ก่อนหน้านี้เพื่อนคนหนึ่งฝากข้อความไว้บน Weibo โดยคิดว่า AWStats, Omniture และ WebTrends ล้วนเป็นเครื่องมือวิเคราะห์บันทึก แต่ Omniture ใช้วิธีการ asp ดังนั้นจึงไม่แตกต่างกัน มุมมองนี้เข้าใจผิดโดยสิ้นเชิง ที่จริงแล้วเครื่องมือทั้งสามนั้นแตกต่างกัน AWStats คือเครื่องมือวิเคราะห์บันทึกที่ให้บริการฟรี WebTrends เดิมทีเป็นเครื่องมือวิเคราะห์บันทึกเพียงอย่างเดียว แต่ต่อมาได้เพิ่มฟังก์ชันการแท็กหน้า Omniture SiteCatalyst ถือกำเนิดขึ้นมาในฐานะเครื่องมือที่ใช้การแท็กเพจ และจนถึงขณะนี้ Omniture ยังไม่มีเครื่องมือสำหรับการวิเคราะห์บันทึก
ดังนั้นวันนี้เราจะพูดถึงหลักการรับข้อมูลผ่านการวิเคราะห์เว็บไซต์โดยใช้การแท็กหน้าเท่านั้น เริ่มต้นด้วยเกม
มาร์กอัปหน้าคืออะไร
ทุกท่านได้เล่นเกม StarCraft (StarCraft Generation 1) ของ Blizzard กันหรือยัง? ฉันเป็นแฟนตัวยงของเกมนี้ ราชินีแห่งเซิร์กมีความสามารถพิเศษในการพ่นปรสิตใส่หน่วยปฏิบัติการของศัตรู ด้วยวิธีนี้ ไม่ว่าหน่วยปฏิบัติการจะไปที่ไหนก็ตาม เซิร์กสายลับผู้ภักดีจะมองเห็นสถานการณ์รอบตัวได้อย่างชัดเจน
หรือทุกคนเคยไปที่ธนาคารแล้ว กล้องที่วางทุกที่ในธนาคารจะบันทึกทุกการเคลื่อนไหวที่เราทำจริง แล้วจึงถ่ายโอนไปยังอุปกรณ์จัดเก็บข้อมูลเพื่อจัดเก็บ
ดังนั้นคำอุปมาที่ไม่เหมาะสมหรือที่เรียกว่ามาร์กอัปของหน้าก็เปรียบเสมือนปรสิตที่ "พ่น" บนหน้าหรือกล้องที่ติดตั้งบนหน้าบันทึกทุกการเคลื่อนไหวของผู้เยี่ยมชมบนหน้าแล้วส่งต่อไปยัง ที่เกี่ยวข้อง องค์กรหรือบุคคลที่ต้องการทราบเกี่ยวกับเว็บไซต์นี้
รูปด้านล่างแสดงถึงกระบวนการนี้:
แท็กหน้ามีลักษณะเหมือนชิ้นสีแดงเล็กๆ ในรูปภาพ จริงๆ แล้วเป็นคำสั่งโปรแกรม JavaScript ที่เบราว์เซอร์สามารถดำเนินการได้ และวางไว้ในไฟล์ต้นฉบับ HTML ของหน้า ด้วยวิธีนี้ เมื่อเพจถูกดาวน์โหลดไปยังเบราว์เซอร์ของลูกค้า โปรแกรม Javascript ที่ทำเครื่องหมายไว้ในเพจนี้จะถูกดำเนินการ เช่นเดียวกับปรสิตใน StarCraft หรือกล้องเปิดอยู่
หลังจากดำเนินการโค้ด JavaScript ของเครื่องหมายหน้าแล้ว พฤติกรรมการเข้าถึงแบบโต้ตอบของผู้เข้าชมบนหน้าเว็บจะถูกส่งไปยังเซิร์ฟเวอร์ของเครื่องมือวิเคราะห์เว็บไซต์ที่สอดคล้องกับเครื่องหมายหน้าอย่างต่อเนื่องและต่อเนื่อง ซึ่งเหมือนกับที่กล้องส่งภาพที่ถ่าย ไปยังเซิร์ฟเวอร์จัดเก็บรูปภาพจะเหมือนกันทุกประการ หลังจากที่เซิร์ฟเวอร์เครื่องมือวิเคราะห์เว็บไซต์ได้รับข้อมูลแล้ว เซิร์ฟเวอร์จะประมวลผลข้อมูลเพิ่มเติมและแปลข้อมูลเป็นกราฟิก ตาราง และไฟล์ข้อมูลที่ผู้คนสามารถอ่านและวิเคราะห์ได้ จากนั้นนำเสนอบนอินเทอร์เฟซผู้ใช้ที่สวยงาม Google Analytics ที่ใช้กันทั่วไปของเราเป็นวิธีการรวบรวมข้อมูลดังกล่าว
อย่างที่คุณเห็น วิธีการมาร์กหน้าโดยพื้นฐานแล้วแตกต่างจากวิธีการบันทึก
1. วิธีการบันทึกคือการแยกข้อมูลจากไฟล์บันทึกเพื่อการวิเคราะห์ ในขณะที่แท็กเพจจำเป็นต้องเพิ่ม "หน่วยสอดแนม" ขนาดเล็กลงในเพจ ซึ่งหมายความว่าจะต้องอาศัยบุคคลที่สามเพื่อรับข้อมูล
2. เนื่องจาก "หน่วยสอดแนม" เพิ่มเติมเล็กๆ น้อยๆ นี้ วิธีการทำเครื่องหมายหน้าจำเป็นต้องแก้ไขไฟล์ต้นฉบับ HTML ของหน้า แต่วิธีการบันทึกไม่ได้แก้ไข
3. วิธีการบันทึกจะรอให้คุณประมวลผลข้อมูล หากคุณไม่ประมวลผล ข้อมูลจะเป็นบันทึกที่ซื่อสัตย์และเข้มงวด เพื่อวิเคราะห์
เรามาพูดถึงประวัติเล็กน้อยที่นี่ ในยุคแรกๆ ของอินเทอร์เน็ต เว็บไซต์มีขนาดเล็กและมีโครงสร้างที่เรียบง่าย และวิธีการบันทึกข้อมูลครอบงำโลก อย่างไรก็ตาม อินเทอร์เน็ตพัฒนาเร็วเกินไป และซอฟต์แวร์ ฮาร์ดแวร์ และสถาปัตยกรรมเชิงตรรกะของเว็บไซต์ก็มีมากขึ้นเรื่อยๆ ซับซ้อน มีปัญหามากมายที่ต้องแก้ไขด้วยวิธีบันทึก ความยากลำบากเพิ่มขึ้น ความยากในการนำไปใช้งานเพิ่มขึ้นอย่างมาก และผู้คนจำเป็นต้องค้นหาวิธีที่ง่ายกว่าในการบรรลุเป้าหมาย ด้วยความนิยมของ JavaScript และการเกิดขึ้นของ SaaS (Software as a Service, Software as a Service) วิธีการมาร์กอัปหน้าจึงเกิดขึ้น วิธีนี้ใช้งานง่าย และไม่จำเป็นต้องจัดการกับบันทึกไฟล์บันทึกขนาดใหญ่ การจัดการข้อมูล และประสิทธิภาพการประมวลผลได้รับการปรับปรุงอย่างมาก และกลายเป็นตัวเลือกแรกของผู้ดูแลเว็บจำนวนมากอย่างรวดเร็ว เนื่องจากข้อดีหลายประการ เช่น ความเรียบง่าย ความสามารถในการอ่านข้อมูลสูง และความยากลำบากในการจัดการต่ำ วิธีการติดแท็กหน้าเว็บจึงกลายเป็นวิธีการเก็บข้อมูลหลักในศาสตร์แห่งการวิเคราะห์เว็บไซต์ บล็อกของฉันจึงเน้นไปที่วิธีนี้ทั้งหมดมากกว่าวิธีการบันทึก จะมีการหารือในรายละเอียด
การอ่านที่น่าสนใจ: ความแตกต่างระหว่างโค้ดการตรวจสอบและแท็กการตรวจสอบ
ในกิจกรรมเชิงปฏิบัติเฉพาะของการวิเคราะห์เว็บไซต์ เรามักจะผสมวิธีแท็กติดตามสองวิธีที่แตกต่างกัน - โค้ดติดตามและแท็กติดตาม แต่จริงๆ แล้วมันเป็นคนละเรื่องกัน และถ้าเราแยกแยะได้อย่างเคร่งครัด ก็จะช่วยให้เราสื่อสารได้แม่นยำมากขึ้น
โค้ดหมายถึงคำสั่งในโปรแกรมที่ปฏิบัติการได้ ดังนั้นโค้ดการตรวจสอบจึงหมายถึงคำสั่งของโปรแกรมที่ปฏิบัติการได้ซึ่งเขียนขึ้นเพื่อวัตถุประสงค์ในการตรวจสอบ รหัสตรวจสอบทั่วไปที่สุดคือรหัสตรวจสอบ JavaScript ของ Google Analytics ที่เราเพิ่มลงในเพจ
แท็ก หมายถึงตัวระบุที่เพิ่มเพื่อระบุวัตถุการตรวจสอบ ตัวระบุนี้ไม่ใช่คำสั่งของโปรแกรมและไม่สามารถดำเนินการได้ แต่โปรแกรมสามารถรับรู้ได้และใช้เพื่อกำหนดคุณลักษณะเฉพาะของวัตถุการตรวจสอบ ตัวอย่างเช่น นี่คือ URL: http://www.chinawebanalytics.cn/?utm_campaign=newbook&utm_source=tsinghua&utm_medium=PRess , "?utm_campaign=newbook&utm_source=tsinghua&utm_medium=press" คือป้ายกำกับ แท็กอาจเป็น URL ที่สมบูรณ์ได้เช่นกัน
พูดง่ายๆ ก็คือ โปรแกรมที่สามารถดำเนินการได้คือโค้ดการตรวจสอบ และโปรแกรมที่ไม่สามารถดำเนินการได้คือป้ายกำกับการตรวจสอบ
วิธีการมาร์กอัปหน้าทำงานอย่างไร
เราได้เข้าใจหลักการพื้นฐานของวิธีการมาร์กอัปหน้าแล้ว และตอนนี้เราต้องเรียนรู้รายละเอียดว่ามาร์กอัปหน้าสามารถรวบรวม ส่ง และนำเสนอข้อมูลให้เราทราบได้อย่างไร การทำความเข้าใจกระบวนการนี้มีประโยชน์มากสำหรับเราในการดำเนินการตรวจสอบการวิเคราะห์เว็บไซต์โดยเฉพาะ
ขั้นตอนที่ 1: โค้ดการตรวจสอบเพจถูกโหลดและดำเนินการโดยเบราว์เซอร์
ข้อกำหนดเบื้องต้นสำหรับวิธีการติดแท็กหน้าเว็บเพื่อให้ทำงานได้อย่างถูกต้องคือการเพิ่มโค้ดตรวจสอบ JavaScript ลงในทุกหน้าที่ต้องมีการตรวจสอบบนเว็บไซต์ เมื่อผู้ใช้เปิดหน้านี้ เซิร์ฟเวอร์ (หรือแคช) จะตอบสนองต่อคำขอของผู้ใช้ จากนั้นจึงส่งเพจพร้อมกับโค้ดการตรวจสอบไปยังเบราว์เซอร์ของผู้ใช้ เมื่อเบราว์เซอร์ของผู้ใช้ได้รับโค้ดตรวจสอบ ก็จะเริ่มรันโค้ด
ขั้นตอนที่ 2 รันโค้ดการตรวจสอบที่สมบูรณ์
หลังจากดำเนินการโค้ดตรวจสอบบนเพจแล้ว จะไม่เข้าใจฟังก์ชันการตรวจสอบทั้งหมด แต่ขอรหัสตรวจสอบที่สมบูรณ์จากเซิร์ฟเวอร์ของเครื่องมือวิเคราะห์เว็บไซต์ที่เกี่ยวข้องแทน คำสั่งโค้ดตรวจสอบที่สมบูรณ์นั้นมีจำนวนมาก ดังนั้นจะถูกรวบรวมเป็นไฟล์ .js และเก็บไว้นอกหน้าเว็บ เมื่อโค้ดภายนอกได้รับคำขอจากโค้ดการตรวจสอบเพจ โค้ดนั้นจะถูกส่งไปยังเบราว์เซอร์และดำเนินการโดยเบราว์เซอร์ด้วย ด้วยวิธีนี้ จึงสามารถรับรู้ถึงฟังก์ชันการตรวจสอบที่สมบูรณ์ได้
ยกตัวอย่างการตรวจสอบ GA ของบล็อกของฉันเอง (CWA, Web Analytics ในประเทศจีน, http://www.chinawebanalytics.cn ) เป็นตัวอย่าง ในระหว่างการดำเนินการโค้ดการตรวจสอบที่สมบูรณ์ มีหลายสิ่งที่จะเกิดขึ้น:
1. ตรวจจับคุณลักษณะต่างๆ ของไคลเอนต์ รวมถึงเวอร์ชันเบราว์เซอร์ เวอร์ชันระบบปฏิบัติการ ความละเอียดหน้าจอ ฯลฯ และบันทึกเวลาที่เจาะจงเมื่อมีการเข้าถึงเพจ แหล่งที่มาของการเข้าถึง (แหล่งที่มาของการเข้าชม) ฯลฯ
2. สร้างคุกกี้สำหรับเบราว์เซอร์ของผู้ใช้รายนี้ คุกกี้คืออะไร? โปรดดูโพสต์นี้: การปกป้องคุกกี้ - หากไม่มีคุกกี้ เราไม่มีอะไรเลย และโพสต์นี้: JavaScript และคุกกี้มีผลกระทบต่อ GA มากน้อยเพียงใด - หากคุณไม่ต้องการอ่านบทความทั้งสองนี้ ก็ไม่สำคัญ พูดง่ายๆ ก็คือ หน้าที่ของคุกกี้คือการบันทึกข้อมูลสำคัญที่เกี่ยวข้องกับการเยี่ยมชมเว็บไซต์นี้ของผู้ใช้ในครั้งต่อไปที่ผู้ใช้เรียกดูเว็บไซต์นี้อีกครั้ง บันทึกในคุกกี้จะถูกใช้เป็นข้อมูลใหม่ การอ้างอิงบันทึกการสืบค้นช่วยให้เครื่องมือวิเคราะห์เว็บไซต์สามารถระบุได้ว่าการเข้าชมนี้เป็นการเข้าชมซ้ำหรือไม่ ผู้เยี่ยมชมเป็นผู้เข้าชมใหม่หรือไม่ และข้อมูลสำคัญอื่น ๆ อีกมากมาย จำเป็นต้องใช้คุกกี้ในวิธีการตรวจหามาร์กอัปหน้า ซึ่งหมายความว่าหากเบราว์เซอร์ปิดใช้งานคุกกี้ วิธีการมาร์กอัปหน้าจะไม่ทำงาน หากต้องการทราบเกี่ยวกับการตั้งค่าคุกกี้ของ Google Analytics โปรดดูบทความนี้: ตัวชี้วัดการวิเคราะห์เว็บไซต์ ความหมาย และสิ่งที่คุณไม่รู้ (2)
3. หากมีการตั้งค่าคุกกี้สำหรับเบราว์เซอร์ของผู้เยี่ยมชมรายนี้มาก่อน โค้ดตรวจสอบจะเขียนข้อมูลคุกกี้เก่าบางส่วนที่จำเป็นต้องอัปเดตใหม่ เพื่อให้มั่นใจว่าคุกกี้แต่ละตัวจะบันทึกข้อมูลพฤติกรรมการเข้าถึงที่เกี่ยวข้อง
ขั้นตอนที่ 3: ส่งข้อมูลไปยังเซิร์ฟเวอร์ของเครื่องมือวิเคราะห์เว็บไซต์
เมื่อโค้ดตรวจสอบรวบรวมข้อมูลทั้งหมดแล้ว มันจะส่งข้อมูลที่เกี่ยวข้องกลับไปยังเซิร์ฟเวอร์ของเครื่องมือวิเคราะห์เว็บไซต์ วิธีการส่งไม่ใช่การส่งข้อมูลโดยตรง (นั่นคือ ไม่ใช้วิธีโพสต์ หากคุณไม่เข้าใจการโพสต์และรับวิธีการในโปรโตคอล HTTP คุณสามารถข้ามเนื้อหาในวงเล็บได้) แต่ให้ส่ง ข้อมูลไปยังเซิร์ฟเวอร์เครื่องมือวิเคราะห์เว็บไซต์ ทำได้โดยการขอรูปภาพ GIF โปร่งใสขนาด 1×1 พิกเซล (นั่นคือยังคงใช้วิธี get หากคุณไม่เข้าใจโปรดข้ามไป) ดูเหมือนจะแปลกนิดหน่อยใช่ไหม? ในความเป็นจริง เมื่อออกคำขอพิกเซล 1×1 นี้ ข้อมูลที่รวบรวมทั้งหมดจะถูกส่งไปยังเซิร์ฟเวอร์ของเครื่องมือวิเคราะห์เป็นพารามิเตอร์ที่เกี่ยวข้องของคำขอนี้ เพื่อให้เครื่องมือวิเคราะห์สามารถรับและจัดเก็บข้อมูลที่เกี่ยวข้องได้
ขั้นตอนที่ 4 เซิร์ฟเวอร์เครื่องมือวิเคราะห์เว็บไซต์จะบันทึกข้อมูล
หลังจากที่เซิร์ฟเวอร์เครื่องมือวิเคราะห์เว็บไซต์ได้รับข้อมูลแล้ว จะเก็บข้อมูลไว้ในไฟล์ข้อมูลขนาดใหญ่ วิธีการบันทึกของไฟล์ข้อมูลนี้คล้ายกับไฟล์บันทึก (Log File) ที่เรากล่าวถึงก่อนหน้านี้มาก มันเป็นไฟล์บันทึก แต่ข้อแตกต่างคือไฟล์บันทึกที่นี่ไม่มีข้อมูลการทำงานของเซิร์ฟเวอร์เครื่องมือวิเคราะห์เว็บไซต์ แต่เป็นข้อมูลของเว็บไซต์ที่ได้รับการตรวจสอบ
แต่ละบรรทัดข้อมูล (การป้อนข้อมูล) ในไฟล์บันทึกนี้ประกอบด้วยข้อมูลจำนวนมากเกี่ยวกับการดูหน้าเว็บบางหน้า (PageView) รวมถึงแต่ไม่จำกัดเฉพาะข้อมูลต่อไปนี้ (ใช้ไฟล์บันทึกไฟล์บันทึกของ Google Analytics เป็นตัวอย่าง):
1. วันที่และเวลาที่เข้าถึงเพจเกิดขึ้น
2. ชื่อของหน้าที่เยี่ยมชม;
3. แหล่งที่มาของผู้เข้าชม (ไม่ว่าจะเชื่อมโยงจากเว็บไซต์บางแห่ง ผ่านเครื่องมือค้นหา ผ่านการเข้าถึงโดยตรง ฯลฯ)
4. จำนวนครั้งที่ผู้เยี่ยมชมรายนี้เยี่ยมชมเว็บไซต์นี้
5. ตำแหน่งทางภูมิศาสตร์ของที่อยู่ IP ของผู้เยี่ยมชม
6. คุณลักษณะของลูกค้าของผู้เยี่ยมชม เช่น ระบบปฏิบัติการ เบราว์เซอร์ ความละเอียดหน้าจอ ฯลฯ
เมื่อบันทึกเหล่านี้รวมอยู่ในบันทึกของเซิร์ฟเวอร์เครื่องมือวิเคราะห์แล้ว กระบวนการรวบรวมข้อมูลจะเสร็จสมบูรณ์ ตัวอย่างต่อไปนี้คือแถวข้อมูลที่บันทึกไว้ในเซิร์ฟเวอร์ Google Analytics (โปรดทราบว่าไม่ใช่ข้อมูลจริง):
123.121.215.51 www.chinawebanalytics.cn – [31/ม.ค./2010:20:45:26 -0600] "รับ
/__utm.gif?utmwv=1&utmn=699988832&utmcs=utf-8&utmsr=1680×1050&utmsc=32-bit&utmul=enus&
utmje=1&utmfl=8.0&utmcn=1&utmdt=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E5%9C
%A8%E4%B8%AD%E5%9B%BD%E2%80%94%E2%80%94%E4%BB%8E%E5%9F%BA%E7%A1%80
%E5%88%B0%E5%89%8D%E6%B2%BF&utmhid=2006742654&utmr=-
&utmp=/ HTTP/1.1" 200 35 " http://www.chinawebanalytics.cn/ " "Mozilla/5.0 (เข้ากันได้; MSIE 6.0;
Windows NT 5.1; SV1; .NET 1.1.4322; .NET CLR 2.0.50727)
"__utma=453698521.699988832.235456888.235456888.235456888.1; __utmb=453698521;
__utmc=453698521;
__utmz=453698521.235456888.1.1.utmccn=(โดยตรง)|utmcsr=(โดยตรง)|utmcmd=(ไม่มี)"
ข้อมูลข้างต้นดูเหมือนยุ่งเหยิง แต่จริงๆ แล้วยังมีเบาะแสบางอย่างให้เห็นได้ ตัวอย่างเช่น เราจะเห็นว่าที่อยู่ IP ของผู้เยี่ยมชมคือ 123.121.215.51 โดเมนที่เยี่ยมชมคือบล็อกของฉัน www.chinawebanalytics.cn และเวลาที่การเข้าชมเริ่มต้นคือ 20:45:26 น. ของวันที่ 31 มกราคม 2010 นอกจากนี้ หากคุณมองย้อนกลับไป คุณยังสามารถดูข้อมูลเกี่ยวกับระบบปฏิบัติการและเบราว์เซอร์ที่ผู้เยี่ยมชมใช้
สำหรับสิ่งที่ย่อมาจาก utma, utmb, utmc และ utmz คุณจะเข้าใจหลังจากอ่านบทความนี้: การวัดผลการวิเคราะห์เว็บไซต์ นัยสำคัญ และไม่ทราบ (2)
ขั้นตอนที่ 5 เครื่องมือวิเคราะห์เว็บไซต์จะประมวลผลข้อมูล
เมื่อข้อมูลถูกบันทึกลงในไฟล์บันทึกของเซิร์ฟเวอร์เครื่องมือวิเคราะห์เว็บไซต์ ไปป์ไลน์จะลดลงต่อไป ขั้นตอนต่อไปคือการประมวลผลบรรทัดบันทึกในไฟล์บันทึกเหล่านี้ แต่ละบรรทัดบันทึกประกอบด้วยองค์ประกอบข้อมูลเฉพาะ ที่เรียกว่าฟิลด์ เช่น IP ของผู้เยี่ยมชม เวลาในการเข้าถึง เบราว์เซอร์และเวอร์ชัน ฯลฯ เหล่านี้ องค์ประกอบข้อมูลจะถูกแยกออกจากกัน แล้วจัดเก็บไว้ในช่องที่เกี่ยวข้อง กลายเป็น "ผลิตภัณฑ์กึ่งสำเร็จรูป" สำหรับการดูข้อมูลขั้นสุดท้ายของเรา
จากนั้น ข้อมูลกึ่งสำเร็จรูปจะถูกกรองเพิ่มเติมตามเกณฑ์ที่ตั้งขึ้นเองในเครื่องมือวิเคราะห์เว็บไซต์ ฟิลด์ข้อมูลที่ไม่สามารถกรองได้จะถูกยกเว้น และข้อมูลที่เหลือจะถูกจัดเรียงเพิ่มเติมในโครงการที่เตรียมไว้สำหรับการสร้างรายงาน ข้อมูลทั้งหมดนี้ถูกจัดเก็บไว้ในฐานข้อมูลเฉพาะของเครื่องมือวิเคราะห์เว็บไซต์ ซึ่งรอการแตกและนำไปใช้ได้ตลอดเวลา
ขั้นตอนที่ 6 สร้างรายงาน
เมื่อข้อมูลได้รับการประมวลผลแล้ว กระบวนการทั้งหมดก็จะสิ้นสุดลง หากผู้ใช้ร้องขอรายงานเฉพาะโดยใช้เครื่องมือวิเคราะห์เว็บไซต์ ช่องข้อมูลจะถูกคำนวณ จัดระเบียบ และจัดเรียงเพิ่มเติมเป็นโปรเจ็กต์เพื่อเตรียมพร้อมสำหรับการสร้างรายงาน โดยจัดระเบียบในรูปแบบที่กำหนดไว้ล่วงหน้า (หรือที่ผู้ใช้กำหนด) เราไม่สามารถมองเห็นกระบวนการนี้ได้ แต่มันมีความละเอียดอ่อนของอัลกอริธึมเครื่องมือวิเคราะห์เว็บไซต์ นอกจากนี้ คำจำกัดความของอัลกอริธึมยังส่งผลต่อคำจำกัดความของตัวชี้วัดการวิเคราะห์เว็บไซต์พื้นฐานบางอย่าง ซึ่งส่งผลโดยตรงต่อผลลัพธ์ของค่าจริงของข้อมูลพื้นฐาน เมตริก นี่เป็นเหตุผลสำคัญว่าทำไมเครื่องมือวิเคราะห์เว็บไซต์ที่แตกต่างกันจึงให้มูลค่าที่แตกต่างกันเมื่อนับเว็บไซต์เดียวกัน
ต่อจากนั้นรายการข้อมูลที่เตรียมไว้จะถูกส่งต่อไปยังเซิร์ฟเวอร์ของ UI ของเครื่องมือเว็บไซต์ (User Interface) เพื่อสร้างกราฟ ตาราง และตัวเลขเฉพาะ ซึ่งจากนั้นจะส่งออกไปยังเบราว์เซอร์หรือไคลเอนต์ของผู้ใช้ และกลายเป็นรายงานที่เรา สามารถเข้าใจได้ง่าย
จริงๆ แล้วกระบวนการทั้งหมดไม่ซับซ้อน แต่เครื่องมือวิเคราะห์เว็บไซต์จะเผชิญกับการประมวลผลข้อมูลจำนวนมาก โดยเฉพาะอย่างยิ่งเมื่อปริมาณการเข้าชมเว็บไซต์มีขนาดใหญ่เป็นพิเศษ เครื่องมือวิเคราะห์เว็บไซต์จะรับภาระหนัก นี่คือสาเหตุที่เครื่องมือวิเคราะห์เว็บไซต์ติดแท็กเว็บจำนวนมากเรียกเก็บค่าธรรมเนียมตามปริมาณการเข้าชมเว็บไซต์ที่ได้รับการตรวจสอบ
ข้อดีของการใช้วิธีแท็กหน้าเพื่อวิเคราะห์เว็บไซต์
การแท็กหน้ามีข้อดีหลายประการ ทำให้เป็นวิธีหลักในการรับข้อมูลสำหรับการวิเคราะห์เว็บไซต์
1. ไม่กลัวผลกระทบต่อแคช
ตรงกันข้ามกับวิธีการบันทึกซึ่งกลัวผลกระทบของแคช วิธีการมาร์กอัปหน้าไม่ต้องกังวลกับการแคชเลย เนื่องจากโค้ดของมาร์กอัปหน้าถูกวางไว้ในไฟล์ต้นฉบับของหน้า แม้ว่าหน้าจะถูกแคชโดยพร็อกซีเซิร์ฟเวอร์หรือบันทึกโดยแคชของเบราว์เซอร์ไคลเอ็นต์ รหัสของมาร์กอัปหน้าจะถูกบันทึกด้วยและจะถูกรวมไว้เมื่อเบราว์เซอร์ โหลดหน้าจะถูกดำเนินการ
ดังนั้นหากคุณป้อนหลายหน้าของเว็บไซต์ติดต่อกันแล้วคลิกปุ่ม "ย้อนกลับ" ของเบราว์เซอร์เพื่อกลับไปยังหน้าก่อนหน้า จากนั้นภายใต้วิธีการทำเครื่องหมายหน้า การกลับไปยังหน้าก่อนหน้าจะทำให้หน้าเพิ่มขึ้น โดยหนึ่ง "การดูเพจ" อย่างไรก็ตาม ภายใต้วิธีไฟล์บันทึก การดูเพจใหม่อาจไม่ถูกบันทึกเนื่องจากผลกระทบของแคช ด้วยวิธีนี้ วิธีการติดแท็กหน้าสามารถบันทึกการเดินทางของผู้เข้าชมได้แม่นยำยิ่งขึ้น
2. ความสามารถในการบันทึก “ปฏิสัมพันธ์ของลูกค้า”
ดังที่กล่าวไว้ก่อนหน้านี้ มาร์กอัปของหน้าถูกนำมาใช้โดยการรันโค้ด JavaScript บนไคลเอนต์ ดังนั้น ตามทฤษฎีแล้ว "ทุกการเคลื่อนไหว" บนเพจที่เปิดโดยเบราว์เซอร์จึงสามารถบันทึกได้ สำหรับประเภท "การโต้ตอบฝั่งไคลเอ็นต์" ประเภท Flash, JavaScript หรือแอปพลิเคชัน web2.0 อื่นๆ มาร์กอัปหน้ายังสามารถทำเครื่องหมายการโต้ตอบต่างๆ ของแอปพลิเคชันเหล่านี้ได้ จากนั้นจึงบันทึกการโต้ตอบเหล่านี้ที่เกิดขึ้นอย่างแม่นยำ
เมื่อหน้าเว็บมีการโต้ตอบกันมากขึ้น ข้อดีของการมาร์กอัปหน้าจะชัดเจนมาก ยิ่งไปกว่านั้น มีเครื่องมือมากมายที่ใช้มาร์กอัปหน้าเพื่อรองรับการโต้ตอบกับลูกค้าโดยตรงบนหน้า ซึ่งแสดงให้เห็นว่าการตรวจสอบการโต้ตอบกับลูกค้า ไม่มีข้อกำหนดอีกต่อไป เป็นทางเลือกและได้กลายเป็นส่วนสำคัญในการวัดประสิทธิภาพของเว็บไซต์
3. บันทึกผู้เยี่ยมชมที่ค่อนข้างแม่นยำ
การแท็กหน้าอาศัยคุกกี้ในการบันทึกและระบุข้อมูลผู้เยี่ยมชม เครื่องมือการแท็กหน้าบางส่วนใช้คุกกี้และ IP เพื่อร่วมกันระบุข้อมูลผู้เยี่ยมชม ในขณะที่วิธีการบันทึกจะใช้เฉพาะที่อยู่ IP ที่เฉพาะเจาะจงเท่านั้น
ควรเน้นย้ำว่าการใช้วิธีคุกกี้เพื่อระบุข้อมูลผู้เยี่ยมชมนั้นเป็นไปไม่ได้ที่จะแม่นยำ 100% เช่นกัน (อันที่จริงความสมบูรณ์แบบไม่มีอยู่จริง Stephen Hawking กล่าวว่าความสมบูรณ์แบบ 100% ไม่มีอยู่ในจักรวาล มิฉะนั้นจักรวาลจะไม่ มีอยู่) แต่เมื่อเปรียบเทียบกับการใช้ที่อยู่ IP เพียงอย่างเดียว คุกกี้จะเพิ่มกลไกการระบุตัวตนในที่สุด และกลไกนี้รวมเข้ากับเบราว์เซอร์ของลูกค้าและจัดเก็บข้อมูลการระบุตัวตนมากขึ้น ดังนั้นผู้เยี่ยมชมที่ใช้คุกกี้ในการบันทึก บันทึกจึงมีความแม่นยำมากกว่าแน่นอน จำนวนผู้เยี่ยมชม IP พูดตามตรง จนกว่าจะพบวิธีการใหม่ (ซึ่งยังไม่เคยได้ยินมาก่อน) วิธีการทำเครื่องหมายหน้าโดยใช้เทคโนโลยีคุกกี้สามารถให้ข้อมูลผู้เยี่ยมชมที่แม่นยำที่สุดในปัจจุบัน
นอกจากนี้ วิธีการติดแท็กหน้าเว็บจะไม่ได้รับผลกระทบจากโรบอตหรือสไปเดอร์ที่เข้าชมเว็บไซต์เพื่อรวบรวมข้อมูลเว็บไซต์ ดังนั้น หากไม่รวมการโกงที่เป็นอันตราย จึงถือได้ว่าข้อมูลทั้งหมดที่บันทึกโดยวิธีนี้เป็นข้อมูลของ "ผู้คน" ที่เข้าชม เว็บไซต์ โดยเฉพาะอย่างยิ่งสำหรับเว็บไซต์ที่ไม่ใช่เชิงพาณิชย์ เช่น บล็อกของฉันเอง ฉันไม่สนใจว่าโรบ็อตจะรวบรวมข้อมูลเว็บไซต์ของฉันจริงๆ อย่างไรก็ตาม หากคุณมีความต้องการขั้นสูงสำหรับ SEO คุณควรใช้ซอฟต์แวร์วิเคราะห์บันทึกเพื่อดูเว็บไซต์ของโรบ็อตเครื่องมือค้นหา
4. ประสิทธิภาพแบบเรียลไทม์ที่ดีขึ้น
เช่นเดียวกับวิธีการบันทึก วิธีการติดแท็กหน้าเว็บยังรวบรวมข้อมูลแบบเรียลไทม์อีกด้วย การเข้าชมเกิดขึ้น ทริกเกอร์มาร์กอัปบนเพจ และข้อมูลจะถูกดึงและส่งไปยังเซิร์ฟเวอร์ของเครื่องมือ แต่แตกต่างจากวิธีบันทึกตรงที่การประมวลผลข้อมูลของวิธีบันทึกไม่ใช่แบบเรียลไทม์ หลังจากที่ข้อมูลของวิธีทำเครื่องหมายหน้าถูกส่งไปยังเซิร์ฟเวอร์ของเครื่องมือแล้ว การประมวลผลจะใช้เวลาอันสั้น (แม้ในเวลาจริง) จากนั้นจึงสร้างรูปแบบ รายงาน ดังนั้นวิธีการติดแท็กหน้าเว็บจึงมีประสิทธิภาพแบบเรียลไทม์ค่อนข้างดี ตัวอย่างเช่น รายงานข้อมูล SiteCatalyst ของ Omniture มีความล่าช้าเพียงไม่กี่ชั่วโมงเท่านั้น ในอดีต Google Analytics มีความล่าช้าหนึ่งถึงสองวัน แต่ตอนนี้ความล่าช้าของข้อมูลดังกล่าวมีผลกระทบเพียงเล็กน้อยต่อการวิเคราะห์และสามารถทำได้ ให้ประมาณว่าเป็นเวลาจริง
5. ไม่มีปัญหาในการจัดเก็บข้อมูลและการถ่ายโอนอีกต่อไป
ต่างจากวิธีการบันทึกซึ่งต้องมีการบันทึกไฟล์บันทึกจำนวนมาก ข้อมูลของวิธีการมาร์กอัปหน้าสามารถเก็บไว้ทั้งหมดบนเซิร์ฟเวอร์ของผู้ให้บริการเครื่องมือวิเคราะห์เว็บไซต์ (เซิร์ฟเวอร์เครื่องมือ) หากคุณต้องการ ซึ่งหมายถึงต้นทุนฮาร์ดแวร์เพิ่มเติมและต้นทุนของ การซื้ออุปกรณ์จัดเก็บข้อมูลบันทึก ต้นทุนของซอฟต์แวร์ในการจัดการไฟล์บันทึกหายไป นอกจากนี้ ปัญหาที่บันทึกไว้ก็คือการป้อนไฟล์บันทึกลงในซอฟต์แวร์วิเคราะห์ไฟล์บันทึก บางครั้งงานนี้อาจไม่ง่ายเหมือนกับการใช้เมาส์คลิกไฟล์ในอินเทอร์เฟซการนำเข้าของเครื่องมือ แต่ต้องมีการพัฒนา โปรแกรมเฉพาะทาง นอกจากนี้ เมื่อมีเซิร์ฟเวอร์มิเรอร์และสถานการณ์อื่น ๆ วิธีการมาร์กอัปหน้าสามารถละเว้นได้จริง แต่วิธีการบันทึกนั้นไม่ง่ายนักในการรวมข้อมูล
โอเค การบ้านของสัปดาห์นี้ถูกส่งให้กับทุกคนแล้ว และตอนนี้ก็ถึงตาของทุกคนแล้ว ฉันอยากเห็นความคิดเห็นและความคิดเห็นของคุณจริงๆ ฉันหวังว่าคุณทุกคนจะมีความสุขในสัปดาห์ใหม่!
ผู้เขียน: ซ่งซิง
แหล่งที่มาของบทความ: http://www.chinawebanalytics.cn/pag-tagging-data-acquire/