باعتبارها موضوعا متعدد التخصصات. يدمج استخراج البيانات قواعد البيانات وإحصاءات الذكاء الاصطناعي والمجالات الأخرى، وتعد قواعد البيانات الملخصة والذكاء البشري والإحصاءات الرياضية الركائز الأساسية لتكنولوجيا استخراج البيانات، والسبب الرئيسي لاستخراج البيانات هو الذكاء وقواعد الارتباط واتخاذ القرار والتكتل والخداع. التعلم القائم. 1J! التعلم الياسي، المجموعة الأولية، شبكة الشارب، الخوارزمية الجينية، التحليل الإحصائي وغيرها من التقنيات. اعتماد أخذ عينات بيانات f1j {اختر عينات البيانات)، واستكشاف البيانات، واستكشاف البيانات الخاضعة للضريبة وتحليل المجموعات واختيارها 1، وتعديل البيانات (تقسيم مجموعة البيانات وتقسيمها)، والشبكة العصبية [البشرية] النموذجية، ونموذج صنع القرار، وتحليل الإحصاءات الرياضية والوقت قد يلزم تكرار تحليل التسلسل والتقييم (توليف الاستنتاجات وتقييمها، وما إذا كان سيتم إصلاح السفينة، وما إذا كانت هناك مشاكل جديدة) وغيرها من العمليات الخمس الأساسية، للحصول على جودة المياه وحل المشكلة باستمرار من خلال تحليل الارتباط. تحليل التصنيف والتنبؤ واكتشاف الانحراف، والعلاقة بين البيانات ونمط البيانات هي الأكثر شيوعًا حاليًا. FHn: J تشمل تقنيات استخراج البيانات: المنطق المعياري وطرق المجموعة التقريبية، والخوارزميات الجينية، وخوارزميات البحث عن قرب، وما إلى ذلك. من ناحية أخرى، تنقسم طرق تحليل استخراج البيانات إلى أربعة أنواع: تحليل الارتباط، وتحليل التسلسل، وتحليل الأقسام، والتحليل العنقودي. قواعد الارتباط: تُستخدم قواعد الارتباط التي تمثل علاقات البيانات في التطبيقات التجارية المباشرة. والمثال الأكثر شيوعًا هو اكتشاف سلسلة متاجر من خلال التنقيب في البيانات عن العلاقة الجوهرية بين حفاضات I Flag وبيرة N.