الغابة العشوائية

هذا صوت ثور.

صورة قديمة جدًا لحصان

الشكل 19. ثور.

 

في عام 1906، تم تنظيم مسابقة لتقييم الوزن في إنجلترا. توقّع 787 مشاركًا وزن ثور. كان متوسّط الخطأ في التخمينات الفردية يتراوح بين 17 و37 رطلًا (أي خطأ بنسبة 3.1%). ومع ذلك، كان متوسّط التقييمات المُقدَّرة للوزن يقلّ عن الوزن الفعلي للثور (1198 رطل) بمقدار 9 رطل فقط، ما يمثّل خطأً بنسبة ‎0.7% فقط.

رسم بياني للتردد التكراري للتوقّعات الفردية، يعرض معظم التوقّعات التي تركّزت حول
الوزن الفعلي للثور

الشكل 20: مخطّط بياني هرمي للوزن المقدَّر لكل فرد

 

توضّح هذه الحكاية حكمة الحشود: في مواقف معيّنة، يقدّم الرأي الجماعي حكمًا جيدًا جدًا.

من الناحية الحسابية، يمكن وضع نموذج لحكمة الحشود باستخدام نظرية الحدّ المركزي: بشكل غير رسمي، يميل الخطأ التربيعي بين قيمة ومتوسط N تخمينات صاخبة لهذه القيمة إلى الصفر مع عامل 1/N. ومع ذلك، إذا لم تكن المتغيرات مستقلة، يكون التباين أكبر.

في تعلُّم الآلة، يُعدّ النموذج المجمّع مجموعة من النماذج يتم احتساب متوسط توقعاتها (أو تجميعها بطريقة ما). إذا كانت نماذج المجموعة مختلفة بما يكفي بدون أن تكون سيئة جدًا بشكل فردي، تكون جودة المجموعة بشكل عام أفضل من جودة كل نموذج من نماذج المجموعة الفردية. تتطلّب المجموعة وقتًا أطول للتدريب والاستنتاج مقارنةً بأحد نماذج الفردية. بعد كل شيء، عليك إجراء عمليات التدريب والاستنتاج على نماذج متعددة بدلاً من نموذج واحد.

بشكل غير رسمي، لكي تعمل المجموعة على أفضل وجه، يجب أن تكون النماذج الفردية مستقلة. على سبيل المثال، لن تكون المجموعة التي تتألف من 10 نماذج متطابقة تمامًا (أي ليست مستقلة على الإطلاق) أفضل من النموذج الفردي. من ناحية أخرى، قد يؤدي فرض استقلالية النماذج إلى تحسين أداءها. تتطلّب عملية الدمج الفعّالة تحقيق التوازن بين استقلالية النموذج وجودة النماذج الفرعية.