درخت تصمیم

درخت تصمیم

درخت تصمیم چیست؟

درخت تصمیم را به‌عنوان نقشه‌ای از نتایج احتمالی مجموعه‌ای از انتخاب‌های مرتبط طراحی کرده‌اند. این سیستم به یک فرد یا سازمان اجازه می‌دهد تا اقدامات احتمالی را بر اساس هزینه‌ها، احتمالات و منافع در برابر یکدیگر ارزیابی کند؛ همچنین آن را برای ترسیم الگوریتمی که بهترین انتخاب را از نظر ریاضی پیش‌بینی می‌کند به کار می‌برند.

درخت تصمیم را معمولاً با یک گره شروع و به نتایج ممکن منشعب می‌کنند. هر یک از این نتایج را منجر به گره‌های اضافی و احتمالات دیگر منشعب می‌کنند تا نهایتا خروجی سیستم، شکلی درختی پیدا کند.

چرا ارزیابی ریسک مهم است؟

درخت تصمیم را به‌عنوان یکی از تکنیک‌های ارزیابی ریسک می‌شناسیم. فرایندهای ارزیابی ریسک نقش یک عنصر کلیدی را در مواقعی که بخواهیم از سلامت و ایمنی کارکنان و مشتریان مطمئن شویم ایفا می‌کنند. دستورالعمل‌های متنوعی برای صنایع مختلف تعریف کرده‌اند، زیرا ممکن است با انواع خطرات احتمالی مواجه شویم.

از تکنیک‌های ارزیابی ریسک جهت شناسایی شدت خطر، پیشگیری، کاهش خطرات برای نجات جان افراد و اطمینان از اینکه محل کار به عنوان یک فضای امن باقی می‌ماند استفاده می‌کنیم.


انواع گره در درخت تصمیم

سه نوع گره مختلف را در این سیستم تعریف کرده‌اند:

  • گره شانس را با نماد دایره مشخص میکنند و احتمال نتایج معین را نشان می‌دهد.
  • گره تصمیم را با نماد مربع مشخص میکنند و تصمیمی را که باید گرفته شود نشان می‌دهد.
  • گره پایان را با نماد مثلث مشخص میکنند و نتیجه نهایی یک مسیر تصمیم را نشان می‌دهد.

درخت‌های تصمیم را می‌توانید با نمادهای فلوچارت ترسیم کنید که خواندن و درک آن آسان‌تر شود.

مثال درخت تصمیم


عملکرد درخت تصمیم چگونه است؟

قبل از اینکه بخواهید از درخت تصمیم استفاده کنید نحوه‌ی عملکرد درخت تصمیم، باید با برخی از اصطلاحات مربوط به آن را تعریف کنیم:

  • گره ریشه (Root Node): پایه‌ی درخت تصمیم است.
  • تقسیم (Splitting): به فرایند تبدیل یک گره به چندین زیرگرهف تقسیم می‌گویند.
  • گره تصمیم (Decision Node): زمانی که یک زیرگره به زیرگره‌های بیشتری تقسیم می‌شود، به آن گره‌ی تصمیم می‌گویند.
  • گره برگ (Leaf Node): زمانی که یک زیرگره به زیرگره‌های بیشتری تقسیم نمی‌شود و در واقع خروجی احتمالی را نشان می‌دهد ، به آن گره‌ی برگ می‌گویند.
  • هرس (Pruning): به فرایند حذف زیرگره‌های یک درخت تصمیم، هرس می‌گویند.
  • شاخه (Branch): به زیرمجموعه‌ای از درخت تصمیم که از چندین گره تشکیل شده شاخه می‌گویند.

درخت تصمیم بسیار شبیه درخت معمولی است. در ابتدای درخت، گره‌ی ریشه قرار دارد. مجموعه‌ای از گره‌های تصمیم از گره ریشه منشعب می‌شوند که نشان‌دهنده‌ی تصمیماتی هستند که باید گرفته شوند. از گره‌های تصمیم به گره‌های برگ می‌رسیم که نتایج آن تصمیمات را نشان می‌دهند.

هر گره تصمیم یک سؤال یا نقطه‌ی انشعاب را نشان می‌دهد و گره‌های برگی که از یک گره تصمیم منشعب می‌شوند، نشان‌دهنده‌ی پاسخ‌های ممکن هستند. درست مانند رشد برگ روی شاخه‌ی درخت، گره‌های برگ نیز از گره‌های تصمیم ایجاد می‌شوند. به همین دلیل است که به زیرمجموعه‌های درخت تصمیم شاخه می‌گوییم.


نحوه ترسیم درخت تصمیم

برای ترسیم درخت تصمیم، ابتدا یک رسانه انتخاب کنید. می‌توانید آن را با دست روی کاغذ یا تخته سفید بکشید یا می‌توانید از نرم‌افزار درخت تصمیم مخصوص استفاده کنید. در هر صورت، باید مراحل زیر را دنبال کنید:

با تصمیم اصلی شروع کنید

یک کادر کوچک برای نشان‌دادن این نقطه درنظر بگیرید، سپس برای هر راه حل یا عمل ممکن یک خط از کادر به سمت راست بکشید و آن‌ها را برچسب بزنید.

گره‌های شانس و تصمیم را برای گسترش درخت اضافه کنید

اگر تصمیم دیگری به ذهنتان رسید، یک کادر دیگر بکشید. برای نتایج نامشخص یک دایره رسم کنید و اگر مشکل را حل کردید، فعلا آن را خالی بگذارید. از هر گره تصمیم، راه‌حل‌های ممکن را ترسیم کنید. از هر گره شانس، خطوطی را رسم کنید که نتایج احتمالی را نشان می‌دهد. اگر قصد دارید گزینه‌های خود را به صورت عددی تجزیه‌وتحلیل کنید، احتمال هر نتیجه و هزینه هر اقدام را درج کنید.

تا زمانی که هر خط به یک نقطه پایانی برسد، به گسترش ادامه دهید

نقطه پایانی به این معنی است که دیگر هیچ انتخاب دیگری برای انجام دادن یا نتایج شانسی برای در نظر گرفتن ندارید. سپس، به هر نتیجه ممکن یک مقدار اختصاص دهید. این مقدار را می‌توانید یک نمره انتزاعی یا یک ارزش مالی بدانید. مثلث‌ها را برای نشان‌دادن نقاط پایانی اضافه کنید. با یک درخت تصمیم کامل، آماده می‌شوید تا تصمیمی را که با آن روبرو هستید، تجزیه‌وتحلیل کنید.


الگوریتم‌های درخت تصمیم

الگوریتم­‌های زیادی برای ساخت درخت تصمیم وجود دارند که تعدادی از آن‌ها را نام می‌بریم. ساده‌ترین مورد در بین این موارد، ID3 است که در ادامه به‌صورت خلاصه آن را معرفی می‌کنیم:

  • ID3:Iterative Dichotomiser
  • C4.5: Classifier 4.5
  • CART: Classification And Regression Tree
  • ID4
  • ds CART: DempsterShafer  Classification And Regression Tree
  • ID5R
  • EC4.5:Efficient Classifier 4.5
  • CHAID: Chi square Automatic Interaction Detection
  • RF: Random Forest
  • RT: Random Tree
  • DS: Decision Stump
  • QUEST: Quick Unbiased  Efficient Statistical Tree

الگوریتم ID3

الگوریتم ID3 را به‌عنوان یکی از ساده‌ترین الگوریتم‌های درخت تصمیم می‌شناسیم. در این الگوریتم درخت تصمیم را از بالا به پایین می‌سازند. این روش را با این سوال شروع می‌کنند که: «کدام ویژگی را باید در ریشه درخت مورد آزمایش قرار بدهیم؟» برای یافتن جواب از معیار بهره اطلاعات استفاده می‌کنند.

با انتخاب این ویژگی، برای هر یک از مقادیر ممکن آن یک شاخه ایجاد کرده و نمونه‌های آموزشی را بر اساس ویژگی هر شاخه مرتب می‌کنیم. سپس عملیات فوق را برای نمونه‌های قرار گرفته در هر شاخه تکرار می‌کنیم تا بهترین ویژگی را برای گره بعدی انتخاب کنیم.


مزایا و معایب

از درختان تصمیم به دلایلی مانند موارد زیر استفاده می‌کنند:

  • انرژی کمتری برای درک آن‌ها نیاز دارید.
  •  بدون داده‌های سخت نیز می‌توانند مفید باشند.
  • گزینه‌های جدید را می‌توانید به درخت‌های موجود اضافه کنید.
  • کمک به انتخاب بهترین مورد از بین چندین گزینه این روش را با ارزش می‌کند.
  • با سایر ابزارهای تصمیم‌گیری به راحتی ترکیب می‌شوند.

با این حال، درختان تصمیم می‌توانند بیش از حد پیچیده شوند. در چنین مواردی، یک نمودار تأثیر فشرده‌تر می‌تواند جایگزین خوبی باشد. نمودارهای تأثیر، تمرکز را بر تصمیمات، ورودی‌ها و اهداف حیاتی محدود می‌کنند.

درختان تصمیم در یادگیری ماشین و داده‌کاوی

از درخت تصمیم می‌توانید برای کمک به ساخت مدل‌های پیش‌بینی خودکار استفاده کنید که در یادگیری ماشین، داده‌کاوی و آمار کاربرد دارند. این روش را که به‌عنوان یادگیری درخت تصمیم می‌شناسند، مشاهدات مربوط به یک آیتم را برای پیش‌بینی ارزش آن در نظر می‌گیرد.

در این درخت‌های تصمیم، گره‌ها به جای تصمیم‌گیری، داده‌ها را نشان می‌دهند. این نوع درخت را به‌عنوان درخت طبقه‌بندی نیز می‌شناسند. هر شاخه مجموعه‌ای از ویژگی‌ها یا قوانین طبقه‌بندی را شامل می‌شود و در انتهای شاخه جا می‌گیرند.

این قوانین را که به‌عنوان قوانین تصمیم نیز می‌شناسند، می‌توانند در یک بند if-then بیان کنند. به این صورت که هر تصمیم یا مقدار داده، یک بند را تشکیل می‌دهد.


درختان رگراسیون

هر قطعه داده اضافی به مدل کمک می‌کند تا با دقت بیشتری پیش‌بینی کند که موضوع موردنظر به کدام یک از مجموعه محدودی از مقادیر تعلق دارد. سپس از این اطلاعات می‌توانید به‌عنوان ورودی در یک مدل تصمیم‌گیری بزرگ‌تر استفاده کنید.

گاهی اوقات متغیر پیش‌بینی شده یک عدد واقعی مانند قیمت خواهد بود. درختان تصمیم با نتایج ممکن پیوسته و نامتناهی را درختان رگراسیون می‌نامند.

درخت تصمیم بهینه

برای افزایش دقت، گاهی اوقات چندین درخت را با هم در روش‌های مجموعه استفاده می‌کنند. درخت تصمیم را زمانی بهینه در نظر می‌گیرند که بیشترین داده را با کم‌ترین تعداد سطوح یا سؤالات نشان دهد.

هرکدام از روش‌ها باید بهترین راه برای تقسیم داده‌ها در هر سطح راتعیین کنند. روش‌های رایج برای انجام این کار اندازه‌گیری ناخالصی جینی، افزایش اطلاعات و کاهش واریانس را شامل می‌شوند.


مزایای استفاده از درخت تصمیم در یادگیری ماشین

استفاده از درخت تصمیم در یادگیری ماشین چندین مزیت را برای شما به همراه می‌آورد:

  •  هزینه استفاده از درخت را برای پیش‌بینی داده‌ها با هر نقطه داده اضافی کاهش می‌دهد.
  •  برای داده‌های دسته‌بندی یا عددی کار می‌کند.
  • می‌تواند مشکلات را با خروجی‌های متعدد مدل کند.
  •  توضیح نتایج را آسان می‌کند.
  •  قابلیت اطمینان یک درخت را می‌توانید آزمایش کنید.

معایب استفاده از درخت تصمیم در یادگیری ماشین

  • هنگامی که با داده‌های طبقه‌بندی شده با سطوح چندگانه سروکار داریم، به دست آوردن اطلاعات به نفع ویژگی‌هایی که بیشترین سطوح را دارند، سوگیری می‌کند.
  • عدم قطعیت و بسیاری از نتایج مرتبط، محاسبات را پیچیده می‌کنند.
  • پیوندهای بین گره‌ها را به AND محدود می‌کند، در حالی که گراف‌های تصمیم‌گیری گره‌هایی را که توسط OR به هم مرتبط شده‌اند را بررسی می‌کنند.

در انتها…

درخت‌ تصمیم را به‌عنوان یک تکنیک یادگیری نظارتی طراحی کردند و از آن برای حل مسائل دسته‌بندی استفاده می‌کنند. دلایل استفاده از درخت‌ تصمیم و روش ساخت آن را توضیح دادیم. مهم‌ترین مزیت این الگوریتم را بهره‌وری بالا و تفسیر ساده آن‌ها می‌دانند.

اخذ گواهینامه ایزو معتبر

شرکت دانش بنیان خانه مدیران، ایزوسیستم را به‌عنوان برند تجاری مجموعه خود ثبت کرده است. تیم کاری خانه مدیران از سال ۱۳۸۵ در حوزه ارائه خدمات مشاور مدیریت و صدور گوهینامه های بین المللی ایزو فعالیت می‌کند و از سال ۱۳۹۱ موفق شد تا به شرکت تعاونی دانش بنیان ارتقا پیدا کند.

برای اخذ انواع گواهینامه ایزو از طریق صفحه دریافت ایزو درخواست خود را به صورت سریع ثبت کنید. برای کسب اطلاعات بیشتر می‌توانید از طریق شماره‌های ۳۳۴۴۴۸۱۴-۰۲۳ و ۳۳۴۴۴۸۱۳-۰۲۳ با ما در تماس باشید یا از طریق تکمیل فرم اخذ ایزو کارشناسان ما با شما تماس خواهند گرفت.


این مقاله به صورت اختصاصی توسط تیم فنی ایزوسیستم آماده شده است، هرگونه بهره برداری بدون ذکر نام و آدرس منبع شرعا و قانونا ممنوع می باشد.

نیاز به مشاوره دارید؟ با ما تماس بگیرید...

تماس با ایزوسیستم ۳۳۴۴۴۸۱۳-۰۲۳ و ۳۳۴۴۴۸۱۴-۰۲۳

ایزوسیستم برترین مرکز صدور مدارک بین المللی ایزو و دارنده مجوز سازمان صنعت، معدن و تجارت می باشد.

هشدار: مراقب نیش مراکز بدون مجوز رسمی در حوزه ی خدمات مشاوره و صدور گواهینامه های ایزو باشید!