با رشد روز افزون تکنولوژی به خصوص در صنعت رایانه و فضاهای ذخیره سازی نسبت به گذشته و ارزان تر شدن حافظه ها و بالاتر رفتن قدرت ذخیره سازی آنها در فضای کوچکتر و حتی فضاهای نامحدود مانند فضاهای ابری ، همچنین افزایش سرعت کامپیوتر ها و پردازشگر ها در دنیا، شاهد رشد انفجاری در تولید داده ها در حوزه های گوناگون بوده ایم.
علاوه بر این دسترسی آسان به تکنولوژی های فوق و استفاده افراد بیشتر در دنیا خصوصا در حوزه های کسب و کار پایگاه های داده بسیار بزرگی ایجاد شده است و هر روزه نیز به حجم عظیم این تراکنش ها و داده ها در بانک های اطلاعاتی در سراسر دنیا افزوده میشود.
همانطوریکه در ژنوم انسانها حجم عظیمی از کدهای ژنتیکی انسان ذخیره شده است فضای وب نیز با گسترش داده ها تبدیل به یک منبع عظیم داده گردیده است که شامل میلیاردها صفحه متنی و رسانه ای مختلف از داده های درج شده در آنها می باشد که هر روز توسط میلیون ها انسان بازدید میشود.
با این اوصاف تحلیل درست از این حجم داده خود بعنوان یک چالش بزرگ پیش روی انسان ها قرار گرفته است. با توضیحات فوق بنظر میرسد داده کاوی باید توانایی حل این مشکل را به انسانها عرضه کند مشکلی که با تحلیل هزاران هزار از داده موجود در فضاهای ذخیره شده به کمک تکنولوژی های موجود و توسعه نرم افزارهای مختلف این چالش را حل کرده است.
گستره بسیار وسیعی از علوم مختلف خصوصا علوم کامپیوتر ، مدیریت بانک های اطلاعاتی ، آمار ، یادگیری ماشین و.. در این زمینه بکار گرفته میشود تا نتیجه مورد نظر بدست آید.

در کل داده کاوی به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود. دادهکاوی، پایگاهها و مجموعه حجیم دادهها را در پی کشف و استخراج، مورد تحلیل قرار میدهد. اینگونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههای امروزین است که شیوههای ماشینی مربوط به یادگیری، مدلسازی، و آموزش را طلب مینماید. (ویکی پدیا)
بطور خلاصه میتوان گفت که داده کاوی یک علم میان رشته ای است که علاوه بر پر هزینه بودن برای آشکار سازی روابط موجود در بین داده ها بکار گرفته میشود. داده کاوی فضایی جدید در حوزه های کسب و کار و مناسب برای افراد جوانی است که می خواهند در آینده حرفی برای گفتن داشته باشند. بطور مثال تحلیل بازار ، کشف قیمت سهام، بازار های بورس ، خریدها ، مبادلات بانکی ، حوزه های امنیت با توجه به گسترش شبکه های مجازی و تصاویر موجود و.. را میتوان از مصادیق بارز آن به حساب آورد.
محسن معصوم علیزاده – شهریور 1400 همدان