توضیحات

علوم داده مبحثی به نسبت جدید در علوم کامپیوتر است که از آن به عنوان جذاب ترین شغل در فن آوری اطلاعات در قرن بیست و یکم یاد می شود. متخصصان این حوزه را این گونه تعریف می کنند: کسانی که می دانند چگونه می توان از انبوه اطلاعات ساخت یافته یا بدون ساختار، پاسخ سوالهای کسب وکار را پیدا کرد. در واقع علوم داده رشته نو ظهوری است که به جمع آوری، آماده سازی، تحلیل، بصری سازی، مدیریت و نگهداشت اطلاعات در حجم بالا می پردازد. متخصص علم داده، دانشی کاربردی از تکنیک ها و ابزارهای این رشته به علاوه درک کاملی از تئوری های آن دارد که او را قادر می سازد تشخیص دهد که چه چیزی از نظر علمی ممکن است.

زبان برنامه‌نویسی R ابزاری قوی برای تحلیل آماری، تجسم داده‌ها Data Visualization، و مدل سازی پیش بینی کننده (Predictive Modeling) است. علاوه بر این، در محاسبات ماتریسی نیز همپای نرم‌افزارهایی همچون اکتاو و MATLAB قابل به‌کارگیری می‌باشد.

این زبان، نسبت به سایر نرم افزارهای آماری کد محور، سرعت به مراتب بالاتری در اجرای برنامه‌های سنگین دارد. از جمله کاربردهای زبان برنامه‌نویسی R، به کارگیری آن در اجرای پروژه داده کاوی و متن کاوی، بالاخص پروژه‌هایی با حجم عظیم داده می‌باشد. هدف دوره آموزش R در داده کاوی ، آشنا نمودن شرکت کنندگانی است که با مبانی داده کاوی آشنایی دارند وحال می‌خواهند تا با کاربرد R در داده کاوی و متن کاوی به اجرای پروژه های داده کاوی و متن کاوی بپردازند.

اهداف دوره:

  • آشنایی با مفاهیم داده کاوی
  • فرآیند اجرای پروژه‌های داده کاوی
  • پیاده سازی مسئله تحلیلی با استفاده از زبان R و طبق فرایند استاندارد Crisp DM
  • شناسایی، پیاده‌سازی و ارزیابی الگوریتم مناسب برای مسائل تحلیلی

سیلابس دوره:

  • مقدمات و برنامه‌نویسی به زبان R
  • آشنایی با داده کاوی
  • پیاده‌سازی فرایند داده‌کاوی در R
  • پیش پردازش داده‌ها
  • مدل سازی پیش‌بینانه و ارزیابی آنها
  • مدل‌های بدون راهنما
  • مدل‌های تجمیعی