آرشیو دسته بندی: داده کاوی

داده‌ کاوی (به انگلیسی: Data Mining)، به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ گفته می‌شود. داده‌کاوی، پایگاه‌ها و مجموعه حجیم داده‌ها را در پی کشف و استخراج، مورد تحلیل قرار می‌دهد. این‌گونه مطالعات و کاوش‌ها را به واقع می‌توان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌های امروزین است که شیوه‌های ماشینی مربوط به یادگیری، مدل‌سازی، و آموزش را طلب می‌نماید.

ارائه یک رویکرد فضایی برای انتزاع مدل فرآیند دریافت و تحویل بسته

این مقاله کنفرانسی که در پنجمين همايش ملی پيشرفت های معماری سازمانی پذیرش شده است توانسته عنوان مقاله برتر را به خود اختصاص دهد. جناب آقای یاسر صالح آبادی، سرکارخانم دکتر بهشید بهکمال و جناب آقای مصطفی میرزایی نویسندگان این مقاله هستند

خوشه بندی و کاربردهای آن

«تحلیل خوشه‌بندی» (Cluster Analysis) یا بطور خلاصه خوشه‌بندی، فرآیندی است که به کمک آن می‌توان مجموعه‌ای از اشیاء را به گروه‌های مجزا افراز کرد. هر افراز یک خوشه نامیده می‌شود. اعضاء هر خوشه با توجه به ویژگی‌هایی که دارند به یکدیگر بسیار شبیه هستند و در عوض میزان شباهت بین خوشه‌ها کمترین مقدار است. در […]

هفت قدم جهت Data scientist شدن

هفت قدم جهت Data scientist شدن

۱-یادگیری یک زبان برنامه نویسی: اولین قدم برای شروع Data science انتخاب و آشنایی با یک زبان برنامه نویسی است. از بین زبان های R و پایتون زبان پایتون دارای محبوبیت بیشتری است. چون یادگیری آن ساده تر است و از کتابخانه هایی مثل numpy – pandas – seaborn matplotlib – scipy و … ساپورت […]

مختصری درباره Pandas

Pandas یا Python Data Analysis از ابزارهای معروف برای تحلیل و کار با داده هاست که با استفاده از ساختار‌های داده و امکاناتی که در پانداس تعبیه شده (مثل دیتافریم ها)، عملیات تحلیل و پاک‌سازی و آماده‌سازی داده را در پایتون می‌توان خیلی سریع و آسان انجام داد. برای نصب pandas، دستور زیر را اجرا […]

ابزارهای مهم تحلیل داده

در تحلیل داده چندین گام مهم وجود دارد از قبیل ذخیره سازی، انتقال و پردازش داده گرفته تا مصورسازی نتایج. در این تصویر مهمترین ابزارهای حوزه تحلیل داده را در هر گام مشاهده می کنید.

معرفی مراکز و آزمایشگاه های مرتبط با داده کاوی در داخل و خارج از کشور

1 – مرکزعلوم ومدیریت داده دانشگاه تهران مشاهده جزئیات و اطلاعات بیشتر از طریق این لینک امکان پذیر است. مسئول: دکترعلی کمندی   2-آزمایشگاه داده کاوی دانشگاه امیرکبیر مشاهده جزئیات و اطلاعات بیشتر از طریق این لینک امکان پذیر است.     3 – آزمایشگاه داده کاوی علم وصنعت مشاهده جزئیات و اطلاعات بیشتر از […]

مختصری درباره NumPy

همان‌طور که می‌دانید ماتریس‌ها مهم‌ترین داده‌ساختار مورد استفاده برای بیان الگوریتم‌های مربوط به یادگیری ماشین هستند، کتاب‌خانه numpy به این منظور نوشته شده تا کار با این داده‌ساختار را آسان کند، به همین دلیل در میان کتاب‌خانه‌های SciPy کتاب‌خانه‌ی numpy (نام پای) کتاب‌خانه‌ای مهم محسوب می شود. برای نصب numpy، دستور زیر را اجرا می‌کنیم: […]

کتابخانه‌های مهم در حوزه داده‌کاوی

1- NumPy (numpy.org) NumPy یا Numerical Python از پکیج های پایه برای محاسبات عددی در پایتون است. از این پکیج با هدف پردازش آرایه ها با ابعاد بالا با پرفومنس بسیار خوب استفاده می شود. 2- Pandas (pandas.pydata.org) Pandas یا Python Data Analysis از ابزارهای معروف برای تحلیل و کار با داده هاست که با […]

پایان نامه دکتری

عنوان: ارائه رویکردی مبتنی بر سنجه برای ارزیابی کیفیت مجموعه داده های پیوندی پیش از انتشار استاد راهنما: دکتر محسن کاهانی چکیده پایان نامه خانم دکتر بهکمال: هدف اصلي دادههاي پيوندي، تحقق وب معنايي و استخراج دانش از طريق پيوند دادن دادههاي موجود روي وب ميباشد. يكي از موانع دستيابي به اين هدف، وجود مشكلات […]

چارچوب آزمون خودکار نرم افزار

پروژه چارچوب آزمون خودکار نرم افزارهای مبتنی بر وب با حمایت مرکز تحقیقات و مخابرات ایران اجرا شده است. از آنجاییکه محیط اجرای نرم افزارهای مبتنی بر وب متنوع و ناهمگون می باشد، روش های متداول آزمون نرم افزار برای تست و ارزیابی سیستم های مبتنی بر وب کارآمد نیست. از این رو هدف این […]