آرشیو دسته بندی: تازه های داده کاوی

خوشه بندی و کاربردهای آن

«تحلیل خوشه‌بندی» (Cluster Analysis) یا بطور خلاصه خوشه‌بندی، فرآیندی است که به کمک آن می‌توان مجموعه‌ای از اشیاء را به گروه‌های مجزا افراز کرد. هر افراز یک خوشه نامیده می‌شود. اعضاء هر خوشه با توجه به ویژگی‌هایی که دارند به یکدیگر بسیار شبیه هستند و در عوض میزان شباهت بین خوشه‌ها کمترین مقدار است. در […]

هفت قدم جهت Data scientist شدن

هفت قدم جهت Data scientist شدن

۱-یادگیری یک زبان برنامه نویسی: اولین قدم برای شروع Data science انتخاب و آشنایی با یک زبان برنامه نویسی است. از بین زبان های R و پایتون زبان پایتون دارای محبوبیت بیشتری است. چون یادگیری آن ساده تر است و از کتابخانه هایی مثل numpy – pandas – seaborn matplotlib – scipy و … ساپورت […]

مختصری درباره Pandas

Pandas یا Python Data Analysis از ابزارهای معروف برای تحلیل و کار با داده هاست که با استفاده از ساختار‌های داده و امکاناتی که در پانداس تعبیه شده (مثل دیتافریم ها)، عملیات تحلیل و پاک‌سازی و آماده‌سازی داده را در پایتون می‌توان خیلی سریع و آسان انجام داد. برای نصب pandas، دستور زیر را اجرا […]

ابزارهای مهم تحلیل داده

در تحلیل داده چندین گام مهم وجود دارد از قبیل ذخیره سازی، انتقال و پردازش داده گرفته تا مصورسازی نتایج. در این تصویر مهمترین ابزارهای حوزه تحلیل داده را در هر گام مشاهده می کنید.

مختصری درباره NumPy

همان‌طور که می‌دانید ماتریس‌ها مهم‌ترین داده‌ساختار مورد استفاده برای بیان الگوریتم‌های مربوط به یادگیری ماشین هستند، کتاب‌خانه numpy به این منظور نوشته شده تا کار با این داده‌ساختار را آسان کند، به همین دلیل در میان کتاب‌خانه‌های SciPy کتاب‌خانه‌ی numpy (نام پای) کتاب‌خانه‌ای مهم محسوب می شود. برای نصب numpy، دستور زیر را اجرا می‌کنیم: […]

معرفی کنفرانس VLDB

شما عزیزان می توانید با مراجعه به آدرس زیر ارائه آقای مصطفی میرزایی را درباره معرفی کنفرانس VLDB مشاهده نمایید: https://www.aparat.com/v/jRZYd

کارگاه پردازش جریانی با Flink و Kafka

در این کارگاه که سال 1400 در مجموعه کارگاه های WTLAB 2021 برگزار شد، ابتدا آقای مهندس میرزایی کار با ابزار Apache Flink که یکی از محبوب ترین ابزارهای پردازش جریانی است را آموزش دادند و سپس آقای مهندس رضوانی در بخش دوم، به مخاطبان کارگاه پایگاه داده Mongo و همچنین ابزار Apache Kafka را […]

کارگاه پردازش جریانی

این کارگاه در سال 1399 به میزبانی آزمایشگاه فناوری وب و همزمان با دهمین کنفرانس ICCKE2020 به مدت 4 ساعت برگزار شد. در بخش اول آقای مهندس میرزایی مفاهیم، تکنیک ها، الگوریتم ها و چالش های این حوزه را معرفی کردند و در بخش دوم خانم مهندس علیزاده کار با ابزار Esper Engine را آموزش […]