بایگانی دستهی: داده کاوی
داده کاوی (به انگلیسی: Data Mining)، به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود. دادهکاوی، پایگاهها و مجموعه حجیم دادهها را در پی کشف و استخراج، مورد تحلیل قرار میدهد. اینگونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههای امروزین است که شیوههای ماشینی مربوط به یادگیری، مدلسازی، و آموزش را طلب مینماید.
«تحلیل خوشهبندی» (Cluster Analysis) یا بطور خلاصه خوشهبندی، فرآیندی است که به کمک آن میتوان مجموعهای از اشیاء را به گروههای مجزا افراز کرد. هر افراز یک خوشه نامیده میشود. اعضاء هر خوشه با توجه به ویژگیهایی که دارند به یکدیگر بسیار شبیه هستند و در عوض میزان شباهت بین خوشهها کمترین مقدار است. در […]
Pandas یا Python Data Analysis از ابزارهای معروف برای تحلیل و کار با داده هاست که با استفاده از ساختارهای داده و امکاناتی که در پانداس تعبیه شده (مثل دیتافریم ها)، عملیات تحلیل و پاکسازی و آمادهسازی داده را در پایتون میتوان خیلی سریع و آسان انجام داد. برای نصب pandas، دستور زیر را اجرا […]
1 – مرکزعلوم ومدیریت داده دانشگاه تهران مشاهده جزئیات و اطلاعات بیشتر از طریق این لینک امکان پذیر است. مسئول: دکترعلی کمندی 2-آزمایشگاه داده کاوی دانشگاه امیرکبیر مشاهده جزئیات و اطلاعات بیشتر از طریق این لینک امکان پذیر است. 3 – آزمایشگاه داده کاوی علم وصنعت مشاهده جزئیات و اطلاعات بیشتر از […]
همانطور که میدانید ماتریسها مهمترین دادهساختار مورد استفاده برای بیان الگوریتمهای مربوط به یادگیری ماشین هستند، کتابخانه numpy به این منظور نوشته شده تا کار با این دادهساختار را آسان کند، به همین دلیل در میان کتابخانههای SciPy کتابخانهی numpy (نام پای) کتابخانهای مهم محسوب می شود. برای نصب numpy، دستور زیر را اجرا میکنیم: […]
1- NumPy (numpy.org) NumPy یا Numerical Python از پکیج های پایه برای محاسبات عددی در پایتون است. از این پکیج با هدف پردازش آرایه ها با ابعاد بالا با پرفومنس بسیار خوب استفاده می شود. 2- Pandas (pandas.pydata.org) Pandas یا Python Data Analysis از ابزارهای معروف برای تحلیل و کار با داده هاست که با […]
عنوان: ارائه رویکردی مبتنی بر سنجه برای ارزیابی کیفیت مجموعه داده های پیوندی پیش از انتشار استاد راهنما: دکتر محسن کاهانی چکیده پایان نامه خانم دکتر بهکمال: هدف اصلي دادههاي پيوندي، تحقق وب معنايي و استخراج دانش از طريق پيوند دادن دادههاي موجود روي وب ميباشد. يكي از موانع دستيابي به اين هدف، وجود مشكلات […]