معرفی پروژه
پروژه سامانه خلاصه ساز تک سندی و چندسندی ایجاز، به سفارش سازمان فناوری اطلاعات ایران و توسط آزمایشگاه فناوری وب دانشگاه فردوسی مشهد انجام شد. در این پروژه بزرگ، مجموعه ای از ابزارهای مورد نیاز برای تولید سامانه های خلاصه ساز تولید گردید. همچنین نسخه تحت وب خلاصه ساز تک سند و چند سندی نیز تولید گردید که در صفحه اصلی سایت قابل مشاهده می باشد. این سامانه قابلیت تولید خلاصه برای متون تک سندی و چند سندی فارسی و انگلیسی را دارد. برای تولید این سامانه از معیارهای گوناگونی استفاده شده است.
همچنین برای اولین بار در کشور، پیکره بزرگ خلاصه سازی فارسی برای ارزیابی سیستم های خلاصه ساز با استفاده از استانداردهای لازم و با صرف بیش از 2000 نفر-ساعت زمان تولید گردید. پیکره «پاسخ» (پیکره استاندارد سامانه های خلاصه ساز) در دو مدل تک سندی و چند سندی ارائه گردیده است. پیکره تک سندی شامل 100 موضوع مختلف از انواع گونه های خبری بوده که از خبرگزاری های پرببینده ایران انتخاب شده اند. هر کدام از این موضوعات دارای 5 خلاصه چکیده ای و استخراجی می باشند که توسط کارشناسان آموزش دیده تولید شده اند. پیکره چند سندی “پاسخ” نیز شامل 50 موضوع میباشد که هر موضوع حاوی 20 سند بوده و همچنین هر موضوع شامل 5 خلاصه انسانی و چکیدهای می باشد.
همچنین برای اولین بار در کشور ابزار ارزیابی سامانههای خلاصهساز نیز تولید گردید. این ابزار قادر است تا با استفاده از معیارهای گوناگون و با بهره گیری از خلاصه های انسانی تولید شده در پیکره «پاسخ»، سامانه های خلاصه سازی را ارزیابی نماید. این ابزار در بخش “ابزارهای سایت” قابل دانلود می باشد. ابزارهای دیگری نیز جهت پیش پردازش زبان طبیعی تولید گردیده که قابل دانلود می باشد.
لینک های پروژه
اعضای پروژه
- احمد استیری
- فاطمه پورغلامعلی
- آصف پورمعصومی
- رضا سعیدی
- سید احمد طوسی
- احسان عسکریان
- هادی قائمی
زمینه پژوهشی
تاریخ اجرا
1391
پایان نامه ها
- خلاصه سازی خودكار چندسندی مبتنی بر استخراج مفاهیم, آصف پورمعصومی, 2011-09-21, پایان نامه دکتری
- روش جدید وزن دهی معنایی به کلمات در کاربردهای پردازش متن, حسین کامیار, 2011-09-21, پایان نامه کارشناسی ارشد
- خلاصه سازی چکیده ای مبتنی بر مشابهت جملات, فاطمه پورغلامعلی, 2010-02-20, پایان نامه دکتری
- معنا گرایی در ارزیابی خودکار خلاصه سازهای ماشینی انگلیسی و فارسی با بهره گیری از شبکه واژگان, احمد استیری, 2012-09-21, پایان نامه کارشناسی ارشد