سامانه خلاصه ساز ایجاز

خلاصه‌ساز متون خبری

معرفی پروژه

پروژه سامانه خلاصه ساز تک سندی و چندسندی ایجاز، به سفارش سازمان فناوری اطلاعات ایران و توسط آزمایشگاه فناوری وب دانشگاه فردوسی مشهد انجام شد. در این پروژه بزرگ، مجموعه ای از ابزارهای مورد نیاز برای تولید سامانه های خلاصه ساز تولید گردید. همچنین نسخه تحت وب خلاصه ساز تک سند و چند سندی نیز تولید گردید که در صفحه اصلی سایت قابل مشاهده می باشد. این سامانه قابلیت تولید خلاصه برای متون تک سندی و چند سندی فارسی و انگلیسی را دارد. برای تولید این سامانه از معیارهای گوناگونی استفاده شده است.
همچنین برای اولین بار در کشور، پیکره بزرگ خلاصه سازی فارسی برای ارزیابی سیستم های خلاصه ساز با استفاده از استانداردهای لازم و با صرف بیش از 2000 نفر-ساعت زمان تولید گردید. پیکره «پاسخ» (پیکره استاندارد سامانه های خلاصه ساز) در دو مدل تک سندی و چند سندی ارائه گردیده است. پیکره تک سندی شامل 100 موضوع مختلف از انواع گونه های خبری بوده که از خبرگزاری های پرببینده ایران انتخاب شده اند. هر کدام از این موضوعات دارای 5 خلاصه چکیده ای و استخراجی می باشند که توسط کارشناسان آموزش دیده تولید شده اند. پیکره چند سندی “پاسخ” نیز شامل 50 موضوع می‌باشد که هر موضوع حاوی 20 سند بوده و همچنین هر موضوع شامل 5 خلاصه انسانی و چکیده‌ای می باشد.
همچنین برای اولین بار در کشور ابزار ارزیابی سامانه‌های خلاصه‌ساز نیز تولید گردید. این ابزار قادر است تا با استفاده از معیارهای گوناگون و با بهره گیری از خلاصه های انسانی تولید شده در پیکره «پاسخ»، سامانه های خلاصه سازی را ارزیابی نماید. این ابزار در بخش “ابزارهای سایت” قابل دانلود می باشد. ابزارهای دیگری نیز جهت پیش پردازش زبان طبیعی تولید گردیده که قابل دانلود می باشد.


لینک های پروژه

سامانه خلاصه ساز ایجاز


اعضای پروژه


زمینه پژوهشی


تاریخ اجرا

1391