استخراج و انتخاب ویژگیهای مناسب (Relevant features) از یک مجموعه داده نقش حیاتی در بهبود کیفیت و کارایی روشهای یادگیری ماشین دارند. خصوصاً در دادههای با تعداد ابعاد بالا مانند متون، دادههای بیان ژنی (Gene expression data)، تصویر، صوت، ویدئو و غیره انتخاب ویژگی امری ضروری است. در این سری مقالات، به تبدیل متن به […]
آرشیو دسته بندی: پردازش زبان طبیعی و وب معنایی
نمونه های کاربردی این حوزه عبارتند از: شناسایی گوینده و مشخصات آن، تصحیح املا، ترجمه ماشینی، تبدیل متن به گفتار، خلاصه سازی متن، سيستمهای پرسش و پاسخ، توليد پيكره هاي موازي و تطبيقي، برچسب زن معنايي، برچسب زن دستوري و غیره.
در حال حاضر اعضای گروه زبان شناسی محاسباتی آزمایشگاه فناوری وب در سه حوزه، پردازش زبان طبیعی، خلاصه سازی متن و ترجمه ماشینی فعالیت می کنند.
۱- مقدمه پردازش زبان طبیعی یک رشته فرعی از علوم کامپیوتر است که پلی بین زبانهای طبیعی و کامپیوترها ایجاد میکند. به ماشینها کمک میکند که زبان انسان را درک، پردازش و تحلیل کنند [ ۱ ]. اهمیت NLP به عنوان یک ابزار کمک به درک دادههای تولید شده توسط انسان، نتیجه منطقی وابستگی بافتی […]