تعریف و مفهوم متن کاوی به فرایند پیدا کردن قوانین و الگوهای غیربدیهی، جدید (از قبل نامشخص)، مخفی، احتمالاً مفید و کاربردی از انبوه دادههای (پیکره) مستندات را متن کاوی (Text Mining) یا تحلیل متن (Text Analytics) میگویند. در تعریف دیگر، متن کاوی به فرایند تحلیل و اکتشاف انبوهی از متون غیرساختیافته بوسیله نرمافزار به منظور شناسایی مفاهیم، الگوها، موضوعات، کلیدواژهها و دیگر ویژگیهای دادههای […]
بایگانی دستهی: پردازش زبان طبیعی و وب معنایی
نمونه های کاربردی این حوزه عبارتند از: شناسایی گوینده و مشخصات آن، تصحیح املا، ترجمه ماشینی، تبدیل متن به گفتار، خلاصه سازی متن، سيستمهای پرسش و پاسخ، توليد پيكره هاي موازي و تطبيقي، برچسب زن معنايي، برچسب زن دستوري و غیره.
در حال حاضر اعضای گروه زبان شناسی محاسباتی آزمایشگاه فناوری وب در سه حوزه، پردازش زبان طبیعی، خلاصه سازی متن و ترجمه ماشینی فعالیت می کنند.
استخراج و انتخاب ویژگیهای مناسب (Relevant features) از یک مجموعه داده نقش حیاتی در بهبود کیفیت و کارایی روشهای یادگیری ماشین دارند. خصوصاً در دادههای با تعداد ابعاد بالا مانند متون، دادههای بیان ژنی (Gene expression data)، تصویر، صوت، ویدئو و غیره انتخاب ویژگی امری ضروری است. در این سری مقالات، به تبدیل متن به […]
۱- مقدمه پردازش زبان طبیعی یک رشته فرعی از علوم کامپیوتر است که پلی بین زبانهای طبیعی و کامپیوترها ایجاد میکند. به ماشینها کمک میکند که زبان انسان را درک، پردازش و تحلیل کنند [ ۱ ]. اهمیت NLP به عنوان یک ابزار کمک به درک دادههای تولید شده توسط انسان، نتیجه منطقی وابستگی بافتی […]