چکیده : رشد سریع اسناد منتشر شده در وب ، درخواست های جدیدی برای پردازش ، طبقه بندی و بازیابی اطلاعات ایجاد کرده است. بنابراین ، استفاده از ابزارهای پردازش زبان طبیعی در سراسر جهان افزایش یافته است. خلاصه سازی خودکار به عنوان هسته طیف گسترده ای از ابزارهای پردازش متن مانند سیستم های تصمیم […]
آرشیو دسته بندی: پردازش زبان طبیعی و وب معنایی
نمونه های کاربردی این حوزه عبارتند از: شناسایی گوینده و مشخصات آن، تصحیح املا، ترجمه ماشینی، تبدیل متن به گفتار، خلاصه سازی متن، سيستمهای پرسش و پاسخ، توليد پيكره هاي موازي و تطبيقي، برچسب زن معنايي، برچسب زن دستوري و غیره.
در حال حاضر اعضای گروه زبان شناسی محاسباتی آزمایشگاه فناوری وب در سه حوزه، پردازش زبان طبیعی، خلاصه سازی متن و ترجمه ماشینی فعالیت می کنند.
معرفی پروژه فردوسنت شامل يک مجموعه لغت فارسی است که هر لغت در يک گروه همخانواده که به يک مفهوم اشاره دارند، قرار میگيرد. همچنين روابط سلسلهمراتبی و معنايی مختلف بين اين گروههای مفاهيم تشکيل میشود. برای اولين بار شکه واژگان برای زبان انگليسی طراحی و متنتشر شده است. ایده اصلی این پروژه بر این […]
تلاش عمده در پردازش زبان طبيعی، ماشينی کردن فرايند درک و برداشت مفاهيم يک زبان طبيعی است و هدف اصلي آن، ايجاد تئوری هاي محاسباتي از زبان، با استفاده از الگوريتم ها و ساختارهاي داده اي موجود در علوم رايانه اي است. امروزه حجم انبوهی از اطلاعات متنی بر روی وب موجود است که برای […]
آزمایشگاه پردازش زبان طبیعی استنفورد گروه پردازش زبان طبیعی در دانشگاه استنفورد تیمی از اعضای هیات علمی ، متخصصین برنامه نویسی ، برنامه نویسان و دانشجویانی است که روی الگوریتم هایی کار می کنند که به رایانه ها اجازه می دهد زبان های انسانی را پردازش ، تولید و درک کنند. کار ما از تحقیقات […]
معرفی پروژه پروژه سامانه خلاصه ساز تک سندی و چندسندی ایجاز، به سفارش سازمان فناوری اطلاعات ایران و توسط آزمایشگاه فناوری وب دانشگاه فردوسی مشهد انجام شد. در این پروژه بزرگ، مجموعه ای از ابزارهای مورد نیاز برای تولید سامانه های خلاصه ساز تولید گردید. همچنین نسخه تحت وب خلاصه ساز تک سند و چند […]
موضوعات داغ برای LREC 2020 منابع کمتر و منابع در خطر انقراض توجه ویژه ای به زبانهای کم منابع و در معرض خطر خواهد شد: انتظار می رود LREC2020 زمینه فعالیتهایی را برای حمایت از زبانهای بومی فراهم کند که بر اساس سال بین المللی زبانهای بومی سازمان ملل متحد/یونسکو در سال 2019 جشن گرفته […]
Computer Speech & Language گزارش هایی از تحقیقات اصلی مربوط به شناخت ، درک ، تولید ، کدگذاری و استخراج گفتار و زبان را منتشر می کند. علوم گفتار و زبان سابقه ای طولانی دارند ، اما اخیراً اجرای گسترده و آزمایش مدل های پیچیده گفتار و پردازش زبان امکان پذیر شده است. چنین تحقیقی […]
زبان شناسی رایانه ای طولانی ترین نشریه است که منحصراً به ویژگی های محاسباتی و ریاضی زبان و طراحی و تحلیل سیستم های پردازش زبان طبیعی اختصاص یافته است. این فصلنامه بسیار مورد توجه زبان شناسان دانشگاهی و صنعتی ، زبان شناسان محاسباتی ، محققان هوش مصنوعی و یادگیری ماشینی ، دانشمندان شناختی ، متخصصان […]
چنانچه قصد یادگیری عمقی و اصولی مباحث مرتبط با متن کاوی را دارید به شما توصیه میکنیم که این مطلب را دنبال کنید. سعی کردیم اینجا بهترین کتابها و مقالات آموزشی برای آشنایی و یادگیری مفاهیم متن کاوی و پردازش زبان طبیعی را معرفی کنیم. در این نوشته، کتابهای مفید در ۴ حوزه ذیل برای […]
تعریف و مفهوم متن کاوی به فرایند پیدا کردن قوانین و الگوهای غیربدیهی، جدید (از قبل نامشخص)، مخفی، احتمالاً مفید و کاربردی از انبوه دادههای (پیکره) مستندات را متن کاوی (Text Mining) یا تحلیل متن (Text Analytics) میگویند. در تعریف دیگر، متن کاوی به فرایند تحلیل و اکتشاف انبوهی از متون غیرساختیافته بوسیله نرمافزار به منظور شناسایی مفاهیم، الگوها، موضوعات، کلیدواژهها و دیگر ویژگیهای دادههای […]