بایگانی دسته‌ی: پردازش زبان طبیعی و وب معنایی

نمونه های کاربردی این حوزه عبارتند از: شناسایی گوینده و مشخصات آن، تصحیح املا، ترجمه ماشینی، تبدیل متن به گفتار، خلاصه سازی متن، سيستمهای پرسش و پاسخ، توليد پيكره هاي موازي و تطبيقي، برچسب زن معنايي، برچسب زن دستوري و غیره.
در حال حاضر اعضای گروه زبان شناسی محاسباتی آزمایشگاه فناوری وب در سه حوزه، پردازش زبان طبیعی، خلاصه سازی متن و ترجمه ماشینی فعالیت می کنند.

ارائه رهيافتي جديد براي توليد پيكره موازي انگليسي-فارسي

چكيده: در اين پژوهش، براي اولين بار مدلي تركيبي براي تراز بندی جملات، جهت ساخت پيکره‌هاي موازي انگليسي-فارسي ارائه شده است. در حالت کلي چارچوب روش پيشنهادي، غير وابسته به زبان‌های مبدأ و مقصد بوده و از آن می‌توان براي توليد پيکره‌هاي موازي، براي هر جفت زبان ديگر، نيز استفاده کرد. نتايج بدست آمده از […]

Ijaz: An Operational system for single-document summarization of Persian news texts

چکیده : رشد سریع اسناد منتشر شده در وب ، درخواست های جدیدی برای پردازش ، طبقه بندی و بازیابی اطلاعات ایجاد کرده است. بنابراین ، استفاده از ابزارهای پردازش زبان طبیعی در سراسر جهان افزایش یافته است. خلاصه سازی خودکار به عنوان هسته طیف گسترده ای از ابزارهای پردازش متن مانند سیستم های تصمیم […]

فردوس نت

معرفی پروژه فردوس‌نت شامل يک مجموعه لغت فارسی است که هر لغت در يک گروه هم‌خانواده که به يک مفهوم اشاره دارند، قرار می‌گيرد. همچنين روابط سلسله‌مراتبی و معنايی مختلف بين اين گروه‌های مفاهيم تشکيل می‌شود. برای اولين بار شکه واژگان برای زبان انگليسی طراحی و متنتشر شده است. ایده اصلی این پروژه بر این […]

برنامه نویسی ابزارهای پردازش زبان طبیعی

تلاش عمده در پردازش زبان طبيعی، ماشينی کردن فرايند درک و برداشت مفاهيم يک زبان طبيعی است و هدف اصلي آن، ايجاد تئوری هاي محاسباتي از زبان، با استفاده از الگوريتم ها و ساختارهاي داده اي موجود در علوم رايانه اي است. امروزه حجم انبوهی از اطلاعات متنی بر روی وب موجود است که برای […]

Stanford NLP

آزمایشگاه پردازش زبان طبیعی استنفورد گروه پردازش زبان طبیعی در دانشگاه استنفورد تیمی از اعضای هیات علمی ، متخصصین برنامه نویسی ، برنامه نویسان و دانشجویانی است که روی الگوریتم هایی کار می کنند که به رایانه ها اجازه می دهد زبان های انسانی را پردازش ، تولید و درک کنند. کار ما از تحقیقات […]

سامانه خلاصه ساز ایجاز

معرفی پروژه پروژه سامانه خلاصه ساز تک سندی و چندسندی ایجاز، به سفارش سازمان فناوری اطلاعات ایران و توسط آزمایشگاه فناوری وب دانشگاه فردوسی مشهد انجام شد. در این پروژه بزرگ، مجموعه ای از ابزارهای مورد نیاز برای تولید سامانه های خلاصه ساز تولید گردید. همچنین نسخه تحت وب خلاصه ساز تک سند و چند […]

کنفرانس LREC

موضوعات داغ برای LREC 2020 منابع کمتر و منابع در خطر انقراض توجه ویژه ای به زبانهای کم منابع و در معرض خطر خواهد شد: انتظار می رود LREC2020 زمینه فعالیتهایی را برای حمایت از زبانهای بومی فراهم کند که بر اساس سال بین المللی زبانهای بومی سازمان ملل متحد/یونسکو در سال 2019 جشن گرفته […]

ژورنال Computer Speech & Language

Computer Speech & Language گزارش هایی از تحقیقات اصلی مربوط به شناخت ، درک ، تولید ، کدگذاری و استخراج گفتار و زبان را منتشر می کند. علوم گفتار و زبان سابقه ای طولانی دارند ، اما اخیراً اجرای گسترده و آزمایش مدل های پیچیده گفتار و پردازش زبان امکان پذیر شده است. چنین تحقیقی […]

Computational Linguistics (ژورنال)

زبان شناسی رایانه ای طولانی ترین نشریه است که منحصراً به ویژگی های محاسباتی و ریاضی زبان و طراحی و تحلیل سیستم های پردازش زبان طبیعی اختصاص یافته است. این فصلنامه بسیار مورد توجه زبان شناسان دانشگاهی و صنعتی ، زبان شناسان محاسباتی ، محققان هوش مصنوعی و یادگیری ماشینی ، دانشمندان شناختی ، متخصصان […]

معرفی کتاب‌های برتر در زمینه متن کاوی و پردازش زبان طبیعی

چنانچه قصد یادگیری عمقی و اصولی مباحث مرتبط با متن کاوی را دارید به شما توصیه می‌کنیم که این مطلب را دنبال کنید. سعی کردیم اینجا بهترین کتاب‌ها و مقالات آموزشی برای آشنایی و یادگیری مفاهیم متن کاوی و پردازش زبان طبیعی را معرفی کنیم. در این نوشته، کتاب‌های مفید در ۴ حوزه ذیل برای […]